When to Forget: A Memory Governance Primitive

论文信息¶

arXiv: 2604.12007
作者: Baris Simsek
提交日期: 2026-04-13
方向: 记忆治理 / 遗忘机制 / 记忆质量评估

摘要（全文翻译）¶

Agent 记忆系统积累经验，但目前缺乏记忆质量治理的原则性操作指标——即当 Agent 的任务分布变化时，决定哪些记忆值得信任、压制或弃用的指标。现有的写入时重要性评分是静态的；动态管理系统使用 LLM 判断或结构性启发式，而非结果反馈。

本文提出 Memory Worth (MW)：一种每个记忆的双计数器（two-counter）信号，跟踪记忆与成功结果 versus 失败结果共同出现的频率，提供了一个轻量级、有理论基础的老化检测、检索压制和弃用决策基础。

本文证明了在固定检索机制和最小探索条件下，MW 几乎必然收敛到条件成功概率 p+(m) = Pr[y_t = +1 | m in M_t]——即给定记忆 m 被检索时任务成功的概率。重要的是，p+(m) 是关联量而非因果量：它衡量的是结果共现，而非因果贡献。本文认为这对记忆治理仍然是有用的操作信号，并在一个地面真值已知的受控合成环境中验证。

核心贡献¶

Memory Worth (MW) 指标：基于双计数器的记忆价值信号，追踪记忆与成功/失败结果的共现频率
理论收敛保证：证明 MW 在温和条件下收敛到条件成功概率 p+(m)
三个治理操作：基于 MW 的老化检测、检索压制、记忆弃用决策
关联 vs 因果的澄清：p+(m) 是关联量而非因果量，但这不妨碍其作为操作指标的用处

为什么重要¶

这是记忆治理领域的里程碑论文，首次为"何时遗忘"提供了可量化、有理论保证的操作指标。现有方法依赖 LLM 主观判断或结构性启发式，MW 则通过结果反馈自然地发现哪些记忆真正有助于任务成功：

非主观：不需要 LLM 评估记忆重要性，直接从结果学习
有理论基础：收敛到条件成功概率不是经验观察，而是有数学证明的
可操作性：MW 直接可用于决定压制还是检索某条记忆

与端侧/移动端的相关性¶

高度相关。移动端 Agent 资源受限，无法无限积累记忆，需要有效的遗忘机制。MW 的双计数器设计非常轻量（只需要两个整数），可以在设备端高效实现。通过追踪记忆与成功/失败结果的共现，设备可以在本地学习哪些记忆真正有用，无需云端 LLM 做评估。

关键引文¶

"p+(m) is an associational quantity, not a causal one: it measures outcome co-occurrence rather than causal contribution. We argue this is still a useful operational signal for memory governance"

方法细节¶

双计数器机制¶

每个记忆 m 维护两个计数器： - 成功计数器 C+(m)：记忆被检索且任务成功时 +1 - 失败计数器 C-(m)：记忆被检索且任务失败时 +1

MW = C+(m) / (C+(m) + C-(m))，即条件成功概率的蒙特卡洛估计。

收敛性¶

在固定检索分布（stationary retrieval regime）和最小探索条件（minimum exploration condition）下，MW 几乎必然收敛到 p+(m)。

三种治理操作¶

Staleness detection（老化检测）：MW 持续下降的記憶值得标记为老化
Retrieval suppression（检索压制）：MW 低于阈值的记忆在检索时被压制
Deprecation（弃用）：MW 极低的记忆被主动删除