STALE: Can LLM Agents Know When Their Memories Are No Longer Valid?
论文基本信息¶
- 标题: STALE: Can LLM Agents Know When Their Memories Are No Longer Valid?
- 作者: Hanxiang Chao, Yihan Bai, Rui Sheng, Tianle Li, Yushi Sun
- 发表: 2026-05-07
- 方向: Agent 记忆有效性 / 记忆更新 / 记忆治理
核心问题¶
LLM Agent 被期望维护长期记忆,但现有基准主要评测静态事实检索,忽略了记忆"过时"后的 Belief Revision 能力。当新观察到的信息使旧记忆失效(而非显式否定)时,Agent 需要通过上下文推理和常识来判断记忆是否过时——这一能力此前几乎未被系统研究。
核心贡献¶
1. 识别关键失败模式:Implicit Conflict¶
论文定义了 Implicit Conflict(隐式冲突):后续观察在未明确否定旧记忆的情况下使其失效,需要 Agent 通过语境推理和常识来检测。这种失效模式在现实场景中极为常见,例如:
- 用户搬家后,原地址记忆仍然"正确"但已过时
- 医生读取的历史病历与最新检查结果矛盾
- 项目进展中,之前的决策在新信息出现后需要重新评估
2. STALE 基准¶
构建了 STALE 基准,包含: - 400 个专家验证的冲突场景 - 1200 个评估查询,分布在三个维度 - 覆盖 100+ 日常生活主题 - 上下文最长 150K tokens
3. 三维探测框架¶
| 维度 | 含义 | 评测内容 |
|---|---|---|
| State Resolution | 状态解析 | 检测先前信念是否已过时 |
| Premise Resistance | 前提抵抗 | 拒绝错误预设过时状态的问题 |
| Implicit Policy Adaptation | 隐式策略适应 | 在下游行为中主动应用更新后的状态 |
4. CUPMem 基线系统¶
提出 CUPMem(Contextual Update Propagation Memory)原型,通过以下机制实现状态感知的记忆写入: - Structured State Consolidation:结构化状态整合 - Propagation-Aware Search:传播感知搜索 - 强调显式状态判决(explicit state adjudication)是构建稳健 Agent 记忆的有前景方向
实验发现¶
对前沿 LLM 和专门记忆框架的系统评测揭示了普遍差距:
- 最佳模型在 STALE 总体准确率仅 55.2%
- 模型经常接受嵌入用户问题中的过时假设
- 模型难以识别一个方面的状态变化何时应该使相关记忆失效
- 即使能检索到更新证据,模型也难以据此行动
为什么重要¶
- 填补空白:首次系统研究 LLM Agent 的 Belief Revision 能力
- 现实意义:Implicit Conflict 比显式否定更常见,更贴近真实世界记忆失效模式
- 可行动方向:CUPMem 证明了显式状态判决的有效性,为未来记忆治理研究提供新思路
与移动端/端侧的相关性¶
记忆有效性判断直接影响端侧记忆系统的可靠性。STALE 揭示的 55.2% 准确率意味着当前系统有近一半场景无法正确处理记忆过时问题。对边缘部署尤为重要——端侧 Agent 需要在有限计算资源下完成复杂的上下文推理来判断记忆有效性。
参考¶
- GitHub: (未公开)
- arXiv: https://arxiv.org/abs/2605.06527