STALE: Can LLM Agents Know When Their Memories Are No Longer Valid?

论文基本信息¶

标题: STALE: Can LLM Agents Know When Their Memories Are No Longer Valid?
作者: Hanxiang Chao, Yihan Bai, Rui Sheng, Tianle Li, Yushi Sun
发表: 2026-05-07
方向: Agent 记忆有效性 / 记忆更新 / 记忆治理

核心问题¶

LLM Agent 被期望维护长期记忆，但现有基准主要评测静态事实检索，忽略了记忆"过时"后的 Belief Revision 能力。当新观察到的信息使旧记忆失效（而非显式否定）时，Agent 需要通过上下文推理和常识来判断记忆是否过时——这一能力此前几乎未被系统研究。

核心贡献¶

1. 识别关键失败模式：Implicit Conflict¶

论文定义了 Implicit Conflict（隐式冲突）：后续观察在未明确否定旧记忆的情况下使其失效，需要 Agent 通过语境推理和常识来检测。这种失效模式在现实场景中极为常见，例如：

用户搬家后，原地址记忆仍然"正确"但已过时
医生读取的历史病历与最新检查结果矛盾
项目进展中，之前的决策在新信息出现后需要重新评估

2. STALE 基准¶

构建了 STALE 基准，包含： - 400 个专家验证的冲突场景 - 1200 个评估查询，分布在三个维度 - 覆盖 100+ 日常生活主题 - 上下文最长 150K tokens

3. 三维探测框架¶

维度	含义	评测内容
State Resolution	状态解析	检测先前信念是否已过时
Premise Resistance	前提抵抗	拒绝错误预设过时状态的问题
Implicit Policy Adaptation	隐式策略适应	在下游行为中主动应用更新后的状态

4. CUPMem 基线系统¶

提出 CUPMem（Contextual Update Propagation Memory）原型，通过以下机制实现状态感知的记忆写入： - Structured State Consolidation：结构化状态整合 - Propagation-Aware Search：传播感知搜索 - 强调显式状态判决（explicit state adjudication）是构建稳健 Agent 记忆的有前景方向

实验发现¶

对前沿 LLM 和专门记忆框架的系统评测揭示了普遍差距：

最佳模型在 STALE 总体准确率仅 55.2%
模型经常接受嵌入用户问题中的过时假设
模型难以识别一个方面的状态变化何时应该使相关记忆失效
即使能检索到更新证据，模型也难以据此行动

为什么重要¶

填补空白：首次系统研究 LLM Agent 的 Belief Revision 能力
现实意义：Implicit Conflict 比显式否定更常见，更贴近真实世界记忆失效模式
可行动方向：CUPMem 证明了显式状态判决的有效性，为未来记忆治理研究提供新思路

与移动端/端侧的相关性¶

记忆有效性判断直接影响端侧记忆系统的可靠性。STALE 揭示的 55.2% 准确率意味着当前系统有近一半场景无法正确处理记忆过时问题。对边缘部署尤为重要——端侧 Agent 需要在有限计算资源下完成复杂的上下文推理来判断记忆有效性。

参考¶

GitHub: (未公开)
arXiv: https://arxiv.org/abs/2605.06527