The Trap of Trajectory: Towards Understanding and Mitigating Spurious Correlations in Agentic Memory¶
摘要¶
Agent 记忆使 LLM 能跨上下文持久化信息并复用决策,但同时引入新脆弱性:虚假相关(spurious correlations)——记忆携带错误关联证据,将错误推理传播到下游决策。现有研究对此风险探索不足。本文从两方面入手:(1)建立基准,通过因果结构识别轨迹层面记忆中的典型虚假模式,发现记忆在干净输入上提升推理但在虚假模式存在时放大依赖;(2)提出 CAMEL,一种即插即用的校准方法,在写入和检索阶段对多种记忆架构运作,在消除虚假模式依赖的同时保持或提升干净输入性能,并可抵御针对性攻击。
核心贡献¶
- 首个 Agent 记忆虚假相关基准:系统识别三类因果结构的典型虚假模式,诊断显示现有记忆系统在干净/虚假输入上存在根本性矛盾(提升前者但放大后者)。
- CAMEL 校准方法:在写入时和检索时对记忆系统进行校准,无需重新训练、即插即用、架构无关。
- 对抗鲁棒性:针对校准的针对性攻击下 CAMEL 仍保持鲁棒。
- 干净输入性能维持:消除虚假依赖的同时不损害正常推理能力。
为什么重要¶
这是首个系统揭示 Agent 记忆可靠性问题的论文。虚假相关广泛存在但此前未被充分重视——记忆被误用为"正确性证明"而非"证据来源",CAMEL 提供了无需重训的实用解法,对部署可靠性要求高的生产系统有直接价值。
与移动端/端侧相关性¶
移动端 Agent 对可靠性要求极高(隐私数据、离线场景),虚假相关风险在本地化记忆场景下尤为关键,CAMEL 的轻量即插即用特性适合端侧部署。
参考文献¶
- CAMEL 方法详见原论文