跳转至

Belief memory partial observability 2605.05583


title: Belief Memory: Agent Memory Under Partial Observability arXiv: 2605.05583 date: 2026-05-07 tags: [agent-memory, memory-representation] reviewer: auto source: arXiv API


摘要

基于长期上下文操作的 LLM Agent 依赖外部记忆积累知识。然而,现有方法将每个观察存储为单一确定性结论(例如从临时错误推断"API X 失败了"),而这些观察本身是部分且潜在模糊的。通过对一个结论做出承诺并丢弃不确定性,这些方法引入了自我强化的错误:Agent 基于存储的结论行动,从不重新审视备选方案,并随时间强化该结论。为解决这一问题,我们提出 BeliefMem,将记忆范式从"每个观察对应一个确定性结论"转变为"保留多个带概率的候选结论"。具体地,BeliefMem 将候选结论存储为独立记忆条目,每个条目携带通过 Noisy-OR 规则随着新观察到来而更新的概率。在检索时,所有候选连同其概率一起浮出水面,使备选方案对 Agent 保持可见。由于记忆中每个结论保留其概率,BeliefMem 保留了确定性范式丢弃的不确定性,使 Agent 能够对有充分证据的知识高度自信地行动,同时在有新证据时保持更新置信度的能力。在 LoCoMo 和 ALFWorld 基准上的实验表明,即使数据有限,BeliefMem 也实现了最佳平均性能,大幅超越知名基线。总体而言,这种概率记忆产生了实质性收益,并为部分可观察环境中的 Agent 记忆探索了一个新方向。

核心贡献

  1. 问题识别:揭示现有 Agent 记忆系统的"确定性承诺"问题——每个观察只存储一个结论,丢弃不确定性,导致自我强化错误
  2. BeliefMem 范式:多候选结论 + Noisy-OR 概率更新,替代单一确定性结论
  3. Noisy-OR 规则:新观察到来时更新候选结论概率,保持概率可解释性
  4. 不确定性保留:使 Agent 能对高置信度知识自信行动,同时保留更新能力

为什么重要

部分可观察性是现实世界 Agent 面临的根本挑战。传统记忆系统在初始观察后立即"commit"到一个确定性结论,后续观察无法有效修正早期错误。BeliefMem 打破了这一范式: - 不确定性不是噪声,而是有价值的信息 - 多候选保持可见性,避免过早承诺 - Noisy-OR 提供可解释的概率更新机制

与端侧/移动端的相关性

  • 概率框架增加存储开销,但提升决策质量
  • 适合需要长期运行、积累多源观察的端侧 Agent(如个人助理)
  • 与移动端的传感器噪声、部分遮挡场景天然契合

参考文献

  • LoCoMo、ALFWorld 基准
  • Noisy-OR 概率模型