Belief memory partial observability 2605.05583

title: Belief Memory: Agent Memory Under Partial Observability arXiv: 2605.05583 date: 2026-05-07 tags: [agent-memory, memory-representation] reviewer: auto source: arXiv API

摘要¶

基于长期上下文操作的 LLM Agent 依赖外部记忆积累知识。然而，现有方法将每个观察存储为单一确定性结论（例如从临时错误推断"API X 失败了"），而这些观察本身是部分且潜在模糊的。通过对一个结论做出承诺并丢弃不确定性，这些方法引入了自我强化的错误：Agent 基于存储的结论行动，从不重新审视备选方案，并随时间强化该结论。为解决这一问题，我们提出 BeliefMem，将记忆范式从"每个观察对应一个确定性结论"转变为"保留多个带概率的候选结论"。具体地，BeliefMem 将候选结论存储为独立记忆条目，每个条目携带通过 Noisy-OR 规则随着新观察到来而更新的概率。在检索时，所有候选连同其概率一起浮出水面，使备选方案对 Agent 保持可见。由于记忆中每个结论保留其概率，BeliefMem 保留了确定性范式丢弃的不确定性，使 Agent 能够对有充分证据的知识高度自信地行动，同时在有新证据时保持更新置信度的能力。在 LoCoMo 和 ALFWorld 基准上的实验表明，即使数据有限，BeliefMem 也实现了最佳平均性能，大幅超越知名基线。总体而言，这种概率记忆产生了实质性收益，并为部分可观察环境中的 Agent 记忆探索了一个新方向。

核心贡献¶

问题识别：揭示现有 Agent 记忆系统的"确定性承诺"问题——每个观察只存储一个结论，丢弃不确定性，导致自我强化错误
BeliefMem 范式：多候选结论 + Noisy-OR 概率更新，替代单一确定性结论
Noisy-OR 规则：新观察到来时更新候选结论概率，保持概率可解释性
不确定性保留：使 Agent 能对高置信度知识自信行动，同时保留更新能力

为什么重要¶

部分可观察性是现实世界 Agent 面临的根本挑战。传统记忆系统在初始观察后立即"commit"到一个确定性结论，后续观察无法有效修正早期错误。BeliefMem 打破了这一范式： - 不确定性不是噪声，而是有价值的信息 - 多候选保持可见性，避免过早承诺 - Noisy-OR 提供可解释的概率更新机制

与端侧/移动端的相关性¶

概率框架增加存储开销，但提升决策质量
适合需要长期运行、积累多源观察的端侧 Agent（如个人助理）
与移动端的传感器噪声、部分遮挡场景天然契合

参考文献¶

LoCoMo、ALFWorld 基准
Noisy-OR 概率模型