Learning to Forget: Hierarchical Episodic Memory for Lifelong Robot Deployment
论文信息¶
- arXiv: 2604.11306
- 作者: Leonard Bärmann, Joana Plewnia, Alex Waibel, Tamim Asfour
- 提交日期: 2026-04-13
- 方向: 情景记忆 / 选择性遗忘 / 机器人
摘要(全文翻译)¶
机器人必须能够回答用户的问题(如"我的钥匙放哪了?"或"任务为什么失败了?"),这要求它们具备长期情景记忆(episodic memory, EM)。然而,从连续多模态感知中维护终身 EM 很快会超出存储限制,使实时查询变得不切实际,因此需要适应用户相关性概念的选择性遗忘。
本文提出 H²-EMV,一个让人形机器人通过用户交互学习"该记住什么"的框架。方法逐步构建层次化 EM,使用基于语言模型的相关性估计进行选择性遗忘,并以用户反馈更新遗忘规则。在模拟家庭任务和 ARMAR-7 机器人 20.5 小时真实世界记录的评估表明,H²-EMV 在维持问答准确率的同时,减少 45% 记忆大小和 35% 查询计算量。关键的是,性能随时间提升——第二轮对话中准确率提升 70%。
核心贡献¶
- 层次化情景记忆(H²-EMV):将多模态感知逐步构建为层次化情景记忆表示
- 用户相关的选择性遗忘:遗忘规则由用户反馈调整,使记忆优先保留用户关心的内容
- 遗忘-学习闭环:用户反馈触发遗忘规则的迭代更新,形成学习闭环
- 真实世界验证:在 20.5 小时真实记录上验证,而非仅模拟数据
为什么重要¶
这是真正解决"机器人如何决定遗忘什么"的论文——不是固定规则,而是通过用户交互学习遗忘标准。45% 记忆压缩 + 35% 计算减少 + 随时间提升的准确率,这是一个在保持实用性上有显著改进的系统。
与端侧/移动端的相关性¶
H²-EMV 的层次化 EM 结构对移动端记忆系统有参考价值。设备上的机器人或助手需要从连续感知中构建情景记忆,同时管理存储和计算约束。用户反馈驱动的遗忘规则可以在设备端实现,无需云端 LLM。