Representation Interventions: Lifelong Knowledge Memory Control in LLMs¶
摘要¶
大模型在部署后常产生不正确或过时内容。高效准确的知识更新且无需昂贵重训练是重大挑战。这一问题在终身设置中尤为严峻,因为复杂、非结构化的知识必须与既有知识共存。本文提出基于表征干预的终身知识记忆控制方法,通过调整模型内部表征实现知识的精确注入、更新和遗忘,为 LLMs 提供可解释、可控的知识记忆管理能力。
核心贡献¶
- 表征干预框架:通过调整模型内部表征实现知识操作
- 终身知识管理:支持知识的持续注入、更新和选择性遗忘
- 无需重训练:推理时干预,不修改模型权重
- 可解释性强:知识操作直接反映在表征空间中
- 与既有知识兼容:新知识不干扰模型已掌握的知识
技术方法¶
表征空间的知识编辑¶
- 知识定位:找到与目标知识相关的表征方向
- 表征对齐:将新知识对齐到模型已学习的表征空间
- 干预执行:在推理时沿表征方向调整激活
- 遗忘控制:通过反向干预实现选择性遗忘
终身学习场景¶
- 新知识持续注入而不遗忘旧知识
- 特定知识的定向遗忘(如隐私信息)
- 知识冲突解决:新旧知识的表征协调
为什么重要¶
这是"知识记忆"领域的重大突破——证明了可以通过表征空间的干预来控制模型的知识存储。相比 RAG(外部记忆)和微调(修改权重),表征干预提供了一种介于两者之间的"中庸之道":既不需要外部存储,也不需要修改权重,而是在推理时直接调整表征。
与移动端/端侧相关性¶
- 隐私记忆控制:可定向遗忘敏感信息
- 个性化知识注入:在设备端动态调整模型知识
- 低资源更新:无需 GPU 即可更新模型知识
- 即时生效:推理时干预,立即反映知识变化
参考文献¶
- Xuyuan Liu, Shengyu Chen, Xinshuai Dong, Yanchi Liu. "Representation Interventions Enable Lifelong Knowledge Memory Control in LLMs." arXiv:2511.20892, 2025.