WISE: Rethinking the Knowledge Memory for Lifelong Model Editing¶
摘要¶
大模型需要知识更新以跟上不断增长的世界事实并纠正幻觉响应,这推动了终身模型编辑方法的发展。更新后的知识存储在记忆中是一个根本性问题。本文发现知识记忆中的知识以"参数化程度"连续分布,从高度参数化(存储在模型权重中)到完全非参数化(存储在外部 RAG 记忆)。文章提出 WISE 框架,通过显式建模知识在不同参数化程度之间的流动,实现更精准、更可扩展的终身知识更新。
核心贡献¶
- 知识参数化程度谱系:发现知识记忆中的知识是连续分布的
- WISE 框架:显式建模知识的参数化程度和流动
- 混合记忆架构:同时维护参数化记忆和非参数化记忆
- 精准知识定位:确定知识在参数化程度谱上的位置
- 高效终身编辑:支持连续的知识更新而不遗忘
技术方法¶
知识参数化谱¶
- 高参数化端:存储在模型权重中(传统微调)
- 低参数化端:存储在外部 RAG 中(非参数化)
- 中间状态:通过 LoRA/Adapter 等半参数化方法
WISE 机制¶
- 评估每条知识在谱上的位置
- 根据知识特性选择最优的参数化形式
- 动态调整知识在不同形式之间的分配
- 支持知识的增量更新和选择性遗忘
为什么重要¶
WISE 揭示了"知识记忆不是非黑即白的——而是有参数化程度的光谱"。这对 Agent 记忆系统设计的启发:应该根据知识的特性(稳定性、更新频率、使用频率)选择不同的存储形式,而不是一刀切地全部用 RAG 或全部用微调。
与移动端/端侧相关性¶
- 端侧知识更新:在移动设备上高效更新模型知识
- 个性化记忆:用户特定知识用轻量方式存储
- 隐私敏感知识:高隐私知识用非参数化形式本地存储
- 计算效率:根据任务动态选择记忆形式,减少推理开销
参考文献¶
- Peng Wang, Zexi Li, Ningyu Zhang, Ziwen Xu. "WISE: Rethinking the Knowledge Memory for Lifelong Model Editing of Large Language Models." arXiv:2405.14768, 2024.