CMT: A Memory Compression Method for Continual Knowledge Learning of Large Language Models¶
论文基本信息¶
- 作者: Dongfang Li, Zetian Sun, Xinshuo Hu
- arXiv: https://arxiv.org/abs/2412.07393
- 领域: cs.CL, cs.AI
摘要¶
大语言模型需要适应数据、任务和用户偏好的持续变化,但模型规模巨大且训练成本高昂,频繁重训练不现实。CMT 提出压缩记忆训练(Compression Memory Training),将新知识以压缩记忆的形式整合到模型中,而不改变模型主参数。压缩记忆存储新知识的紧凑表示,推理时通过记忆增强生成。在持续知识学习任务上,CMT 在保持主模型能力的同时,高效吸收新知识。
核心贡献¶
- Compression Memory Training: 新知识以压缩记忆存储,不改主模型参数
- Memory-augmented Generation: 推理时通过记忆增强生成,整合压缩知识
- 持续学习框架: 支持新知识的持续整合,不遗忘旧知识
- 参数高效: 不需要全量微调,训练成本显著降低
- 知识隔离: 新旧知识在记忆层面分离,便于管理
研究背景与问题¶
LLM 部署后需要适应新知识,但全量微调成本高且有遗忘风险。增量学习方案(adapter、prompt tuning)虽参数高效,但知识整合质量不如全量微调。CMT 提出用压缩记忆作为知识整合的中间载体,在参数效率和知识质量间取得平衡。
核心方法¶
- Knowledge Compression: 将新知识压缩为密集向量表示(压缩记忆)
- Memory Index: 压缩记忆存储在可学习的记忆索引中
- Memory-augmented Inference: 推理时检索相关压缩记忆,增强主模型生成
- Contrastive Memory Training: 用对比学习确保压缩记忆与原始知识语义对齐
- Selective Memory Activation: 只激活与当前查询相关的记忆子集
为什么重要¶
CMT 将"记忆压缩"和"持续学习"两个方向结合,提出了一种参数高效的持续学习方案。对需要在部署后不断吸收新知识的 Agent 系统有重要参考价值。
与移动端/端侧相关性¶
- 参数高效: 不改变主模型参数,适合移动端受限的微调资源
- 记忆模块化: 压缩记忆可独立更新,移动端可增量下载新记忆模块
- 本地个性化: 用户特定知识可存储为本地压缩记忆,保护隐私
- 知识版本管理: 不同压缩记忆对应不同知识版本,便于回滚和管理