Retrieval-Augmented Memory for Online Learning (RAM-OL)¶

摘要¶

检索增强模型将参数化预测器与非参数化记忆结合，但其在概念漂移 streaming 监督学习中的使用尚未被充分研究。本文研究非平稳环境中的在线分类问题，提出 Retrieval-Augmented Memory for Online Learning (RAM-OL)，即随机梯度下降的简单扩展，维护少量过去示例的缓冲区。在每个时间步，RAM-OL 检索当前输入在隐藏表征空间中最近的邻居，并用其增强模型预测。

核心贡献¶

RAM-OL 方法：将 RAG 思想引入在线持续学习
隐藏空间近邻检索：在特征空间而非输入空间检索相关记忆
概念漂移适应：通过记忆中的历史模式检测和适应分布变化
计算高效：仅维护小型缓冲区，无需存储全部历史
即插即用：可与任意在线学习算法结合

技术方法¶

核心机制¶

记忆缓冲区：维护少量有代表性的历史样本
近邻检索：在每个时间步找到与当前输入最相似的记忆
记忆增强预测：将检索到的近邻样本加入梯度计算
自适应缓冲区管理：根据样本重要性动态替换记忆

与传统 RAG 的区别¶

传统 RAG 从外部文档检索，RAM-OL 从模型自身的"经验记忆"检索——记忆本身就是模型过去学习过程的产物。

为什么重要¶

这篇论文将"记忆"从静态文档存储扩展到了动态学习过程的产物。对于构建能"从经验中持续学习"的 Agent 系统有重要启发：Agent 不仅要从外部知识库检索，还要能从自身过去的交互经验中快速学习。

与移动端/端侧相关性¶

边缘 AI 持续学习：在资源受限设备上持续适应新任务
个性化推荐：基于用户历史行为的在线学习
异常检测：从正常模式记忆中检测偏离
低功耗学习：无需云端即可持续学习新模式

参考文献¶

Wenzhang Du. "Retrieval-Augmented Memory for Online Learning." arXiv:2512.02333, 2025.