Temporal Memory for Resource-Constrained Agents: Continual Learning via Stochastic Compress-Add-Smooth
论文信息¶
- arXiv: 2604.00067
- 发表日期: 2026-03-31
- 作者: Michael Chertkov
- 方向: 持续学习(资源受限 Agent 的时序记忆)
摘要¶
背景:顺序操作的 Agent 必须在固定记忆预算下整合新经验而不遗忘旧经验。传统方法将记忆视为参数向量,通过梯度下降更新,但这需要大量存储和计算。
方法:本文提出将记忆建模为随机过程——Replay 区间 $[0,1]$ 上的 Bridge Diffusion,其终端边缘编码当前时刻,中间边缘编码过去。新经验通过三步"压缩-添加-平滑"(CAS)递归整合。框架在边际概率密度通过高斯混合模型建模的场景下进行测试,类内复杂度由分段线性协议节点数 $L$ 控制。
关键发现:遗忘来自有损时序压缩——在固定段预算下将细粒度协议重新近似为粗粒度协议。遗忘半衰期 $a_{1/2} \approx c\,L$ 与 $L$ 成线性关系,常数 $c$ 具有类似 Shannon 信道容量的信息论解释。整个递归每次迭代仅需 $O(LKd^2)$ FLOPs,无需反向传播、存储数据或神经网络,适合轻量级控制器硬件。
核心贡献¶
- 随机过程记忆框架:将 Agent 记忆从参数向量转变为 Bridge Diffusion 随机过程,提供时序连贯的"电影式"回放
- CAS 递归机制:Compress-Add-Smooth 三步递归,无需反向传播,适合资源受限硬件
- 解析遗忘理论:遗忘半衰期与协议段数线性相关,提供可数学证明的持续学习框架
- 无神经网络设计:纯解析方法(Ising 模型类比),适合无法运行深度学习的嵌入式/控制器场景
为什么重要¶
这是少见的纯解析持续学习理论工作,提供了:
- 可证明的遗忘界:遗忘半衰期的线性标度性质是第一个具有严格数学证明的结果
- 资源受限场景:无需 GPU/TPU,适合 IoT 传感器、嵌入式控制器等端侧设备
- 桥接理论与实践:将随机过程理论(Bridge Diffusion)与 Agent 记忆问题连接
与端侧/移动端的相关性¶
本文与端侧记忆系统高度相关:
- 嵌入式 Agent:无需反向传播,适合微控制器和轻量级边缘设备
- 固定记忆预算:直接在数学上建模固定存储约束,而非依赖经验性的压缩比
- 能效优化:$O(LKd^2)$ 复杂度远低于梯度下降,适合电池供电设备
参考文献¶
- arXiv: 2604.00067 | https://arxiv.org/abs/2604.00067