Temporal Memory for Resource-Constrained Agents: Continual Learning via Stochastic Compress-Add-Smooth

论文信息¶

arXiv: 2604.00067
发表日期: 2026-03-31
作者: Michael Chertkov
方向: 持续学习（资源受限 Agent 的时序记忆）

摘要¶

背景：顺序操作的 Agent 必须在固定记忆预算下整合新经验而不遗忘旧经验。传统方法将记忆视为参数向量，通过梯度下降更新，但这需要大量存储和计算。

方法：本文提出将记忆建模为随机过程——Replay 区间 $[0,1]$ 上的 Bridge Diffusion，其终端边缘编码当前时刻，中间边缘编码过去。新经验通过三步"压缩-添加-平滑"（CAS）递归整合。框架在边际概率密度通过高斯混合模型建模的场景下进行测试，类内复杂度由分段线性协议节点数 $L$ 控制。

关键发现：遗忘来自有损时序压缩——在固定段预算下将细粒度协议重新近似为粗粒度协议。遗忘半衰期 $a_{1/2} \approx c\,L$ 与 $L$ 成线性关系，常数 $c$ 具有类似 Shannon 信道容量的信息论解释。整个递归每次迭代仅需 $O(LKd^2)$ FLOPs，无需反向传播、存储数据或神经网络，适合轻量级控制器硬件。

核心贡献¶

随机过程记忆框架：将 Agent 记忆从参数向量转变为 Bridge Diffusion 随机过程，提供时序连贯的"电影式"回放
CAS 递归机制：Compress-Add-Smooth 三步递归，无需反向传播，适合资源受限硬件
解析遗忘理论：遗忘半衰期与协议段数线性相关，提供可数学证明的持续学习框架
无神经网络设计：纯解析方法（Ising 模型类比），适合无法运行深度学习的嵌入式/控制器场景

为什么重要¶

这是少见的纯解析持续学习理论工作，提供了：

可证明的遗忘界：遗忘半衰期的线性标度性质是第一个具有严格数学证明的结果
资源受限场景：无需 GPU/TPU，适合 IoT 传感器、嵌入式控制器等端侧设备
桥接理论与实践：将随机过程理论（Bridge Diffusion）与 Agent 记忆问题连接

与端侧/移动端的相关性¶

本文与端侧记忆系统高度相关：

嵌入式 Agent：无需反向传播，适合微控制器和轻量级边缘设备
固定记忆预算：直接在数学上建模固定存储约束，而非依赖经验性的压缩比
能效优化：$O(LKd^2)$ 复杂度远低于梯度下降，适合电池供电设备

参考文献¶

arXiv: 2604.00067 | https://arxiv.org/abs/2604.00067