Memini: Continual Knowledge Updating in LLM Systems Through Multi-Timescale Memory Dynamics

论文速览¶

核心问题: LLMs 训练一次就部署到不断变化的世界中。外部记忆通常需要显式管理（人工更新、删除），而生物记忆则通过耦合的多时间尺度动力学自主运作——新关联立即可用，重复确认的逐渐巩固，其余的自然消退。

核心贡献: 提出 Memini 系统，将外部记忆建模为有向图，每个边携带两个耦合的内部变量（快变量+慢变量），遵循 Benna-Fusi 突触巩固模型。从这个耦合中，情景敏感性、渐进巩固和选择性遗忘作为单一机制的不同侧面涌现出来。

核心思想¶

1. 多时间尺度耦合记忆¶

Memini 的核心是一个联想记忆系统，将知识组织为有向图： - 节点: 实体/概念 - 边: 关系/关联 - 每条边携带两个变量: - 快变量: 快速响应新信息，模拟短时突触可塑性 - 慢变量: 缓慢整合重复确认，模拟长时突触巩固

这两个变量遵循 Benna-Fusi 生物突触模型，形成耦合动力学。

2. 三种涌现行为¶

从单一机制的不同侧面涌现：

行为	快变量主导	慢变量主导
情景敏感性	新信息立即可用	-
渐进巩固	重复确认 → 慢变量增强	强关联难以遗忘
选择性遗忘	无关信息自然消退	-

3. 与传统外部记忆的对比¶

方面	传统显式管理	Memini 自主动力学
新知识获取	需显式 INSERT	自动（快变量即时响应）
知识巩固	需显式 BATCH UPDATE	自动（慢变量渐进整合）
遗忘	需显式 DELETE	自动（弱关联消退）
机制数量	3个独立操作	1个统一机制

技术细节¶

Benna-Fusi 模型¶

Benna-Fusi 模型描述突触可塑性的两个时间尺度： - 快速阶段: 对新刺激的即时响应，修改 synaptic strength - 慢速阶段: 对重复确认的渐进整合，形成持久记忆痕迹

Memini 将此形式化为边的快/慢变量更新方程。

有向图记忆组织¶

Memini Graph:
  节点: "Python" --边--> "Data Science" (fast=0.9, slow=0.3)
                --边--> "Web Dev"      (fast=0.2, slow=0.1)

  每次交互更新边的快变量
  重复确认时增强慢变量
  快慢耦合决定边的有效权重

记忆动力学方程¶

边的有效权重 = f(快变量, 慢变量)

当一个新的关联出现时： 1. 快变量立即跳升 2. 如果该关联在短时间窗口内被重复确认，慢变量开始增强 3. 如果没有后续确认，快变量自然衰减（遗忘）

为什么重要¶

统一框架: 将三个看似独立的操作（获取、巩固、遗忘）统一为单一机制的侧面
生物启发: 借鉴神经科学的多时间尺度记忆机制，而非人工设计的规则
端侧友好: 完全自主运作，无需人工干预，适合资源受限的部署环境
持续适应: 记忆本身成为学习 substrate，通过自身动力学重组

与端侧/移动端的相关性¶

完全本地运行: 记忆动力学自主运作，无需云端协调
低开销: 图结构稀疏，变量更新计算轻量
隐私友好: 知识组织完全在本地，不暴露给外部
适合长期部署: 一次部署后持续自主适应，无需人工维护

核心贡献¶

形式化: 提出用多时间尺度耦合变量建模外部记忆的框架
理论分析: 证明从 Benna-Fusi 耦合动力学中自然涌现三种记忆现象
系统演示: Memini 原型系统在知识更新任务上优于显式管理基线
设计原则: 为 Agent 记忆系统提供"让记忆自己管理自己"的新范式

参考文献¶

Benna-Fusi synaptic consolidation model
Associative memory theory (Hopfield networks, etc.)
Continual learning in neural networks