跳转至

Memini: Continual Knowledge Updating in LLM Systems Through Multi-Timescale Memory Dynamics

论文速览

核心问题: LLMs 训练一次就部署到不断变化的世界中。外部记忆通常需要显式管理(人工更新、删除),而生物记忆则通过耦合的多时间尺度动力学自主运作——新关联立即可用,重复确认的逐渐巩固,其余的自然消退。

核心贡献: 提出 Memini 系统,将外部记忆建模为有向图,每个边携带两个耦合的内部变量(快变量+慢变量),遵循 Benna-Fusi 突触巩固模型。从这个耦合中,情景敏感性、渐进巩固和选择性遗忘作为单一机制的不同侧面涌现出来。

核心思想

1. 多时间尺度耦合记忆

Memini 的核心是一个联想记忆系统,将知识组织为有向图: - 节点: 实体/概念 - : 关系/关联 - 每条边携带两个变量: - 快变量: 快速响应新信息,模拟短时突触可塑性 - 慢变量: 缓慢整合重复确认,模拟长时突触巩固

这两个变量遵循 Benna-Fusi 生物突触模型,形成耦合动力学。

2. 三种涌现行为

从单一机制的不同侧面涌现:

行为 快变量主导 慢变量主导
情景敏感性 新信息立即可用 -
渐进巩固 重复确认 → 慢变量增强 强关联难以遗忘
选择性遗忘 无关信息自然消退 -

3. 与传统外部记忆的对比

方面 传统显式管理 Memini 自主动力学
新知识获取 需显式 INSERT 自动(快变量即时响应)
知识巩固 需显式 BATCH UPDATE 自动(慢变量渐进整合)
遗忘 需显式 DELETE 自动(弱关联消退)
机制数量 3个独立操作 1个统一机制

技术细节

Benna-Fusi 模型

Benna-Fusi 模型描述突触可塑性的两个时间尺度: - 快速阶段: 对新刺激的即时响应,修改 synaptic strength - 慢速阶段: 对重复确认的渐进整合,形成持久记忆痕迹

Memini 将此形式化为边的快/慢变量更新方程。

有向图记忆组织

Memini Graph:
  节点: "Python" --边--> "Data Science" (fast=0.9, slow=0.3)
                --边--> "Web Dev"      (fast=0.2, slow=0.1)

  每次交互更新边的快变量
  重复确认时增强慢变量
  快慢耦合决定边的有效权重

记忆动力学方程

边的有效权重 = f(快变量, 慢变量)

当一个新的关联出现时: 1. 快变量立即跳升 2. 如果该关联在短时间窗口内被重复确认,慢变量开始增强 3. 如果没有后续确认,快变量自然衰减(遗忘)

为什么重要

  1. 统一框架: 将三个看似独立的操作(获取、巩固、遗忘)统一为单一机制的侧面
  2. 生物启发: 借鉴神经科学的多时间尺度记忆机制,而非人工设计的规则
  3. 端侧友好: 完全自主运作,无需人工干预,适合资源受限的部署环境
  4. 持续适应: 记忆本身成为学习 substrate,通过自身动力学重组

与端侧/移动端的相关性

  • 完全本地运行: 记忆动力学自主运作,无需云端协调
  • 低开销: 图结构稀疏,变量更新计算轻量
  • 隐私友好: 知识组织完全在本地,不暴露给外部
  • 适合长期部署: 一次部署后持续自主适应,无需人工维护

核心贡献

  1. 形式化: 提出用多时间尺度耦合变量建模外部记忆的框架
  2. 理论分析: 证明从 Benna-Fusi 耦合动力学中自然涌现三种记忆现象
  3. 系统演示: Memini 原型系统在知识更新任务上优于显式管理基线
  4. 设计原则: 为 Agent 记忆系统提供"让记忆自己管理自己"的新范式

参考文献

  • Benna-Fusi synaptic consolidation model
  • Associative memory theory (Hopfield networks, etc.)
  • Continual learning in neural networks