KAN-CL: Per-Knot Importance Regularization for Continual Learning with Kolmogorov-Arnold Networks¶

论文信息¶

字段	内容
作者	Minjong Cheon
发表日期	2026-05-12
arXiv ID	2605.12306
类别	cs.LG
标签	agent-memory, continual-learning, catastrophic-forgetting, kolmogorov-arnold-networks

摘要（翻译）¶

灾难性遗忘仍是持续学习（CL）的核心障碍：跨任务共享的参数相互干扰，现有正则化方法（如 EWC 和 SI）采用均匀惩罚，无法感知参数服务的输入区域。本文提出 KAN-CL，利用 Kolmogorov-Arnold Networks（KAN）的紧支撑样条参数化，在每节点（per-knot）粒度执行重要性加权锚定。作为卷积骨干网络上 EWC 正则化的分类头，KAN-CL 在 Split-CIFAR-10/5T 和 Split-CIFAR-100/10T 上相比仅头部 KAN 基线分别实现 88% 和 93% 的遗忘减少，同时达到或超越所有基线的准确率。

核心贡献¶

KAN-CL 框架：首个将 KAN 的样条参数化应用于持续学习的工作，利用其局部支撑特性实现细粒度参数重要性估计
Per-Knot 重要性正则化：在每节点粒度而非每参数粒度估计重要性，避免均匀惩罚带来的过约束问题
与 EWC 的互补性：KAN-CL 可作为头部，与骨干网络的 EWC（bbEWC）结合，形成双层防遗忘机制
显著遗忘减少：在标准基准上实现 88-93% 的遗忘减少，优于统一正则化方法

为什么重要¶

KAN-CL 的核心洞察是：传统持续学习方法将参数重要性视为均匀分布，但 KAN 的局部支撑特性天然地允许识别"哪些节点对哪个输入区域重要"。这一发现对 Agent 记忆系统的启示是：记忆的重要性不是全局统一的，而是与特定上下文相关的局部属性。

与移动端/端侧的相关性¶

KAN 的样条参数化可在边缘设备上高效执行，适合资源受限的持续学习场景
细粒度的重要性估计使得在端侧进行选择性记忆巩固（selective memory consolidation）成为可能
减少遗忘意味着 Agent 无需频繁重新学习已掌握的能力，降低端侧计算和通信开销

参考文献¶

Cheon, M. (2026). KAN-CL: Per-Knot Importance Regularization for Continual Learning with Kolmogorov-Arnold Networks. arXiv:2605.12306.