When Does Structure Matter in Continual Learning? Dimensionality Controls When Modularity Shapes Representational Geometry¶

论文基本信息¶

作者: Kathrin Korte, Joachim Winter Pedersen, Eleni Nisioti
arXiv: https://arxiv.org/abs/2604.27656
领域: cs.LG, cs.NE

摘要¶

持续学习系统必须在新知识获取（可塑性）和已有知识保留（稳定性）之间取得平衡。这一平衡影响跨任务的知识复用：共享结构在任务相似时支持迁移，但当新学习干扰已有表示时也会引发干扰。论文研究维度在这一动态中的作用，发现维度决定了模块化何时塑造表示几何——低维时模块化促进稳定知识保留，高维时模块化反而可能损害跨任务迁移。

核心贡献¶

Dimensionality × Modularity 交互: 首次系统研究维度在 CL 中模块化效果的作用
Dimension-dependent 机制: 低维和高维下模块化对表示几何的不同影响
Practical Guidelines: 为不同维度场景选择合适的 CL 策略提供实证指导
Representation Geometry Analysis: 通过表示几何分析解释模块化效果
LoCoMo Benchmark 验证: 在混合模态基准上验证发现

研究背景与问题¶

模块化（modular）架构被广泛认为有利于持续学习，但实证结果不一致。论文发现这源于维度的影响被忽视——模块化在低维和高维场景下有截然不同的效果。

核心方法¶

Synthetic Continual Learning Suite: 控制维度、任务相似度、模块化的受控 CL 环境
Representation Geometry Metrics: 量化表示空间中任务结构的保持程度
Dimensionality Scaling: 在 16D 到 4096D 范围内系统性变化维度
Module Responsibility Analysis: 分析每个模块对不同任务的响应模式

为什么重要¶

该研究揭示了 CL 中一个以前被忽视但至关重要的变量——维度。为 CL 方法的设计和选择提供了新的理论视角：没有普适最优模块化策略，维度决定策略选择。

与移动端/端侧相关性¶

移动端维度约束: 移动端模型通常维度较低（参数量小），模块化策略更有效
资源受限设计: 根据目标设备维度选择合适的 CL 策略
嵌入式系统: 嵌入式 AI 系统的固定资源预算下，维度是设计决策的关键参数