Fine-Tuning Regimes Define Distinct Continual Learning Problems¶
论文基本信息¶
- 作者: Paul-Tiberiu Iordache, Elena Burceanu
- arXiv: https://arxiv.org/abs/2604.21927
- 领域: cs.LG, cs.AI
摘要¶
持续学习(CL)研究模型如何在保留已有知识的同时顺序获取新任务。尽管 CL 方法评测取得了实质性进展,但比较评估通常固定微调策略(fine-tuning regime)。论文认为微调策略——由可训练参数子空间定义——本身是一个关键评估变量。论文形式化了这一概念,证明不同的微调策略定义本质上不同的 CL 问题,当前基准评估忽视这一点导致了不公平比较。
核心贡献¶
- Fine-tuning Regime 形式化: 首次将微调策略形式化为 CL 评估的关键变量
- Distinct CL Problems: 证明不同微调策略定义本质上不同的 CL 问题
- Regime-aware Benchmarking: 提出考虑微调策略的公平基准评估方法
- Method × Regime Interaction: 分析 CL 方法与微调策略的交互效应
- 实践建议: 为不同微调资源场景选择合适 CL 方法提供指导
研究背景与问题¶
当前 CL 基准评估假设一个固定的微调策略(通常是全量微调),但实际部署中可用的微调资源差异巨大。忽略这一变量导致方法比较不公平。
核心方法¶
- Fine-tuning Regime Taxonomy: 系统分类不同类型的微调策略(full/partial/adapter/prefix)
- Regime-specific Evaluation: 在多种微调策略下评估 CL 方法
- Interaction Analysis: 分析方法与策略的交互效应
- Resource-aware Recommendation: 根据可用微调资源推荐合适的方法
为什么重要¶
该研究揭示了 CL 评估中一个被忽视的关键变量,推动了更公平的 CL 方法比较。对 Agent 系统,这意味着选择 CL 方法时必须考虑可用的微调资源。
与移动端/端侧相关性¶
- 移动端微调限制: 移动端 Agent 通常只能做轻量级微调(如 adapter、prefix)
- 资源感知方法选择: 根据设备能力选择合适的 CL 方法
- 联邦学习场景: 联邦设置下只能做有限本地微调