跳转至

DIMoE-Adapters: Dynamic Expert Evolution for Continual Learning in Vision-Language Models

论文基本信息

  • arXiv ID: 2605.07494
  • 发表日期: 2026-05-08
  • 作者: Mengxin Qin, Xiang Zhang, Xi Wang, Kun Wei, Xu Yang
  • 研究领域: cs.CV,持续学习,灾难性遗忘,混合专家

摘要(翻译)

持续学习使视觉-语言模型能够积累知识并适应不断变化的任务,而无需从头重新训练。然而,在多域任务增量学习中,大的域迁移加剧了稳定性-可塑性困境。大多数现有方法依赖具有静态分配参数的固定架构,这限制了对新域的适应并加剧了灾难性遗忘。为应对这些挑战,我们提出 DIMoE-Adapters,一个动态增量混合专家适配器框架,引入动态专家进化范式来平衡稳定性和可塑性。该范式通过两个协同组件实现:自校准专家进化(SCEE)和原型引导专家选择(PGES)。SCEE 通过专家优化动态构建和进化稀疏专家池,提高可塑性同时减少冗余容量。PGES 基于 SCEE 塑造的池控制专家利用,提高对已见和未见任务的稳定性。大量实验表明 DIMoE-Adapters 在各种设置下优于先前最优方法。

核心贡献

  1. 动态专家进化范式: 首次在持续学习中引入动态专家进化,通过稀疏专家池动态适应新任务
  2. 自校准专家进化(SCEE): 通过专家优化动态构建和进化稀疏专家池,提高可塑性同时减少冗余容量
  3. 原型引导专家选择(PGES): 基于原型知识控制专家激活,提高跨任务稳定性
  4. 平衡稳定性-可塑性: 两个组件协同工作,在学习新任务和保留旧知识之间取得平衡
  5. 多域泛化: 在多域任务增量学习场景中展示优越性能

为什么重要

视觉-语言模型的持续学习对多模态智能体至关重要。传统方法使用固定架构,无法适应新域的分布迁移。本文提出的动态专家进化机制使模型能够在保留先前知识的同时,快速适应新任务。这为构建能在移动端持续学习和进化的多模态智能体提供了新思路。

与移动端/端侧相关性

  1. 稀疏激活: 稀疏专家池只激活相关专家,减少端侧计算量和内存占用
  2. 本地增量更新: 可在移动设备上本地进行专家池扩展,无需全量微调
  3. 参数共享: 多专家共享部分参数,减少存储开销
  4. 原型引导: PGES 使用原型压缩知识,适合存储受限的端侧设备