FreeMOCA: Memory-Free Continual Learning for Malicious Code Analysis¶
论文信息¶
- arXiv ID: 2605.09664
- 发表日期: 2026-05-10
- 作者: Zahra Asadi, Haeseung Jeon, Sohyun Han et al.
- 方向: 持续学习 / 代码安全
- 开源: 待确认
摘要(英译中)¶
每年有超过 2 亿个新恶意软件样本被识别,杀毒系统必须持续适应不断变化的威胁环境。然而,仅在新样本上重新训练会导致灾难性遗忘和可利用的盲点,而在整个数据集上重新训练则会产生大量计算成本。
作者提出 FreeMOCA,一种用于恶意代码分析的内存和计算高效持续学习框架,通过连续任务更新之间的自适应层间插值来保留先验知识,利用了预热任务最优解在参数空间中由低损失路径连接的事实。
核心贡献¶
- 内存高效:无需存储旧数据或大量回放样本
- 计算高效:通过自适应层间插值而非完整重训练
- 低损失路径利用:利用预热任务最优解间的低损失路径保持连续性
- 安全应用:首个针对恶意代码分析的端到端持续学习方案
关键洞察¶
预热任务的最优解在参数空间中由低损失路径连接,这使得自适应层间插值能够保留先验知识而无需显式存储旧数据。
这意味着可以通过在参数空间中插值来实现知识保留,而不是存储样本或使用正则化。
为什么重要¶
- 真实威胁场景:恶意软件分析是每年 2 亿样本量级的真实持续学习问题
- 无需回放:避免了大量存储和隐私问题
- 工程可行:适合实际部署的轻量方案
与端侧/移动端的相关性¶
- 内存高效特性直接适合端侧资源受限场景
- 移动端恶意软件检测是实际应用场景
- 无需存储训练数据的特性对隐私敏感场景有吸引力
参考文献¶
- 原论文: https://arxiv.org/abs/2605.09664