A Domain Incremental Continual Learning Benchmark for ICU Time Series Model Transportability¶
作者: Ryan King, Conrad Krueger, Ethan Veselka, Tianbao Yang, Bobak J. Mortazavi 发表: 2026-05-05
摘要¶
近年来,机器学习在临床结果预测方面取得了显著进展。然而,医院训练模型所需的巨大资源(数据收集、标注、算力)限制了小型医院开发自己模型的能力。一种替代方案是从大型医院迁移预训练模型到小型医院,允许他们在特定患者数据上进行微调。
然而,这些模型通常在来自单一医院的数据上进行训练和验证,引发了对其泛化到新数据能力的担忧。研究表明,美国不同地区之间的测量分布和频率存在显著差异。为此,本文提出了一个基准测试,将模型从源域迁移到全国各地不同区域的场景,框架为一个域增量学习问题——患者结果预测任务保持不变,但输入数据分布发生变化,需要模型能够有效管理这些分布偏移。
核心贡献¶
- 域增量持续学习基准: 首个针对 ICU 时间序列模型跨域迁移的持续学习基准,将医院间模型迁移问题建模为域增量学习
- 分布迁移研究: 揭示了美国不同地区ICU时间序列数据在测量分布和频率上的显著差异
- 评估框架: 评估了两种主流域增量学习方法——数据重放(data replay)和弹性权重巩固(EWC),为后续研究提供标准化的比较基线
- 实践指导: 提供了关于如何在不同医疗域间保持模型能力的实证分析
为什么重要¶
医疗AI面临一个核心悖论:大型医院有资源训练高精度模型,但无法轻易分享患者数据(隐私);小型医院有数据需求,但缺乏训练能力。本文提出的域增量学习框架试图在保护数据隐私的前提下实现跨机构模型知识迁移。
对于 Agent 记忆系统的意义在于:持续学习框架需要处理跨域/跨用户知识迁移时的灾难性遗忘问题,本文的基准测试和评估结果为这一方向提供了重要的实验依据。
与端侧/移动端相关性¶
- 边缘医疗设备: 端侧部署的医疗 AI 模型需要在资源受限环境下持续学习新患者数据而不遗忘旧知识
- 隐私保护的持续学习: 数据重放策略可以在不存储原始敏感数据的情况下保留历史知识
- 个性化适应: 移动端健康监测应用需要适应不同用户/场景的生理数据分布变化
关键词: 域增量学习、持续学习、医疗时间序列、模型迁移、灾难性遗忘、EWC、数据重放