type: concept tags: [wearable, multi-agent, biomarker, health-ai, 数字健康, 端侧AI, agent] related: [[wearable-large-sensor-models]], [[edge-optimization]], [[agent-persistent-identity]] sources: - url: https://arxiv.org/abs/2604.14615 title: "CoDaS: AI Co-Data-Scientist for Biomarker Discovery via Wearable Sensors" date: 2026-04-16 reliability: high created: 2026-04-17 updated: 2026-04-17
CoDaS: 穿戴传感器驱动的 AI 数据科学家¶
多 Agent 系统在穿戴设备上实现数字生物标志物的自动发现与验证
核心问题¶
穿戴设备持续产生海量生理信号(心率变异性、运动模式、睡眠结构等),但将这些连续信号转化为临床可用的生物标志物极度困难: - 需要跨学科知识(信号处理 + 统计 + 医学) - 假设空间巨大,人工探索不可行 - 验证需要严格的鲁棒性测试(稳定性、可复现性、判别力)
传统方法依赖领域专家手动分析,耗时数月且难以规模化。
方法/架构¶
CoDaS(AI Co-Data-Scientist) 是一个多 Agent 协作系统,将生物标志物发现结构化为迭代流程:
- 假设生成 Agent:基于穿戴传感器数据和文献知识,自动生成候选生物标志物假设
- 统计分析 Agent:对每个假设执行统计检验,提取时序特征(周期性、趋势、变异性)
- 对抗验证 Agent:对统计结果进行鲁棒性检验——稳定性、可复现性、判别力
- 文献推理 Agent:将发现的模式与已有医学文献关联,评估临床可信度
- 人类监督回路:在关键决策点引入专家判断
核心设计原则: - 迭代闭环:每个 Agent 的输出触发下一环节,形成自动化的发现流水线 - 对抗验证:专门的验证 Agent 挑战发现结果,减少假阳性 - 人机协同:不是完全自动化,而是在关键节点保留人类判断
实验结果/关键数据¶
在 3 个队列共 9,279 名参与者的穿戴数据上验证: - CoDaS 识别出 41 个心理健康候选数字生物标志物和 25 个代谢结局候选标志物 - 每个标志物经过内部验证电池(复现性、稳定性、鲁棒性、判别力) - 在两个独立抑郁队列中,CoDaS 发现了昼夜节律不稳定性与抑郁症状的关联 - 相比人工分析,发现效率提升约 10 倍
关键洞察¶
多 Agent 架构在科学发现中的价值:CoDaS 证明了将复杂科研流程分解为专门 Agent 的可行性。每个 Agent 专注单一认知任务(假设、验证、推理),通过协作实现超越单一 Agent 的能力。
穿戴数据的独特挑战: - 信号噪声大、缺失多、设备间异质性强 - 生物标志物需要跨个体泛化,不仅仅是拟合训练数据 - 临床验证周期长,Agent 系统可以加速假设筛选阶段
对手机端 AIOS 的启示:类似的多 Agent 架构可用于手机端的健康监测、行为分析等场景。Agent 间的协作模式可直接迁移。
为什么重要¶
- 穿戴 AI 应用的标杆:CoDaS 展示了穿戴设备上 AI 系统的实际临床价值,超越了概念验证阶段
- 多 Agent 范式的落地验证:证明了 Agent 系统在真实医疗数据上的可行性
- 端侧健康 AI 的前奏:穿戴生物标志物发现最终需要端侧推理,推动模型压缩和隐私保护技术发展
- 与手机端的协同:穿戴数据 + 手机端 Agent 的组合可实现更全面的健康监测
关联¶
- [[wearable-large-sensor-models]] — LSM 为 CoDaS 提供更强大的传感器表示
- [[agent-persistent-identity]] — CoDaS 的 Agent 协作需要持久化的用户健康状态
- [[edge-optimization]] — 端侧部署 CoDaS 需要推理优化
- [[chain-of-modality]] — 多模态穿戴数据融合是 CoDaS 的基础能力