type: concept tags: [wearable, multi-agent, biomarker, health-ai, 数字健康, 端侧AI, agent] related: [[wearable-large-sensor-models]], [[edge-optimization]], [[agent-persistent-identity]] sources: - url: https://arxiv.org/abs/2604.14615 title: "CoDaS: AI Co-Data-Scientist for Biomarker Discovery via Wearable Sensors" date: 2026-04-16 reliability: high created: 2026-04-17 updated: 2026-04-17

CoDaS: 穿戴传感器驱动的 AI 数据科学家¶

多 Agent 系统在穿戴设备上实现数字生物标志物的自动发现与验证

核心问题¶

穿戴设备持续产生海量生理信号（心率变异性、运动模式、睡眠结构等），但将这些连续信号转化为临床可用的生物标志物极度困难： - 需要跨学科知识（信号处理 + 统计 + 医学） - 假设空间巨大，人工探索不可行 - 验证需要严格的鲁棒性测试（稳定性、可复现性、判别力）

传统方法依赖领域专家手动分析，耗时数月且难以规模化。

方法/架构¶

CoDaS（AI Co-Data-Scientist） 是一个多 Agent 协作系统，将生物标志物发现结构化为迭代流程：

假设生成 Agent：基于穿戴传感器数据和文献知识，自动生成候选生物标志物假设
统计分析 Agent：对每个假设执行统计检验，提取时序特征（周期性、趋势、变异性）
对抗验证 Agent：对统计结果进行鲁棒性检验——稳定性、可复现性、判别力
文献推理 Agent：将发现的模式与已有医学文献关联，评估临床可信度
人类监督回路：在关键决策点引入专家判断

核心设计原则： - 迭代闭环：每个 Agent 的输出触发下一环节，形成自动化的发现流水线 - 对抗验证：专门的验证 Agent 挑战发现结果，减少假阳性 - 人机协同：不是完全自动化，而是在关键节点保留人类判断

实验结果/关键数据¶

在 3 个队列共 9,279 名参与者的穿戴数据上验证： - CoDaS 识别出 41 个心理健康候选数字生物标志物和 25 个代谢结局候选标志物 - 每个标志物经过内部验证电池（复现性、稳定性、鲁棒性、判别力） - 在两个独立抑郁队列中，CoDaS 发现了昼夜节律不稳定性与抑郁症状的关联 - 相比人工分析，发现效率提升约 10 倍

关键洞察¶

多 Agent 架构在科学发现中的价值：CoDaS 证明了将复杂科研流程分解为专门 Agent 的可行性。每个 Agent 专注单一认知任务（假设、验证、推理），通过协作实现超越单一 Agent 的能力。

穿戴数据的独特挑战： - 信号噪声大、缺失多、设备间异质性强 - 生物标志物需要跨个体泛化，不仅仅是拟合训练数据 - 临床验证周期长，Agent 系统可以加速假设筛选阶段

对手机端 AIOS 的启示：类似的多 Agent 架构可用于手机端的健康监测、行为分析等场景。Agent 间的协作模式可直接迁移。

为什么重要¶

穿戴 AI 应用的标杆：CoDaS 展示了穿戴设备上 AI 系统的实际临床价值，超越了概念验证阶段
多 Agent 范式的落地验证：证明了 Agent 系统在真实医疗数据上的可行性
端侧健康 AI 的前奏：穿戴生物标志物发现最终需要端侧推理，推动模型压缩和隐私保护技术发展
与手机端的协同：穿戴数据 + 手机端 Agent 的组合可实现更全面的健康监测

关联¶

[[wearable-large-sensor-models]] — LSM 为 CoDaS 提供更强大的传感器表示
[[agent-persistent-identity]] — CoDaS 的 Agent 协作需要持久化的用户健康状态
[[edge-optimization]] — 端侧部署 CoDaS 需要推理优化
[[chain-of-modality]] — 多模态穿戴数据融合是 CoDaS 的基础能力