跳转至

type: concept tags: [wearable, multi-agent, biomarker, health-ai, 数字健康, 端侧AI, agent] related: [[wearable-large-sensor-models]], [[edge-optimization]], [[agent-persistent-identity]] sources: - url: https://arxiv.org/abs/2604.14615 title: "CoDaS: AI Co-Data-Scientist for Biomarker Discovery via Wearable Sensors" date: 2026-04-16 reliability: high created: 2026-04-17 updated: 2026-04-17


CoDaS: 穿戴传感器驱动的 AI 数据科学家

多 Agent 系统在穿戴设备上实现数字生物标志物的自动发现与验证

核心问题

穿戴设备持续产生海量生理信号(心率变异性、运动模式、睡眠结构等),但将这些连续信号转化为临床可用的生物标志物极度困难: - 需要跨学科知识(信号处理 + 统计 + 医学) - 假设空间巨大,人工探索不可行 - 验证需要严格的鲁棒性测试(稳定性、可复现性、判别力)

传统方法依赖领域专家手动分析,耗时数月且难以规模化。

方法/架构

CoDaS(AI Co-Data-Scientist) 是一个多 Agent 协作系统,将生物标志物发现结构化为迭代流程:

  1. 假设生成 Agent:基于穿戴传感器数据和文献知识,自动生成候选生物标志物假设
  2. 统计分析 Agent:对每个假设执行统计检验,提取时序特征(周期性、趋势、变异性)
  3. 对抗验证 Agent:对统计结果进行鲁棒性检验——稳定性、可复现性、判别力
  4. 文献推理 Agent:将发现的模式与已有医学文献关联,评估临床可信度
  5. 人类监督回路:在关键决策点引入专家判断

核心设计原则: - 迭代闭环:每个 Agent 的输出触发下一环节,形成自动化的发现流水线 - 对抗验证:专门的验证 Agent 挑战发现结果,减少假阳性 - 人机协同:不是完全自动化,而是在关键节点保留人类判断

实验结果/关键数据

在 3 个队列共 9,279 名参与者的穿戴数据上验证: - CoDaS 识别出 41 个心理健康候选数字生物标志物25 个代谢结局候选标志物 - 每个标志物经过内部验证电池(复现性、稳定性、鲁棒性、判别力) - 在两个独立抑郁队列中,CoDaS 发现了昼夜节律不稳定性与抑郁症状的关联 - 相比人工分析,发现效率提升约 10 倍

关键洞察

多 Agent 架构在科学发现中的价值:CoDaS 证明了将复杂科研流程分解为专门 Agent 的可行性。每个 Agent 专注单一认知任务(假设、验证、推理),通过协作实现超越单一 Agent 的能力。

穿戴数据的独特挑战: - 信号噪声大、缺失多、设备间异质性强 - 生物标志物需要跨个体泛化,不仅仅是拟合训练数据 - 临床验证周期长,Agent 系统可以加速假设筛选阶段

对手机端 AIOS 的启示:类似的多 Agent 架构可用于手机端的健康监测、行为分析等场景。Agent 间的协作模式可直接迁移。

为什么重要

  1. 穿戴 AI 应用的标杆:CoDaS 展示了穿戴设备上 AI 系统的实际临床价值,超越了概念验证阶段
  2. 多 Agent 范式的落地验证:证明了 Agent 系统在真实医疗数据上的可行性
  3. 端侧健康 AI 的前奏:穿戴生物标志物发现最终需要端侧推理,推动模型压缩和隐私保护技术发展
  4. 与手机端的协同:穿戴数据 + 手机端 Agent 的组合可实现更全面的健康监测

关联

  • [[wearable-large-sensor-models]] — LSM 为 CoDaS 提供更强大的传感器表示
  • [[agent-persistent-identity]] — CoDaS 的 Agent 协作需要持久化的用户健康状态
  • [[edge-optimization]] — 端侧部署 CoDaS 需要推理优化
  • [[chain-of-modality]] — 多模态穿戴数据融合是 CoDaS 的基础能力