type: concept tags: [端侧训练, 微调, 生物信号, MCU, 可穿戴, 边缘AI, on-device] related: [[agent-persistent-identity]], [[on-device-inference-memory-pressure]], [[edgecim-hardware-codesign]], [[sustainability-ondevice-intelligence]] sources: - url: https://arxiv.org/abs/2604.13359 title: "BioTrain: Sub-MB, Sub-50mW On-Device Fine-Tuning for Edge-AI on Biosignals" date: 2026-04-18 reliability: high created: 2026-04-21 updated: 2026-04-21

BioTrain: 亚MB级亚50mW端侧微调用于生物信号边缘AI¶

在超低功耗 MCU 上实现 on-device fine-tuning，专用于生物信号处理。来源：arXiv 2604.13359

核心问题¶

在可穿戴设备和医疗 IoT 场景中，模型需要在极低功耗（<50mW）和极小存储（<1MB）的 MCU 上进行端侧微调以适应个体用户。现有 on-device training 方法仍然需要数十MB内存和数百mW功耗，无法在真正的边缘设备上运行。

方法/架构¶

BioTrain 提出三层协同优化： - 亚MB级模型架构：精心设计的 tiny backbone，参数量 < 100K - 极低功耗训练引擎：针对 ARM Cortex-M 级 MCU 优化的梯度计算 - 生物信号专用：针对 ECG、EEG、EMG 等时序信号设计的特征提取器

关键技术包括梯度压缩、选择性层微调和定点算术优化，使整个训练过程在 512KB SRAM 内完成。

实验结果¶

在 ECG 心律失常检测任务上，端侧微调后准确率提升 8-12%
功耗 < 50mW（实测 32mW），适合电池供电设备
模型 + 训练状态 < 1MB（实测 780KB）
微调时间 < 30秒完成一轮适应

关键洞察¶

BioTrain 证明了端侧训练不仅仅是推理的延伸——它需要完全不同的系统设计。关键在于：(1) 训练和推理共享大部分计算图以减少内存；(2) 梯度计算使用定点而非浮点；(3) 只微调最后一层的少量参数。

为什么重要¶

这是真正的 on-device learning，不是云端训练后部署。对可穿戴健康监测（心率异常、跌倒检测）等场景，端侧微调能实时适应用户生理特征，无需上传敏感健康数据到云端。与 [[agent-persistent-identity]] 的个性化能力相呼应。

关联¶

[[agent-persistent-identity]] — Agent 持久化身份与端侧个性化
[[on-device-inference-memory-pressure]] — 端侧训练的内存约束
[[edgecim-hardware-codesign]] — 边缘硬件协同设计
[[sustainability-ondevice-intelligence]] — 端侧训练的可持续性考量