MoPHES: 端侧 LLM 驱动的移动心理健康评估与支持¶
概述¶
MoPHES(Mobile Psychological Health Evaluation and Support)是一个利用端侧 LLM 作为智能 Agent 的移动心理健康框架,由哈工大团队提出(arXiv: 2510.16085)。该框架将心理状态评估、对话支持和专业治疗建议有机整合,在移动设备上实现了完整的心理健康服务闭环。
核心架构¶
双模型 Agent 设计¶
MoPHES 的 Agent 由两个微调后的 MiniCPM4-0.5B 模型组成:
| 模型 | 功能 | 训练数据 |
|---|---|---|
| 评估模型 | 预测用户焦虑/抑郁严重程度(4 级分类) | 心理健康条件数据集 |
| 对话模型 | 多轮心理咨询对话 | 多轮咨询对话数据 |
两个模型均部署在移动设备上,利用 LoRA(Low-Rank Adaptation)进行高效微调。
关键技术¶
- MiniCPM4-0.5B:仅 0.5B 参数的紧凑 LLM,适配移动端资源限制
- LoRA 微调:在保持推理效率的同时实现领域适应
- 端侧部署:避免隐私数据上传,增强用户便利性
核心贡献¶
- 整合式框架:有机整合心理状态评估、对话支持和专业推荐,解决了现有心理健康聊天机器人缺乏实时心理评估的问题
- 小模型可行性验证:证明 0.5B 参数模型经过领域微调即可在心理健康任务中取得良好表现
- 端侧隐私保护:模型完全在用户设备上运行,不上传心理健康数据
- 自建评测基准:开发了包含心理健康预测和多轮对话的自动评测框架,使用 BLEU、ROUGE 等 7 种指标
技术细节¶
数据集构建¶
- 单轮心理咨询 QA 数据(公开心理健康语料)
- 多轮咨询对话数据(模拟真实咨询流程)
训练流程¶
- 在心理健康条件数据集上微调评估模型
- 在多轮对话数据上微调对话模型
- 使用 LoRA 减少可训练参数,适配端侧部署
评测指标¶
- 评估任务:准确率、加权 Precision/Recall/F1
- 对话任务:BLEU-1/2/3/4、ROUGE-1/2/L
与其他端侧心理健康的对比¶
| 方案 | 模型 | 参数量 | 端侧部署 | 心理评估 |
|---|---|---|---|---|
| ChatGPT | GPT-4 | ~1.76T | ❌ | ❌ |
| MentaLLaMA | LLaMA2-7B | 7B | ❌ | ✅ |
| MoPHES | MiniCPM4-0.5B | 0.5B | ✅ | ✅ |
对 Mobile AIOS 的启示¶
- 端侧 LLM + Agent 模式可行:即使 0.5B 参数模型,经过专业领域微调后也能胜任复杂的多轮对话和推理任务
- 心理健康是端侧 AI 的刚需场景:隐私敏感性天然要求本地处理
- LoRA + 小模型是端侧专业 Agent 的务实路径
- 评测基准建设是端侧 Agent 落地的关键基础设施
来源¶
- 论文:arXiv:2510.16085
- 发布日期:2025-10-17