type: concept tags: [Agent, 记忆管理, 智能家居, 强化学习, 可信AI] related: [[mga-memory-gui-agent]], [[agent-persistent-identity]], [[secagent-mobile-gui]] sources: - url: https://arxiv.org/abs/2604.10110 title: "Trust Your Memory: Verifiable Control of Smart Homes through Reinforcement Learning with LLM-Augmented Memory" date: 2026-04-19 reliability: high created: 2026-04-19 updated: 2026-04-19

Trust Your Memory: LLM 增强记忆的可信智能家居控制¶

通过强化学习 + LLM 增强记忆实现可信的智能家居设备控制——解决记忆驱动的设备控制难题

核心问题¶

LLM 驱动的智能家居助手在实时设备控制上已有探索，但记忆驱动的设备控制（即基于用户历史交互、偏好和上下文记忆来做出控制决策）仍面临双重挑战：

评估挑战：现有基准要么聚焦即时设备控制，要么是通用开放域记忆检索，无法有效评估模型的记忆驱动控制能力
方法挑战：LLM 的上下文窗口有限，无法长期保留用户偏好；单纯的 RAG 又缺乏对控制决策的可验证性

方法/架构¶

论文提出 RL + LLM 增强记忆的双层架构：

记忆层：LLM-Augmented Episodic Memory¶

情景记忆模块：存储用户的历史交互记录（时间、设备、操作、反馈）
LLM 增强检索：利用 LLM 的语义理解能力从情景记忆中提取相关上下文，而非简单关键词匹配
记忆压缩：将冗长的交互历史压缩为结构化的用户偏好表示

控制层：RL-Based Verifiable Control¶

强化学习控制器：基于当前状态（用户偏好 + 设备状态 + 时间上下文）做出控制决策
可验证性：每一步控制决策都可以追溯到具体的记忆条目和推理链
反馈循环：用户反馈更新情景记忆，形成持续学习闭环

关键设计¶

记忆与控制解耦：LLM 负责记忆理解和检索，RL 负责策略执行
引入"记忆置信度"：当记忆不够充分时，系统退化为安全默认行为
支持多用户场景：每个用户有独立的记忆空间

实验结果¶

构建了新的记忆驱动设备控制基准（涵盖多轮对话、长期偏好、异常处理场景）
相比纯 LLM 基线，控制准确率提升 15-22%
可验证性指标（可追溯性分数）达到 0.89，远超基线的 0.45
在多用户场景中，个性化控制满意度提升 31%

关键洞察¶

记忆驱动控制的核心不是"记住更多"，而是"记住对的"。论文的关键发现是：盲目增加记忆容量反而降低控制质量（信息过载），而通过 LLM 增强的语义检索可以精准定位与当前控制决策相关的记忆。

可验证性是智能家居的信任基石。用户需要知道"为什么空调调到了 24 度"——是基于我的历史偏好、当前室外温度、还是随机决策？RL 的可追溯性设计让每一步控制都有据可查。

为什么重要¶

对于手机端 AIOS 的 Agent 系统： - 记忆管理是 Agent 成熟的标志：没有记忆的 Agent 只能做即时响应，无法提供个性化服务 - 可验证性设计可迁移到手机端：手机上的 Agent 同样需要让用户理解"为什么做了这个操作" - RL + LLM 的混合架构为端侧 Agent 提供了轻量级的决策框架——RL 做快速决策，LLM 做记忆理解

关联¶

[[mga-memory-gui-agent]] — 记忆驱动的 GUI Agent，相似的记忆管理范式
[[agent-persistent-identity]] — Agent 持久化身份与长期记忆的关系
[[secagent-mobile-gui]] — 移动端 Agent 的感知与执行框架