type: concept tags: [agent架构, 技能学习, 持续学习, agent-design, memory-based-RL] related: [[amc-adaptive-memory-crystallization]], [[agent-persistent-identity]], [[mga-memory-gui-agent]], [[memground-benchmark]] sources: - url: https://arxiv.org/abs/2603.18743 title: "Memento-Skills: Let Agents Design Agents" date: 2026-04-17 reliability: high created: 2026-04-17 updated: 2026-04-17

Memento-Skills: 让 Agent 设计 Agent¶

基于记忆的强化学习框架，Agent 通过经验自主构建、适应和改进特定任务的子 Agent

核心问题¶

当前 LLM Agent 系统要么使用固定工具集（ReAct、Toolformer），要么需要人工设计特定任务的 Agent。缺乏一种机制让通用 Agent 从经验中学习，自主演化出任务专属的技能。

方法/架构¶

Memento-Skills 是一个通用的、可持续学习的 LLM Agent 系统，核心理念是"Agent 设计 Agent"：

架构三要素： 1. 有状态提示（Stateful Prompts）：技能以结构化 Markdown 文件存储，作为持久演化的记忆 2. 记忆驱动的 RL 框架：技能编码行为和上下文，使 Agent 跨交互携带知识 3. 读写反思学习（Read-Write Reflective Learning）： - 读阶段：Agent 读取已有技能，理解任务需求 - 写阶段：基于执行结果，创建或修改技能文件

技能演化路径：

基础技能（Web搜索、终端操作）
    ↓ 经验积累
复合技能（多步骤任务编排）
    ↓ 持续改进
专业化技能（领域特定的高效策略）

关键创新：技能不是代码，而是结构化 Markdown——包含前置条件、执行步骤、后置条件和学习笔记。这使得技能既人类可读，又可被 Agent 自动修改。

基于 Memento 2 的 Read-Write Reflective Learning 机制，Agent 在每次交互后反思执行结果，将成功经验固化为技能，将失败经验转化为技能的前置条件约束。

为什么重要¶

对于手机端 AIOS Agent： - 自适应技能学习：Agent 可以从用户的日常操作中学习，自动生成个性化技能 - 资源高效：技能以文件形式存储，不需要额外的模型参数 - 可解释性：Markdown 格式的技能人类可读，便于用户审核和修改 - 持续演化：Agent 能力随使用时间增长，而非固定不变

这与传统"写死工具集"的 Agent 形成鲜明对比——Memento-Skills 提出了一种有机增长的 Agent 能力体系。对于手机端，这意味着 Agent 可以从用户的操作模式中学习，逐渐成为真正个性化的助手。

关联¶

[[amc-adaptive-memory-crystallization]] — AMC 的记忆结晶化与 Memento-Skills 的技能学习互补
[[agent-persistent-identity]] — Agent 持久化身份需要技能作为能力载体
[[mga-memory-gui-agent]] — MGA 的 GUI Agent 可以用 Memento-Skills 框架学习交互技能
[[memground-benchmark]] — MemGround 可以评估 Memento-Skills 的记忆能力