跳转至

移动 Agent 框架

概念页面 — 从多个相关页面的 wikilink 引用自动创建

移动 Agent 框架是指在手机上运行的 AI Agent 系统架构,使 AI 能够理解屏幕内容、操作 App、完成用户任务。

核心能力

  • GUI 理解: 通过视觉模型理解屏幕截图和 UI 元素
  • 任务规划: 将用户意图分解为可执行的操作序列
  • 工具调用: 操作手机功能(打开 App、输入文字、点击按钮)
  • 记忆管理: 维护任务上下文和用户偏好

代表框架

框架 特点
[[clawmobile-agentic]] 原生 Agent 系统架构
[[clawgui-unified-framework]] GUI Agent 全栈开源
[[zuver]] 跨平台 Agent 框架
[[lamo-scalable-gui-agents]] 轻量多角色编排

关联

  • [[secagent-mobile-gui]] — GUI 语义理解
  • [[mobile-mcp]] — Android 动态工具发现
  • [[mobile-agent-ecosystem-friction]] — 生态摩擦
  • [[openmobile-agent-data-synthesis]] — 数据合成