移动 Agent 框架¶
概念页面 — 从多个相关页面的 wikilink 引用自动创建
移动 Agent 框架是指在手机上运行的 AI Agent 系统架构,使 AI 能够理解屏幕内容、操作 App、完成用户任务。
核心能力¶
- GUI 理解: 通过视觉模型理解屏幕截图和 UI 元素
- 任务规划: 将用户意图分解为可执行的操作序列
- 工具调用: 操作手机功能(打开 App、输入文字、点击按钮)
- 记忆管理: 维护任务上下文和用户偏好
代表框架¶
| 框架 | 特点 |
|---|---|
| [[clawmobile-agentic]] | 原生 Agent 系统架构 |
| [[clawgui-unified-framework]] | GUI Agent 全栈开源 |
| [[zuver]] | 跨平台 Agent 框架 |
| [[lamo-scalable-gui-agents]] | 轻量多角色编排 |
关联¶
- [[secagent-mobile-gui]] — GUI 语义理解
- [[mobile-mcp]] — Android 动态工具发现
- [[mobile-agent-ecosystem-friction]] — 生态摩擦
- [[openmobile-agent-data-synthesis]] — 数据合成