type: concept tags: [android, agent, play-store, policy, accessibility, 生态摩擦, 商业化] related: [[mobile-mcp]], [[clawmobile-agentic]], [[gui-agent-privacy]], [[secagent-mobile-gui]] sources: - url: https://hn.algolia.com/api/v1/items/47613614 title: "Google banned our mobile AI agent app for doing what Gemini should do, but doesn't" date: 2026-04-16 reliability: medium created: 2026-04-16 updated: 2026-04-16

移动 Agent 生态系统摩擦：Google Play 政策与第三方助手¶

Sova AI 被 Google Play 下架事件揭示了第三方移动 AI Agent 面临的根本性政策与平台困境。

核心问题¶

Sova AI 是一款 Android Agent，通过 Accessibility API 实际操控手机——点击、滚动、输入文字，而非仅打开 App 或搜索网页。用户可以语音或文字下达指令如"叫车去机场"或"给朋友群发消息说我迟到了"。

Google 从 Play Store 下架了该应用，理由涉及 Accessibility API 的使用。这暴露了一个根本矛盾：平台级助手（Gemini）拥有 OS 级集成但功能有限，第三方 Agent 功能强大但面临政策风险。

现状分析¶

Gemini 的局限性¶

深度 OS 集成，但"叫 Uber"通常只会打开网页搜索
无法真正操作第三方 App（未建立 API 合作关系）
安全优先策略导致功能退化

Sova AI 的技术路线¶

Accessibility API 读取 UI 节点树，虚拟人类式操作（点击/滚动/输入）
无需 root、adb、PC、USB
BYOK 模式：用户自带 API Key（OpenAI、Claude、Deepseek 等）
支持语音/文字输入，可设为默认助手

安全专家视角¶

来自韩国银行安全 SDK 开发者的评论（200+ 安装量）：

"Accessibility 滥用是我们最大的头疼问题。FakeCall 等恶意软件做的事情和合法自动化完全一样——读 UI 树、点击、输入。Android 没有好的方式区分两者。"

这揭示了平台层面的两难：限制 Accessibility API 会杀死合法的自动化工具，放宽则会增加安全风险。

政策冲突矩阵¶

场景	Gemini 能做	第三方 Agent 能做	政策状态
搜索网页	✅	✅	✅ 合规
打开 App	✅	✅	✅ 合规
操控第三方 App UI	❌	✅	⚠️ 灰色地带
读取屏幕内容	有限	✅ (Accessibility)	⚠️ 策略审查
代替用户执行操作	❌	✅	❌ 可能违规

关键洞察¶

Accessibility API 的双刃剑：它是第三方 Agent 获得操控能力的唯一低门槛路径，但也是平台限制的首要目标。Mobile-MCP 式的声明式能力发现可能提供替代方案。
平台锁定 vs 创新空间：Google 一方面无法让 Gemini 做到真正的 App 操控，另一方面又限制第三方做这件事。这创造了创新真空——好的 Agent 方案只能在 Play Store 之外分发。
BYOK 模式的意义：用户自带 API Key 意味着 Sova 不需要自建推理基础设施，成本几乎为零。这种模式可能成为移动端 Agent 商业化的主流——Engine 免费 + 用户自付推理成本。
安全与功能的天平：银行安全 SDK 开发者的观点很重要——目前没有技术手段区分"好的自动化"和"坏的自动化"。未来的解决方案可能需要 OS 级别的 Agent 许可机制（类似 iOS 的 App Tracking Transparency）。

为什么重要¶

Sova AI 被下架不是孤立事件，而是第三方移动 AI Agent 面临的系统性挑战。随着更多 Agent 产品涌现，Play Store 政策、Accessibility API 使用限制、平台安全审查将成为端侧 AI 生态的关键瓶颈。解决这一问题需要 OS 厂商、App 生态、安全社区的三方协调。

关联¶

[[mobile-mcp]] — 声明式工具发现可能替代 Accessibility 依赖
[[clawmobile-agentic]] — 智能手机原生 Agent 设计理念
[[gui-agent-privacy]] — GUI Agent 的隐私保护问题
[[secagent-mobile-gui]] — 语义上下文 vs 视觉抓取的权衡
[[on-device-vs-cloud-agentic-tool-calling]] — 端侧工具调用架构