type: concept tags: [Agent, 调试, 可观测性, 故障定位, 多Agent, 微软] related: [[agent-persistent-identity]], [[gui-agent-privacy]], [[exectune-guide-core-policy]], [[planning-failure-escalation]], [[agent-system-reliability]] sources: - url: https://www.microsoft.com/en-us/research/blog/systematic-debugging-for-ai-agents-introducing-the-agentrx-framework/ title: "Systematic debugging for AI agents: Introducing the AgentRx framework" date: 2026-03-12 reliability: high - url: https://github.com/microsoft/AgentRx title: "AgentRx GitHub Repository" date: 2026-03-12 reliability: high created: 2026-04-19 updated: 2026-04-19
AgentRx: AI Agent 系统化调试框架¶
通过从工具模式和领域策略中合成可执行约束,逐步记录违规证据,精确定位 Agent 故障的首个不可恢复步骤
核心问题¶
AI Agent 从简单聊天机器人演进为自主系统(管理云事件、操作复杂 Web 界面、执行多步骤 API 工作流),但一个新的挑战浮现:透明性。
人类犯错时可以追溯逻辑链,但 AI Agent 失败时——可能是幻觉了工具输出或偏离了策略——真正的根因往往被埋没在冗长、随机、且常常是多 Agent 的轨迹中。
方法/架构¶
核心思路¶
AgentRx 从工具模式(tool schema)和领域策略(domain policies)中自动合成可守卫的可执行约束(guarded executable constraints),然后在 Agent 执行轨迹中逐步检查约束违反,精确定位首个不可恢复的"关键故障"步骤。
故障分类体系¶
提出了一个有据可依的九类故障分类法,覆盖 Agent 失败的全谱系。
工作流程¶
- 从工具模式和策略推导约束
- 沿执行轨迹逐步检查约束
- 记录带证据的违规日志
- 定位首个关键故障步骤
- 输出根因归因
实验结果¶
在 AgentRx Benchmark 上评估(包含 115 个人工标注的失败轨迹,跨 τ-bench、Flash 和 Magentic-One): - 故障定位提升 +23.6%(相比 prompting 基线) - 根因归因提升 +22.9%(相比 prompting 基线)
开源了框架和数据集。
关键洞察¶
-
约束驱动而非统计驱动:AgentRx 不依赖大量失败样本训练诊断模型,而是从工具规范中推导约束——这种方法可泛化到任意 Agent 架构
-
首个不可恢复步骤是关键概念:故障往往在链条早期就已发生,但后果在后续步骤才显现。找到这个"转折点"比列举所有错误更有价值
-
多 Agent 调试的必要性:随着多 Agent 系统(如 Magentic-One)的普及,单 Agent 调试工具不足以定位跨 Agent 的协调故障
-
工具模式是最丰富的调试信息来源:工具的输入/输出规范本身就隐含了大量可检查的约束,比黑盒模型行为更可靠
为什么重要¶
在移动 AIOS 中,Agent 系统日益复杂——个人助理、自动化任务、多设备协同。当 Agent 行为异常时,用户需要可解释的故障诊断。AgentRx 提供的系统化调试方法可以嵌入到移动 OS 的 Agent 运行时中,实现: - 自动故障检测和报告 - 用户友好的错误解释 - 开发者友好的调试日志
特别是其约束驱动的方法——不依赖云端大模型,可以在端侧执行约束检查。
关联¶
- [[agent-persistent-identity]] — Agent 身份的可观测性需要调试基础设施
- [[gui-agent-privacy]] — 调试日志涉及隐私——哪些信息应该被记录
- [[exectune-guide-core-policy]] — Guide 模型的策略可以作为 AgentRx 的领域策略输入
- [[planning-failure-escalation]] — 规划失败是 AgentRx 能检测的关键故障类型
- [[agent-system-reliability]] — AgentRx 是构建可靠 Agent 系统的调试层