GraphPlanner: Graph Memory-Augmented Agentic Routing for Multi-Agent LLMs
论文信息¶
- 作者: Tao Feng, Haozhen Zhang, Zijie Lei, Peixuan Han, Jiaxuan You
- 提交日期: 2026-04-21
- 方向: 记忆表示 / 多Agent路由
摘要¶
LLM路由在整合不同模型优势、平衡效率与性能方面已取得良好效果。然而,现有路由策略依赖单轮分类或语义相似性,忽视了任务之间丰富的关联结构。GraphPlanner引入图记忆架构,将任务依赖和Agent能力建模为二部图,节点代表任务和能力,边编码前置关系和适合度分数。路由器使用图神经网络在任务-能力图上传播信息,不仅能预测当前任务最适合的Agent,还能预测下游任务及哪个Agent应提前准备。
核心贡献¶
- 二部图记忆架构:节点代表任务和能力,边编码前置关系和适合度分数,支持跨任务依赖建模
- 图神经网络路由:在任务-能力异构图上传播信息,实现归纳和转导推理
- MDP工作流生成:将工作流生成建模为马尔可夫决策过程,每步同时选择LLM主干和Agent角色(Planner/Executor/Summarizer)
- 前瞻性路由:考虑任务依赖链而非孤立决策,支持多轮异构Agent协作
方法详解¶
图记忆结构: - 任务节点:编码任务语义、输入输出类型、时间约束 - 能力节点:编码各LLM/Agent支持的技能、延迟特性、成本 - 边类型:前置依赖边(prerequisite)、适合度边(fitness)、时序依赖边(temporal)
路由过程: 1. 图神经网络编码当前任务上下文和Agent状态 2. 基于注意力机制计算任务-能力匹配分数 3. 考虑下游任务预测,选择有利于全局工作流的Agent组合 4. 输出路由决策 + 预测的后续任务序列
训练:使用强化学习优化路由策略,奖励信号包括任务完成质量、延迟成本、多Agent协作效率。
为什么重要¶
首次将任务依赖关系引入多Agent LLM路由,使路由决策具有前瞻性。传统单步路由的短视问题在GraphPlanner中得到根本解决,对于复杂的多轮协作场景(代码生成、复杂推理、多工具调用)尤为重要。
与端侧/移动端的相关性¶
- GNN计算较重,端侧部署需要图简化或轻量图注意力
- 适用于边缘服务器级别的多Agent编排
- 任务-能力图的紧凑表示(稀疏边)可在端侧高效存储和查询
- 移动端多模型协作(如本地小模型+云端大模型)场景有应用潜力
实验结果¶
- 在复杂推理任务上优于单步路由方法
- 多Agent协作任务中,GraphPlanner的工作流完成率显著更高
- 归纳推理(未见过的任务组合)表现优于转导方法