ShadowMerge: A Novel Poisoning Attack on Graph-Based Agent Memory via Relation-Channel Conflicts¶
摘要¶
基于图的 Agent 记忆为 LLM Agent 提供结构化长期记忆和多跳推理能力,但也引入新的投毒攻击面:攻击者可以向图记忆注入精心构造的关系,使记忆在后续被检索时影响 Agent 行为。现有 Agent 记忆投毒攻击主要针对扁平文本记录,对图结构记忆效果有限——恶意关系难以被提取、难以合并到目标锚点邻域、难以对受害查询检索成功。ShadowMerge 针对图结构记忆设计新型投毒攻击,利用关系-通道冲突(Relation-Channel Conflicts)机制实现隐蔽而高效的投毒。
核心贡献¶
- 首个针对图结构 Agent 记忆的投毒攻击:填补了图记忆安全研究的空白,系统分析现有扁平攻击在图结构上失效的原因。
- Relation-Channel Conflicts 攻击机制:利用图的共享节点结构和关系特定嵌入空间的差异,构造跨关系冲突的恶意关系,使攻击关系在检索时被高置信度匹配。
- 攻击有效性验证:在多种图记忆架构上验证 ShadowMerge 可实现高成功率、低可察觉性的投毒。
- 安全启示:为图记忆的防御性安全研究提供攻击基准和方向。
为什么重要¶
随着 Agent 系统在生产环境部署,图结构记忆成为多跳推理的核心基础设施。ShadowMerge 揭示了图记忆的信任边界问题——如果攻击者可向记忆图注入恶意关系,Agent 的推理可靠性将系统性受损。这一工作对记忆系统的安全评估和防御设计有重要推动作用。
与移动端/端侧相关性¶
端侧 Agent 通常依赖本地知识图谱和记忆系统,ShadowMerge 的攻击机制(利用图的共享节点结构)表明本地图记忆同样面临投毒风险,对注重隐私和安全的端侧部署有直接警示意义。
参考文献¶
- 详见原论文