跳转至

Privacy Without Losing Place: A Paradigm for Private Retrieval in Spatial RAGs

论文信息

  • arXiv: 2605.05459
  • 作者: Kennedy Edemacu, Mohammad Mahdi Shokri, Vinay M. Shashidhar, Jong Wook Kim
  • 提交日期: 2026-05-06
  • 方向: 记忆隐私 / 空间 RAG / 位置隐私
  • 类别: cs.CR

摘要

本文提出 PAS (Privacy Anchor Substitution),一种在空间检索增强生成(RAG)系统中实现用户位置隐私的结构化机制。不同于直接扰动用户位置的常规差分隐私方法,PAS 使用相对锚点编码来表示位置——由锚点、方向格和距离格组成,能够与现代 RAG 管道无缝集成。

在合成城市数据集上的评估表明,PAS 在实现约 370-400 米对抗位置误差的粗粒度隐私保护的同时,保留了超过一半的基线检索性能。尽管检索性能略有下降,但 PAS 下的下游生成质量保持相对稳健,表明其在保护位置隐私的同时维持了实用性。

核心贡献

  1. 相对锚点编码
  2. 锚点 (Anchor):附近的参考地标
  3. 方向格 (Direction Bin):粗粒度的方向分区
  4. 距离格 (Distance Bin):粗粒度的距离分区
  5. 三元组取代精确坐标,大幅降低位置精度

  6. 隐私-效用权衡优化

  7. 370-400 米对抗位置误差 = 足够保护用户精确位置
  8. 保留 >50% 检索性能 = 下游任务仍可完成
  9. 生成质量相对稳健 = 实际可用性得到保障

  10. RAG 管道兼容性

  11. 不需要修改 RAG 核心架构
  12. 锚点编码可直接作为 RAG 的检索键
  13. 可与任何空间索引结构集成

  14. 对 Agent 记忆隐私的启示

  15. 记忆中的位置信息需要特殊处理
  16. 隐私保护不意味着完全丢弃信息
  17. 粗粒度抽象可以是隐私保护的有效手段

为什么重要

空间 RAG 是 Agent 系统在物理世界导航的核心基础设施——Agent 需要记忆空间位置、规划路径、理解场景。但这些记忆一旦泄露,会直接威胁用户隐私:

  • 位置即身份:精确的移动轨迹可以识别个人身份
  • 行为模式泄露:长期位置记忆揭示生活习惯
  • 社交关系推断:常去地点可推断社交关系

PAS 通过锚点编码在隐私保护和实用价值之间找到平衡: - 不是零隐私(完全匿名)而是受控隐私(粗粒度保护) - 不是牺牲效用来保隐私,而是通过智能抽象最小化信息损失 - 可以与差分隐私等其他隐私技术叠加使用

与端侧/移动端的相关性

  1. 移动端核心场景:手机上的 Agent 需要处理大量位置相关信息
  2. 本地隐私处理:锚点编码可在设备端完成,无需上传精确位置
  3. 隐私预算最小化:相比直接扰动坐标,锚点编码的信息损失更小
  4. 边缘计算友好:简单编码操作,适合资源受限的端侧设备
  5. 合规性:符合 GDPR 等数据保护法规对位置信息的要求

技术细节

锚点编码算法

用户位置 (lat, lon) → 最近锚点 + 方向格 + 距离格
                   → (anchor_id, direction_bin, distance_bin)

检索时:用锚点三元组查询,而非精确坐标
解码时:仅能还原到锚点附近区域,无法定位精确位置

隐私保证

  • 对抗位置误差:约 370-400 米(取决于锚点密度)
  • 锚点语义保留:仍能支持"附近餐厅"等模糊查询
  • 不可逆性:从锚点编码无法反推精确坐标