Privacy Without Losing Place: A Paradigm for Private Retrieval in Spatial RAGs
论文信息¶
- arXiv: 2605.05459
- 作者: Kennedy Edemacu, Mohammad Mahdi Shokri, Vinay M. Shashidhar, Jong Wook Kim
- 提交日期: 2026-05-06
- 方向: 记忆隐私 / 空间 RAG / 位置隐私
- 类别: cs.CR
摘要¶
本文提出 PAS (Privacy Anchor Substitution),一种在空间检索增强生成(RAG)系统中实现用户位置隐私的结构化机制。不同于直接扰动用户位置的常规差分隐私方法,PAS 使用相对锚点编码来表示位置——由锚点、方向格和距离格组成,能够与现代 RAG 管道无缝集成。
在合成城市数据集上的评估表明,PAS 在实现约 370-400 米对抗位置误差的粗粒度隐私保护的同时,保留了超过一半的基线检索性能。尽管检索性能略有下降,但 PAS 下的下游生成质量保持相对稳健,表明其在保护位置隐私的同时维持了实用性。
核心贡献¶
- 相对锚点编码:
- 锚点 (Anchor):附近的参考地标
- 方向格 (Direction Bin):粗粒度的方向分区
- 距离格 (Distance Bin):粗粒度的距离分区
-
三元组取代精确坐标,大幅降低位置精度
-
隐私-效用权衡优化:
- 370-400 米对抗位置误差 = 足够保护用户精确位置
- 保留 >50% 检索性能 = 下游任务仍可完成
-
生成质量相对稳健 = 实际可用性得到保障
-
RAG 管道兼容性:
- 不需要修改 RAG 核心架构
- 锚点编码可直接作为 RAG 的检索键
-
可与任何空间索引结构集成
-
对 Agent 记忆隐私的启示:
- 记忆中的位置信息需要特殊处理
- 隐私保护不意味着完全丢弃信息
- 粗粒度抽象可以是隐私保护的有效手段
为什么重要¶
空间 RAG 是 Agent 系统在物理世界导航的核心基础设施——Agent 需要记忆空间位置、规划路径、理解场景。但这些记忆一旦泄露,会直接威胁用户隐私:
- 位置即身份:精确的移动轨迹可以识别个人身份
- 行为模式泄露:长期位置记忆揭示生活习惯
- 社交关系推断:常去地点可推断社交关系
PAS 通过锚点编码在隐私保护和实用价值之间找到平衡: - 不是零隐私(完全匿名)而是受控隐私(粗粒度保护) - 不是牺牲效用来保隐私,而是通过智能抽象最小化信息损失 - 可以与差分隐私等其他隐私技术叠加使用
与端侧/移动端的相关性¶
- 移动端核心场景:手机上的 Agent 需要处理大量位置相关信息
- 本地隐私处理:锚点编码可在设备端完成,无需上传精确位置
- 隐私预算最小化:相比直接扰动坐标,锚点编码的信息损失更小
- 边缘计算友好:简单编码操作,适合资源受限的端侧设备
- 合规性:符合 GDPR 等数据保护法规对位置信息的要求
技术细节¶
锚点编码算法¶
用户位置 (lat, lon) → 最近锚点 + 方向格 + 距离格
→ (anchor_id, direction_bin, distance_bin)
检索时:用锚点三元组查询,而非精确坐标
解码时:仅能还原到锚点附近区域,无法定位精确位置
隐私保证¶
- 对抗位置误差:约 370-400 米(取决于锚点密度)
- 锚点语义保留:仍能支持"附近餐厅"等模糊查询
- 不可逆性:从锚点编码无法反推精确坐标