MemPrivacy: Privacy-Preserving Personalized Memory Management for Edge-Cloud Agents
摘要¶
随着 LLM 驱动的 Agent 在边缘云环境中的大规模部署,个性化记忆成为长期适应和以用户为中心交互的关键使能技术。然而,云端辅助的记忆管理会暴露敏感用户信息,现有隐私保护方法通常依赖激进的掩码处理,导致记忆效用和个性化质量严重下降。本文提出 MemPrivacy,在边缘设备上识别隐私敏感片段,用语义结构化的类型感知占位符替换后交给云端处理,需要时在本地恢复原始值。通过将隐私保护与语义破坏解耦,MemPrivacy 在最大限度减少敏感数据暴露的同时,保留了有效记忆形成和检索所需的信息。
核心贡献¶
- 隐私解耦架构:首次提出在边缘侧识别+替换隐私敏感片段、云端处理结构化占位符、边缘侧本地恢复的完整流程
- 类型感知占位符:将隐私敏感数据替换为语义结构化的类型占位符(如
[DATE],[LOCATION]),而非简单删除 - MemPrivacy-Bench 评测基准:覆盖 200 用户、52k+ 隐私实例的数据集,并提出四级隐私分类体系
- SOTA 隐私信息提取:性能显著超越 GPT-5.2、Gemini-3.1-Pro 等通用模型;同时将推理延迟降低至可比水平
- utility loss < 1.6%:在多种主流记忆系统中,MemPrivacy 将效用损失限制在 1.6% 以内,显著优于基线掩码策略
为什么重要¶
边缘云协同是未来 Agent 部署的主流范式——敏感数据留在边缘(手机、AR 眼镜、车载系统),云端负责重型推理。但现有方案面临两难:要么把数据全放云端(隐私风险),要么全放边缘(算力不足)。MemPrivacy 提供了第三条路:通过结构化语义替换,让云端在"不知道具体内容"的情况下完成记忆检索和整合,适用于端侧记忆管理、个性化推荐、医疗健康助手等强隐私场景。
与端侧/移动端的相关性¶
- 边缘优先设计:隐私识别和恢复全部在边缘设备本地完成,云端只接触匿名化占位符
- 低推理开销:不依赖重型加密或联邦学习,直接通过语义替换实现隐私保护,适合移动端资源约束
- 多模态记忆场景:框架可扩展至文本、位置、时间等多种隐私敏感类型的统一管理
参考文献¶
- MemPrivacy-Bench 数据集:200 用户,52k+ 隐私实例
- 四级隐私分类:可配置隐私保护策略
- 超越 GPT-5.2、Gemini-3.1-Pro 在隐私信息提取任务上的表现