MemPrivacy: Privacy-Preserving Personalized Memory Management for Edge-Cloud Agents

摘要¶

随着 LLM 驱动的 Agent 在边缘云环境中的大规模部署，个性化记忆成为长期适应和以用户为中心交互的关键使能技术。然而，云端辅助的记忆管理会暴露敏感用户信息，现有隐私保护方法通常依赖激进的掩码处理，导致记忆效用和个性化质量严重下降。本文提出 MemPrivacy，在边缘设备上识别隐私敏感片段，用语义结构化的类型感知占位符替换后交给云端处理，需要时在本地恢复原始值。通过将隐私保护与语义破坏解耦，MemPrivacy 在最大限度减少敏感数据暴露的同时，保留了有效记忆形成和检索所需的信息。

核心贡献¶

隐私解耦架构：首次提出在边缘侧识别+替换隐私敏感片段、云端处理结构化占位符、边缘侧本地恢复的完整流程
类型感知占位符：将隐私敏感数据替换为语义结构化的类型占位符（如 [DATE], [LOCATION]），而非简单删除
MemPrivacy-Bench 评测基准：覆盖 200 用户、52k+ 隐私实例的数据集，并提出四级隐私分类体系
SOTA 隐私信息提取：性能显著超越 GPT-5.2、Gemini-3.1-Pro 等通用模型；同时将推理延迟降低至可比水平
utility loss < 1.6%：在多种主流记忆系统中，MemPrivacy 将效用损失限制在 1.6% 以内，显著优于基线掩码策略

为什么重要¶

边缘云协同是未来 Agent 部署的主流范式——敏感数据留在边缘（手机、AR 眼镜、车载系统），云端负责重型推理。但现有方案面临两难：要么把数据全放云端（隐私风险），要么全放边缘（算力不足）。MemPrivacy 提供了第三条路：通过结构化语义替换，让云端在"不知道具体内容"的情况下完成记忆检索和整合，适用于端侧记忆管理、个性化推荐、医疗健康助手等强隐私场景。

与端侧/移动端的相关性¶

边缘优先设计：隐私识别和恢复全部在边缘设备本地完成，云端只接触匿名化占位符
低推理开销：不依赖重型加密或联邦学习，直接通过语义替换实现隐私保护，适合移动端资源约束
多模态记忆场景：框架可扩展至文本、位置、时间等多种隐私敏感类型的统一管理

参考文献¶

MemPrivacy-Bench 数据集：200 用户，52k+ 隐私实例
四级隐私分类：可配置隐私保护策略
超越 GPT-5.2、Gemini-3.1-Pro 在隐私信息提取任务上的表现