Synthius-Mem: Brain-Inspired Hallucination-Resistant Persona Memory¶
论文信息¶
- arXiv ID: 2604.11563
- 作者: Artem Gadzhiev, Andrew Kislov
- 发表日期: 2026-04-13
- 方向: 记忆的真实性与隐私、人格记忆
- 代码: 未公开
摘要(翻译)¶
为 AI 智能体提供可靠且不产生幻觉的长期记忆仍然是一个开放问题。当前 LLM 智能体的记忆方法——滑动窗口、摘要、基于嵌入的 RAG 和平面事实提取——各自降低了 token 成本,但都引入了灾难性的信息丢失、语义漂移或对用户的无控制幻觉。
根本原因是架构性的:LoCoMo 基准上每个已发布的记忆系统都将对话视为对原始或轻度摘要对话段落的检索问题,且没有系统报告对抗鲁棒性——即拒绝回答用户从未透露过的事实的能觗。
Synthius-Mem 是一种受大脑启发的结构化人格记忆系统,采用根本不同的方法:不是检索"说了什么",而是提取"对这个人了解什么"。完整的 persona 提取管道将对话分解为六个认知域(传记、体验、偏好、社交圈、工作、心理测量),在每个域内进行整合和去重,并通过 CategoryRAG 以 21.79ms 延迟检索结构化事实。
在 LoCoMo 基准上(ACL 2024,10 个对话,1,813 个问题),Synthius-Mem 达到 94.37% 准确率,超过了所有已发布系统(包括 MemMachine 的 91.69%,未报告对抗分数)和人类表现(87.9 F1)。核心记忆事实准确率达到 98.64%。对抗鲁棒性——这是没有竞争系统报告的幻觉抵抗指标——达到 99.55%。Synthius-Mem 将 token 消耗减少约 5 倍,同时实现更高准确率。
核心贡献¶
1. 认知域分解¶
Synthius-Mem 将对话中提取的人格信息分解为六个独立认知域:
| 认知域 | 内容 |
|---|---|
| 传记 (Biography) | 基本人口统计信息、背景 |
| 体验 (Experiences) | 经历的事件、去过的地方 |
| 偏好 (Preferences) | 喜好、厌恶、日常偏好 |
| 社交圈 (Social Circle) | 家人、朋友、同事关系 |
| 工作 (Work) | 职业、项目、职责 |
| 心理测量 (Psychometrics) | 人格特质、价值观、信念 |
2. CategoryRAG 检索¶
每个认知域独立的 RAG pipeline: - 域内整合:同一域内的相关信息整合 - 跨域去重:跨域重复信息的合并 - 结构化事实:以键值对形式存储,结构化程度高
检索时根据问题类型路由到对应认知域,实现精确检索。
3. 对抗鲁棒性¶
Synthius-Mem 首次在记忆系统研究中引入对抗鲁棒性指标: - 评估系统拒绝回答"用户从未透露"问题的能力 - 99.55% 的对抗鲁棒性意味着只有极少量幻觉 - 这是"不知道就说不知道"原则的技术实现
实验结果¶
| 指标 | Synthius-Mem | MemMachine | 人类基准 |
|---|---|---|---|
| 记忆准确率 | 94.37% | 91.69% | 87.9 F1 |
| 核心事实准确率 | 98.64% | - | - |
| 对抗鲁棒性 | 99.55% | 未报告 | - |
| Token 效率 | ~5x 减少 | 基线 | 1x |
为什么重要¶
Synthius-Mem 的核心贡献是引入对抗鲁棒性指标和认知域分解方法:
- 对抗鲁棒性填补空白:此前没有记忆系统报告这个指标,但"拒绝回答不知道的问题"对可信 AI 至关重要
- 六域分解优于整体检索:结构化人格知识表示使得检索更精确、信息组织更清晰
- 5x Token 减少:结构化事实比完整对话历史紧凑得多
与端侧/移动端相关性¶
- 21.79ms 延迟:极低延迟使 Synthius-Mem 适合移动端实时应用
- 5x Token 减少:对移动端带宽和计算资源都是重大节省
- 隐私保护:人格记忆不上传云端,本地处理更适合移动端隐私需求