Evoking User Memory: Personalizing LLM via Recollection-Familiarity Adaptive Retrieval¶

arXiv ID: 2603.09250
发表时间: 2026-03-10
作者: Yingyi Zhang, Junyi Li, Wenlin Zhang, Penyue Jia, Xianneng Li et al.
方向: 记忆检索、个性化记忆、RAG
类别: cs.IR

论文基本信息¶

个性化大语言模型依赖记忆检索来整合用户特定的历史、偏好和上下文。现有的方法要么通过将所有用户过去记忆加载到提示中来给 LLM 造成过载（成本高且不可扩展），要么将检索简化为一次性相似度搜索（只能捕获表面匹配）。

认知科学表明，人类记忆通过双重过程运作：熟悉性（Familiarity） 提供快速但粗略的识别，回忆（Recollection） 实现深思熟虑的链式重构以深度恢复情景内容。当前系统缺乏执行回忆检索的能力以及在两种检索路径之间自适应切换的机制，导致要么召回不足，要么引入噪声。

为此，本文提出 RF-Mem（Recollection-Familiarity Memory Retrieval），一种基于熟悉度不确定性的双路径记忆检索器。RF-Mem 通过均值分数和熵来测量熟悉度信号： - 高熟悉度 → 直接 top-K 熟悉度检索路径 - 低熟悉度 → 激活回忆路径

在回忆路径中，系统对候选记忆进行聚类，并将 alpha-mix 与查询结合，在嵌入空间中迭代扩展证据，模拟深思熟虑的上下文重构。这种设计将类人双过程识别嵌入到检索器中，避免了全上下文开销，实现了可扩展的自适应个性化。

在三个基准测试和不同语料规模的实验表明，RF-Mem 在固定预算和延迟约束下始终优于单次检索和全上下文推理方法。

RF-Mem 通过以下指标测量熟悉度： - 均值分数：候选记忆与查询的相似度均值 - 熵：相似度分布的不确定性

在三个基准测试和不同语料规模上的实验表明： - RF-Mem 在固定预算和延迟约束下始终优于 one-shot retrieval - RF-Mem 在相同约束下优于 full-context reasoning 方法 - 双路径机制在各种任务类型和规模上均有效