RRCM: Ranking-Driven Retrieval over Collaborative and Meta Memories for LLM Recommendation

论文信息¶

arXiv: 2605.07129
作者: Shijun Li, Wooseong Yang, Yu Wang, Tianxin Wei, Joydeep Ghosh
提交日期: 2026-05-08
方向: 记忆检索 / 推荐系统 / 协作记忆
类别: cs.IR

摘要¶

大型语言模型（LLM）已成为下一代推荐系统的有前景范式，提供强大的语义理解和自然语言推理能力。尽管近期取得进展，当前基于 LLM 的推荐系统在实际构建决策相关上下文时仍面临关键挑战。首先，现有方法通常依赖固定的上下文构建策略：协作行为证据和物品元数据通常通过预定义提示词、静态检索管道或手工注入机制引入，难以针对每个实例确定哪些信息真正有益。其次，异构证据引入了严重的上下文效率瓶颈。

本文提出 RRCM (Ranking-Driven Retrieval over Collaborative and Meta Memories)，一种新型框架，通过排名驱动的检索机制从协作记忆和元记忆两个维度获取决策相关上下文。RRCM 不再依赖固定的注入策略，而是根据每个查询动态选择和组合不同类型的记忆证据。

核心贡献¶

双记忆系统：协作记忆（用户行为模式）与元记忆（物品语义属性）的联合检索
排名驱动的动态上下文构建：根据查询意图动态调整不同记忆来源的权重
异构证据融合：解决协作信号与语义信号融合时的上下文效率问题
决策相关性的显式建模：直接优化哪些记忆对最终决策有帮助，而非简单的语义相关性
对 Agent 个性化的启示：
用户的协作记忆 = Agent 对用户历史行为的记忆
物品元记忆 = Agent 对环境/工具/知识的语义记忆
动态权重调整 = Agent 根据当前任务选择记忆来源的能力

为什么重要¶

记忆检索的核心挑战在于：并非所有相关记忆都对当前任务有帮助。传统 RAG 只关注相关性，但忽略了"决策有用性"。RRCM 通过排名机制显式建模记忆对决策的贡献度，这为 Agent 记忆系统提供了重要参考：

记忆的价值不只是相关性：一条相关但对决策无贡献的记忆是冗余的
多源记忆的动态融合：Agent 需要同时考虑用户历史、环境知识、工具经验等多种记忆来源
上下文效率：在有限上下文窗口内，优先检索决策相关性最高的记忆

与端侧/移动端的相关性¶

个性化推荐：移动端是推荐系统的核心场景，RRCM 的轻量级检索机制适合端侧部署
本地偏好学习：用户的协作行为模式可以在本地记忆，隐私敏感场景下无需上传云端
实时个性化：动态记忆检索支持实时个性化推荐，而非依赖陈旧的全局模型