Thought-Retriever: Don't Just Retrieve Raw Data, Retrieve Thoughts for Memory-Augmented Agentic Systems¶

摘要¶

大语言模型虽已具备强大内部能力，但仍然难以有效整合海量外部知识。传统检索增强 LLM 仅能从外部知识库中检索 top-K 原始数据块，受限于上下文长度。本文提出 Thought-Retriever，一种新颖的模型无关算法，帮助 LLM 在不受上下文长度或检索数据块数量约束的情况下，基于任意长的外部数据生成输出。其核心思想是让 LLM 充分利用解决历史用户查询时生成的中间响应（思想），过滤无意义和冗余的思想，在思想记忆中组织它们，并在处理新查询时检索相关思想。这有效地为基于 LLM 的 Agent 配备了自我进化的长期记忆。

核心贡献¶

思想记忆（Thought Memory）：将 LLM 的中间响应（思想）作为记忆单元，比原始数据块更具信息密度和语义相关性
自我进化机制：证明 Thought-Retriever 可帮助 LLM 在解决更多用户查询后实现自我进化
深度思想利用：学习利用更深层的思想来回答更抽象的用户查询
学术评估基准 AcademicEval：构建了需要 LLM 利用超长上下文回答真实学术论文查询的评估基准
显著性能提升：在多个任务上平均 F1 分数提升至少 7.6%，胜率提升 16%

为什么重要¶

Thought-Retriever 突破了传统 RAG 的核心瓶颈——上下文长度限制。通过将 LLM 的中间推理过程作为记忆内容，实现了：

无限上下文：不再受限于 LLM 的上下文窗口
自我进化：记忆随使用不断优化，而非静态存储
语义浓缩：思想比原始数据更富含语义信息

这为构建真正意义的学习型 Agent 提供了新范式。

与移动端/端侧相关性¶

端侧知识管理：移动端 Agent 可利用思想记忆管理本地知识库
增量学习：思想记忆支持在边缘设备上持续学习
资源受限场景：思想压缩比原始数据更适合存储受限的移动设备
隐私保护：本地生成的思想比原始数据更适合保留在设备上

Thought-Retriever: Don't Just Retrieve Raw Data, Retrieve Thoughts for Memory-Augmented Agentic Systems¶

摘要¶

核心贡献¶

为什么重要¶

与移动端/端侧相关性¶

相关论文¶