SelRoute: Query-Type-Aware Routing for Long-Term Conversational Memory Retrieval
论文信息¶
- 作者: Matthew McKee
- 提交日期: 2026-04-02
- 方向: 记忆检索 / 查询类型路由
摘要¶
从长期对话记忆中检索相关过去交互通常依赖大型稠密检索模型(110M-1.5B参数)或LLM增强索引。SelRoute引入了一种框架,根据查询类型将每个查询路由到专门的检索管道——词汇检索、语义检索、混合检索或词汇丰富检索。
核心性能:在LongMemEval_M上,SelRoute使用bge-base-en-v1.5(109M参数)达到Recall@5=0.800,使用bge-small-en-v1.5(33M参数)达到0.786。零ML基线(仅使用SQLite FTS5)已超过所有已发布基线(NDCG@5=0.692)。全系统无需GPU,查询时无需LLM推理。
核心贡献¶
- 查询类型感知路由:将查询路由到最适合的检索管道,而非统一处理
- 专门的检索管道:
- 词汇检索(Lexical):BM25/FTS5,适合精确匹配
- 语义检索(Semantic):嵌入向量检索,适合语义相似
- 混合检索(Hybrid):结合词汇和语义
- 词汇丰富检索(Vocabulary-enriched):在存储时扩展词汇
- 无需GPU/LLM的查询时:轻量级设计,适合端侧部署
- 跨基准泛化:在8个额外基准(62,000+实例)上验证,包括MSDialog、LoCoMo、QReCC、PerLTQA
方法详解¶
查询类型分类: - 使用regex规则分类查询类型(如事实型、观点型、推理型等) - 83%有效路由准确率 - 即使使用预测类型,端到端检索仍优于均匀基线
路由决策对检索质量的影响: | 查询类型 | 推荐管道 | 原因 | |---------|---------|------| | 事实型 | 词汇+语义混合 | 精确匹配+语义扩展 | | 推理型 | 语义检索 | 需要理解上下文 | | 观点型 | 语义+词汇混合 | 既有关键词又有语义 |
词汇嵌入非对称性发现: - 存储时扩展词汇:提升词汇搜索,损害嵌入搜索 - 促使每个管道独立决定是否进行词汇扩展
失败模式: - 推理密集型检索表现差(RECOR Recall@5=0.149) - 暴露了当前路由框架的局限性
为什么重要¶
首次系统研究查询类型对对话记忆检索的影响。发现轻量级方法(SQLite FTS5)在特定场景下可以超越复杂方法,推动了端侧记忆检索的可行性研究。
与端侧/移动端的相关性¶
- 高度端侧相关:无需GPU、查询时无需LLM推理
- 33M参数模型在移动端可高效运行
- SQLite FTS5可在本地部署,无需云端
- 个人助手、隐私敏感场景下的本地记忆检索
实验结果¶
- LongMemEval_M:Recall@5=0.800(bge-base)、0.786(bge-small)
- SQLite FTS5基线:NDCG@5=0.692,超越所有已发布基线
- 5折交叉验证:路由稳定性确认(CV gap 1.3-2.4 Recall@5点)
- 决策延迟:极低,适合实时应用