SelRoute: Query-Type-Aware Routing for Long-Term Conversational Memory Retrieval

论文信息¶

作者: Matthew McKee
提交日期: 2026-04-02
方向: 记忆检索 / 查询类型路由

摘要¶

从长期对话记忆中检索相关过去交互通常依赖大型稠密检索模型（110M-1.5B参数）或LLM增强索引。SelRoute引入了一种框架，根据查询类型将每个查询路由到专门的检索管道——词汇检索、语义检索、混合检索或词汇丰富检索。

核心性能：在LongMemEval_M上，SelRoute使用bge-base-en-v1.5（109M参数）达到Recall@5=0.800，使用bge-small-en-v1.5（33M参数）达到0.786。零ML基线（仅使用SQLite FTS5）已超过所有已发布基线（NDCG@5=0.692）。全系统无需GPU，查询时无需LLM推理。

核心贡献¶

查询类型感知路由：将查询路由到最适合的检索管道，而非统一处理
专门的检索管道：
词汇检索（Lexical）：BM25/FTS5，适合精确匹配
语义检索（Semantic）：嵌入向量检索，适合语义相似
混合检索（Hybrid）：结合词汇和语义
词汇丰富检索（Vocabulary-enriched）：在存储时扩展词汇
无需GPU/LLM的查询时：轻量级设计，适合端侧部署
跨基准泛化：在8个额外基准（62,000+实例）上验证，包括MSDialog、LoCoMo、QReCC、PerLTQA

方法详解¶

查询类型分类： - 使用regex规则分类查询类型（如事实型、观点型、推理型等） - 83%有效路由准确率 - 即使使用预测类型，端到端检索仍优于均匀基线

路由决策对检索质量的影响： | 查询类型 | 推荐管道 | 原因 | |---------|---------|------| | 事实型 | 词汇+语义混合 | 精确匹配+语义扩展 | | 推理型 | 语义检索 | 需要理解上下文 | | 观点型 | 语义+词汇混合 | 既有关键词又有语义 |

词汇嵌入非对称性发现： - 存储时扩展词汇：提升词汇搜索，损害嵌入搜索 - 促使每个管道独立决定是否进行词汇扩展

失败模式： - 推理密集型检索表现差（RECOR Recall@5=0.149） - 暴露了当前路由框架的局限性

为什么重要¶

首次系统研究查询类型对对话记忆检索的影响。发现轻量级方法（SQLite FTS5）在特定场景下可以超越复杂方法，推动了端侧记忆检索的可行性研究。

与端侧/移动端的相关性¶

高度端侧相关：无需GPU、查询时无需LLM推理
33M参数模型在移动端可高效运行
SQLite FTS5可在本地部署，无需云端
个人助手、隐私敏感场景下的本地记忆检索

实验结果¶

LongMemEval_M：Recall@5=0.800（bge-base）、0.786（bge-small）
SQLite FTS5基线：NDCG@5=0.692，超越所有已发布基线
5折交叉验证：路由稳定性确认（CV gap 1.3-2.4 Recall@5点）
决策延迟：极低，适合实时应用