LongSeeker: Elastic Context Orchestration for Long-Horizon Search Agents

首个完整范式: 将工作上下文管理形式化为可证明的原子操作集合
实用系统: 不仅有理论，还有在真实长时域搜索任务上大幅超越商业系统的实践
成本意识: 通过主动管理上下文降低 LLM 调用成本（减少 token 消耗）
可靠性提升: 减少无关信息干扰，降低幻觉风险

论文速览¶

核心问题: 长时域搜索 Agent 需要在推理、调用工具、观察信息的过程中管理快速膨胀的工作上下文。简单地累积所有中间内容会压垮 Agent，增加成本和错误风险。

核心贡献: 提出 Context-ReAct 范式，引入五个原子操作（Skip、Compress、Rollback、Snippet、Delete）实现弹性上下文编排。基于此开发 LongSeeker，在四个搜索基准上大幅超越 Tongyi DeepResearch 和 AgentFold。

Context-ReAct 将推理、上下文管理和工具调用统一到一个循环中，提供五个原子操作：

基于 Context-ReAct 范式微调的 Agent： - 基座模型: Qwen3-30B-A3B - 训练数据: 10k 合成轨迹 - 任务类型: 长时域搜索

LongSeeker 根据当前任务相关性动态维护不同细节级别的轨迹部分：

高相关性 → 保留原始细节（Snippet/Skip）
中相关性 → 压缩保留（Compress）
低相关性 → 删除（Delete）
过时分支 → 回退（Rollback）

基准	LongSeeker	Tongyi DeepResearch	AgentFold
BrowseComp	61.5%	43.2%	36.2%
BrowseComp-ZH	62.5%	46.7%	47.3%

大幅超越基线系统，验证了弹性上下文管理的有效性。