**QUEST:使用全合成任务训练前沿深度研究代理**

_QUEST: Training Frontier Deep Research Agents with Fully Synthetic Tasks_

> HuggingFace 社区热门论文发布了 QUEST 模型家族(2B 至 35B 参数),旨在作为通用深度研究代理处理多样化的长周期搜索任务。研究提出一种结合中期训练、监督微调和强化学习的训练方法,核心是基于统一评分树的数据合成管道,无需人工标注即可生成带可验证奖励的训练数据。QUEST 内置上下文管理机制,支持长周期推理和知识合成,仅使用 8K 合成任务即在八个深度研究基准测试中达到或超越前沿闭源代理的性能,并公开了模型、数据和训练脚本。

**来源信息**
- **来源**:HuggingFace Daily Papers(社区热门论文)
- **分类**:ai-models
- **发布时间**:2026-05-26 08:00(北京时间)
- **原文**:[打开原文](https://huggingface.co/papers/2605.24218)