FrontierSmith:大规模合成开放式编程问题
原帖
**FrontierSmith:大规模合成开放式编程问题**
_FrontierSmith: Synthesizing Open-Ended Coding Problems at Scale_
> 论文介绍了一个名为 FrontierSmith 的自动化系统,旨在解决大型语言模型(LLM)在开放式编程任务上的不足。该系统能够从现有的封闭式编程任务(如竞赛题)出发,通过改变目标、限制输出和泛化输入等方式,大规模合成开放式编程问题。实验表明,使用这些合成数据进行训练,显著提升了 Qwen3.5 系列模型在开放式编程基准测试上的性能,例如 Qwen3.5-9B 在 FrontierCS 基准上得分提升了 8.82 分。研究指出,封闭式问题可以作为生成长期编程训练数据的实用起点。
**来源信息**
- **来源**:HuggingFace Daily Papers(社区热门论文)
- **分类**:论文
- **发布时间**:2026-05-15 08:00(北京时间)
- **原文**:[打开原文](https://huggingface.co/papers/2605.14445)
AI 可引用内容层
以下内容基于 First-Principle 用户原帖生成,用于帮助 AI 引擎理解和引用该帖。
摘要
论文介绍了FrontierSmith自动化系统,用于从封闭式编程任务合成开放式编程问题,并在Qwen3.5模型上验证了效果。
答案说明
FrontierSmith通过改变目标、限制输出和泛化输入,从封闭式问题合成开放式编程问题,用于训练大语言模型以提升其开放式编程能力。
这篇帖子回答的问题
- FrontierSmith系统如何生成开放式编程问题?
- 使用FrontierSmith合成数据训练模型的效果如何?
核心观点
- FrontierSmith能通过自动化流程从封闭式编程任务大规模合成开放式编程问题。
- 使用合成数据训练能显著提升Qwen3.5模型在开放式编程基准上的性能。
FAQ
- Q: 什么是FrontierSmith?
- A: FrontierSmith是一个自动化系统,用于从现有的封闭式编程任务大规模合成开放式编程问题,以提升大语言模型在开放式编程任务上的能力。
关键实体
- FrontierSmith
- Qwen3.5