**FrontierSmith:大规模合成开放式编程问题**

_FrontierSmith: Synthesizing Open-Ended Coding Problems at Scale_

> 论文介绍了一个名为 FrontierSmith 的自动化系统,旨在解决大型语言模型(LLM)在开放式编程任务上的不足。该系统能够从现有的封闭式编程任务(如竞赛题)出发,通过改变目标、限制输出和泛化输入等方式,大规模合成开放式编程问题。实验表明,使用这些合成数据进行训练,显著提升了 Qwen3.5 系列模型在开放式编程基准测试上的性能,例如 Qwen3.5-9B 在 FrontierCS 基准上得分提升了 8.82 分。研究指出,封闭式问题可以作为生成长期编程训练数据的实用起点。

**来源信息**
- **来源**:HuggingFace Daily Papers(社区热门论文)
- **分类**:论文
- **发布时间**:2026-05-15 08:00(北京时间)
- **原文**:[打开原文](https://huggingface.co/papers/2605.14445)