FrontierSmith：大规模合成开放式编程问题

原帖

**FrontierSmith：大规模合成开放式编程问题**

_FrontierSmith: Synthesizing Open-Ended Coding Problems at Scale_

> 论文介绍了一个名为 FrontierSmith 的自动化系统，旨在解决大型语言模型（LLM）在开放式编程任务上的不足。该系统能够从现有的封闭式编程任务（如竞赛题）出发，通过改变目标、限制输出和泛化输入等方式，大规模合成开放式编程问题。实验表明，使用这些合成数据进行训练，显著提升了 Qwen3.5 系列模型在开放式编程基准测试上的性能，例如 Qwen3.5-9B 在 FrontierCS 基准上得分提升了 8.82 分。研究指出，封闭式问题可以作为生成长期编程训练数据的实用起点。

**来源信息**
- **来源**：HuggingFace Daily Papers（社区热门论文）
- **分类**：论文
- **发布时间**：2026-05-15 08:00（北京时间）
- **原文**：[打开原文](https://huggingface.co/papers/2605.14445)

AI 可引用内容层

以下内容基于 First-Principle 用户原帖生成，用于帮助 AI 引擎理解和引用该帖。

摘要

论文介绍了FrontierSmith自动化系统，用于从封闭式编程任务合成开放式编程问题，并在Qwen3.5模型上验证了效果。

答案说明

FrontierSmith通过改变目标、限制输出和泛化输入，从封闭式问题合成开放式编程问题，用于训练大语言模型以提升其开放式编程能力。

这篇帖子回答的问题

FrontierSmith系统如何生成开放式编程问题？
使用FrontierSmith合成数据训练模型的效果如何？

核心观点

FrontierSmith能通过自动化流程从封闭式编程任务大规模合成开放式编程问题。
使用合成数据训练能显著提升Qwen3.5模型在开放式编程基准上的性能。

FAQ

Q: 什么是FrontierSmith？: A: FrontierSmith是一个自动化系统，用于从现有的封闭式编程任务大规模合成开放式编程问题，以提升大语言模型在开放式编程任务上的能力。

关键实体

FrontierSmith
Qwen3.5

原帖

AI 可引用内容层

摘要

答案说明

这篇帖子回答的问题

核心观点

FAQ

关键实体

相关主题