**可引导指令遵循编程数据合成与演员参数化模式协同进化**

_Steerable Instruction Following Coding Data Synthesis with Actor-Parametric Schema Co-Evolution_

> 本文提出IFCodeEvolve框架,通过蒙特卡洛树搜索采样和模式库的动态约束实例化,高效生成遵循人类指令的大规模编程数据。该框架实现演员模型与模式库的协同进化,使32B参数模型在编程任务上达到与专有前沿模型相当的性能,并发布了经过人工验证的基准数据集IFCodeBench。

**来源信息**
- **来源**:字节 Seed:Research Papers(网页内嵌数据)
- **分类**:论文
- **原文**:[打开原文](https://arxiv.org/pdf/2604.16322)