**Rule2DRC:用于DRC脚本合成的LLM智能体基准测试,结合执行引导的测试生成**

_Rule2DRC: Benchmarking LLM Agents for DRC Script Synthesis with Execution-Guided Test Generation_

> 该研究针对芯片设计中的设计规则检查(DRC)问题,提出了一个名为Rule2DRC的大规模基准。它旨在评估大型语言模型(LLM)智能体将自然语言规则自动转换为可执行DRC脚本的能力。与以往工作不同,该基准包含1000个规则到脚本的任务和超过1.3万个评估芯片布局,通过实际执行结果而非代码相似性来衡量脚本的正确性。研究还引入了一个名为SplitTester的测试智能体,它利用执行反馈生成能区分候选脚本的测试用例,从而在“N选1”任务中显著提升了性能。该工作为自动化电子设计自动化(EDA)领域的代码生成提供了更可靠的评估框架和新的方法。

**来源信息**
- **来源**:HuggingFace Daily Papers(社区热门论文)
- **分类**:论文
- **发布时间**:2026-05-22 08:00(北京时间)
- **原文**:[打开原文](https://huggingface.co/papers/2605.15669)