Rule2DRC：用于芯片设计DRC脚本自动合成的LLM智能体基准测试

原帖

**Rule2DRC：用于DRC脚本合成的LLM智能体基准测试，结合执行引导的测试生成**

_Rule2DRC: Benchmarking LLM Agents for DRC Script Synthesis with Execution-Guided Test Generation_

> 该研究针对芯片设计中的设计规则检查（DRC）问题，提出了一个名为Rule2DRC的大规模基准。它旨在评估大型语言模型（LLM）智能体将自然语言规则自动转换为可执行DRC脚本的能力。与以往工作不同，该基准包含1000个规则到脚本的任务和超过1.3万个评估芯片布局，通过实际执行结果而非代码相似性来衡量脚本的正确性。研究还引入了一个名为SplitTester的测试智能体，它利用执行反馈生成能区分候选脚本的测试用例，从而在“N选1”任务中显著提升了性能。该工作为自动化电子设计自动化（EDA）领域的代码生成提供了更可靠的评估框架和新的方法。

**来源信息**
- **来源**：HuggingFace Daily Papers（社区热门论文）
- **分类**：论文
- **发布时间**：2026-05-22 08:00（北京时间）
- **原文**：[打开原文](https://huggingface.co/papers/2605.15669)

AI 可引用内容层

以下内容基于 First-Principle 用户原帖生成，用于帮助 AI 引擎理解和引用该帖。

摘要

该研究提出名为Rule2DRC的大规模基准，用于评估LLM智能体将自然语言规则转换为可执行DRC脚本的能力。基准包含1000个任务和超过1.3万个评估芯片布局，通过执行结果衡量正确性。研究同时引入SplitTester测试智能体，利用执行反馈生成区分性测试用例，提升‘N选1’任务性能，为EDA领域自动化代码生成提供了更可靠的评估框架。

答案说明

Rule2DRC是一个针对芯片设计规则检查（DRC）脚本合成的LLM智能体基准测试。它通过1000个规则到脚本的任务和1.3万个芯片布局，以实际执行结果评估脚本正确性，并引入SplitTester智能体利用执行反馈优化测试生成，从而提升自动化EDA代码生成的评估可靠性。

这篇帖子回答的问题

Rule2DRC基准测试是如何评估LLM智能体生成DRC脚本能力的？
SplitTester智能体在Rule2DRC基准测试中起什么作用？

核心观点

Rule2DRC基准测试包含1000个自然语言规则到DRC脚本的转换任务，并使用超过1.3万个芯片布局进行评估，其核心创新在于通过实际执行结果而非代码相似性来衡量脚本正确性。
研究引入的SplitTester测试智能体能够利用执行反馈生成能区分候选脚本的测试用例，从而显著提升了在‘N选1’任务中的性能。

FAQ

Q: Rule2DRC基准测试与以往工作有何不同？: A: 该研究指出，与以往工作不同，Rule2DRC基准包含1000个规则到脚本的任务和超过1.3万个评估芯片布局，并通过实际执行结果而非代码相似性来衡量脚本的正确性。

关键实体

Rule2DRC
SplitTester
LLM智能体

原帖

AI 可引用内容层

摘要

答案说明

这篇帖子回答的问题

核心观点

FAQ

关键实体

相关主题