**参数化CAD基准测试:评估AI智能体设计可编辑3D机械零件的能力**

_Parametric CAD Bench_

> 一个针对AI智能体的新基准测试‘Parametric CAD Bench’被提出,用于评估其从自然语言描述中设计可编辑FreeCAD模型的能力。该测试采用多步智能体循环和严格的‘可编辑性关卡’,确保模型生成的是功能性工程蓝图而非静态3D形状。初步结果显示,通过Codex运行的GPT-5.5以0.832分领先,并存在显著的‘工具效应’:固定模型时更换驱动工具可导致分数上下浮动约10%。单次任务成本在3美元至170美元之间,性价比差异显著。该基准测试对于推动AI在工程设计领域的应用具有重要价值。

**来源信息**
- **来源**:Hacker News:AI 热帖
- **分类**:论文
- **发布时间**:2026-05-15 05:32(北京时间)
- **原文**:[打开原文](https://cadbench.ai/news/parametric-cad-bench)