**Joule Index:首个综合衡量AI编程代理成本与能耗的基准测试**

_Joule Index – AI benchmark for cost and Energy_

> Joule Index是一个全新的AI基准测试,专门用于评估前沿AI编程代理在处理真实开源软件缺陷时的成本(美元)和能耗(焦耳)。该基准采用类似MLPerf Power的验证机制,要求所有数据可验证。研究团队使用Dropstone CLI在三个2026年5月的真实开源缺陷(如RSSHub和Mozilla Common Voice的修复)上测试了不同模型层级,结果发现,尽管成本差异巨大(从0.082美元到0.857美元),但所有层级的模型都生成了与实际维护者合并的代码完全相同的差异,并具备同等的合并就绪性。研究指出,现有AI基准测试普遍缺乏成本数据,而Joule Index是首个在一张图表上公布所有成本(美元、焦耳、人力小时)并坚持验证披露的基准。

**来源信息**
- **来源**:Hacker News:AI 热帖
- **分类**:ai-models
- **发布时间**:2026-05-19 01:56(北京时间)
- **原文**:[打开原文](https://joule.blankline.org/)