**ExploitBench:评估LLM在真实世界V8引擎漏洞利用能力的新基准**

_Exploitbench_

> ExploitBench是一个新的基准测试,旨在评估前沿大语言模型在生产级JavaScript引擎(V8)中进行全控制漏洞利用合成的能力。该基准通过16项能力指标和多轮打乱布局评分来衡量模型在“利用阶梯”上能攀升多高。项目由卡内基梅隆大学博士生Seunghyun Lee(Xion)发起,他是2024年和2025年Chrome VRP排名第一的研究员,在V8引擎中发现20多个CVE,拥有极高的专业信誉。

**来源信息**
- **来源**:Hacker News:AI 热帖
- **分类**:ai-models
- **发布时间**:2026-05-16 00:17(北京时间)
- **原文**:[打开原文](https://exploitbench.ai/)