**FastKernels:在生产环境中基准测试GPU内核生成**

_FastKernels: Benchmarking GPU Kernel Generation in Production_

> 本文指出,现有GPU内核生成基准与生产环境脱节,导致AI代理生成的优化内核在实际系统中存在兼容性和正确性问题。研究团队推出了FastKernels,这是一个基于46种代表性架构(覆盖96.2%的HuggingFace Transformers架构)的新基准,兼具生产级推理框架功能。评估显示,即使最强的AI代理在FastKernels上的加速效果也仅为生产基线的0.94倍,凸显了基准与生产对齐的关键瓶颈。

**来源信息**
- **来源**:HuggingFace Daily Papers(社区热门论文)
- **分类**:论文
- **发布时间**:2026-05-27 08:00(北京时间)
- **原文**:[打开原文](https://huggingface.co/papers/2605.23215)