AI基准测试审计

Hacker News：AI 热帖 · 2026-05-31T09:37:16.750Z

该arXiv论文提出BenchJack，一个自动化红队系统，用于系统性地审计AI智能体基准测试，发现并修复“奖励黑客”漏洞。研究总结了八种常见的缺陷模式，建立了智能体评估检查清单。

精选帖子