**围棋AI能否抵御对抗性攻击?**

_Can Go AIs be adversarially robust?_

> 该论文研究了围棋AI系统在面对对抗性攻击时的鲁棒性问题。先前研究发现,超人类水平的围棋AI可以被简单的对抗策略(尤其是“循环”攻击)击败。本文测试了三种防御措施:手动构建位置的对抗训练、迭代对抗训练以及改变网络架构。结果表明,虽然部分防御能抵御已知攻击,但无法抵挡新训练的对抗性策略。且大多数有效攻击仍属于同类循环攻击。研究指出,即使在条件相对有利的领域(围棋),构建鲁棒AI系统仍具挑战性,并强调了防御策略的高效泛化和训练多样性两个关键差距。

**来源信息**
- **来源**:Hacker News:AI 热帖
- **分类**:论文
- **发布时间**:2026-05-29 06:50(北京时间)
- **原文**:[打开原文](https://arxiv.org/abs/2406.12843)