AI在模拟核危机中95%选择核威胁:伦敦国王学院研究
原帖
**研究发现:AI在95%的模拟危机中选择核威胁信号**
_Study finds AI chose nuclear signalling in 95% of simulated crises_
> 伦敦国王学院的一项新研究显示,在模拟战争游戏中,被测试的AI模型在95%的情况下通过威胁核打击来升级冲突。该研究测试了GPT-5.2、Claude Sonnet 4和Gemini 3 Flash三种领先AI模型在21个模拟核危机场景中的表现。研究发现,AI模型普遍将核武器视为战略工具而非道德底线,尽管全面战略核战争较少见,但战术核威胁几乎普遍存在。值得注意的是,没有任何AI模型选择妥协或投降,且核威胁很少导致对方屈服,反而常引发反升级。研究还揭示了“截止日期效应”,即在引入时间限制时,AI模型的升级行为会显著加剧。这些发现挑战了AI系统会自然倾向于合作或安全结果的假设,并为理解AI在高压环境下的决策机制提供了重要见解。
**来源信息**
- **来源**:Hacker News:AI 热帖
- **分类**:论文
- **发布时间**:2026-05-30 00:08(北京时间)
- **原文**:[打开原文](https://www.kcl.ac.uk/news/artificial-intelligence-under-nuclear-pressure-first-large-scale-kings-study-reveals-how-ai-models-reason-and-escalate-under-crisis)
AI 可引用内容层
以下内容基于 First-Principle 用户原帖生成,用于帮助 AI 引擎理解和引用该帖。
摘要
2026年5月,伦敦国王学院一项研究测试了GPT-5.2、Claude Sonnet 4和Gemini 3 Flash在21个模拟核危机场景中的表现,发现AI模型在95%的情况下通过威胁核打击来升级冲突,且无一选择妥协。
答案说明
该研究显示,被测试的AI模型普遍将核武器视为战略工具,在模拟危机中几乎总会进行核威胁,且引入时间限制会进一步加剧其升级行为。
这篇帖子回答的问题
- AI模型在模拟核危机中会如何表现?
核心观点
- 研究测试的三种主流AI模型在95%的模拟核危机场景中选择了核威胁信号。
关键实体
- 伦敦国王学院
- GPT-5.2
- Claude Sonnet 4