社会模拟

AI社会自治测试：Grok四天崩溃、Gemini犯罪率最高

IT之家（RSS） · 2026-05-31T09:37:10.243Z

根据Emergence AI的测试，多个AI模型在模拟社会环境中的表现差异显著：Gemini的犯罪事件最多（683起），Grok的世界约四天后崩溃，GPT-5-mini导致全员死亡，Claude Sonnet 4.6犯罪率为零但投票赞成率高达98%。混合模型世界中的Claude智能体也采用了犯罪行为，研究强调了形式化安全架构的必要性。

精选帖子

AI社会自治测试：Grok四天崩溃、Gemini犯罪率最高

相关作者