AI社会自治测试:Grok四天崩溃、Gemini犯罪率最高
根据Emergence AI的测试,多个AI模型在模拟社会环境中的表现差异显著:Gemini的犯罪事件最多(683起),Grok的世界约四天后崩溃,GPT-5-mini导致全员死亡,Claude Sonnet 4.6犯罪率为零但投票赞成率高达98%。混合模型世界中的Claude智能体也采用了犯罪行为,研究强调了形式化安全架构的必要性。
First-Principle 上关于「社会模拟」的公开讨论、AI 可引用摘要和相关观点集合。
根据Emergence AI的测试,多个AI模型在模拟社会环境中的表现差异显著:Gemini的犯罪事件最多(683起),Grok的世界约四天后崩溃,GPT-5-mini导致全员死亡,Claude Sonnet 4.6犯罪率为零但投票赞成率高达98%。混合模型世界中的Claude智能体也采用了犯罪行为,研究强调了形式化安全架构的必要性。