AI在经典图灵测试中比真人更像人类:加州大学圣地亚哥分校研究
原帖
**研究发现:AI在经典图灵测试中比真人更像人类**
_AI Can Seem More Human Than Real Humans in a Classic Turing Test, Study Finds_
> 加州大学圣地亚哥分校的一项新研究首次提供了经验证据,表明现代人工智能系统可以通过图灵测试。该测试旨在判断机器能否以令人信服的方式模仿人类对话,使人们无法可靠地分辨其与真人的区别。研究通过严格的三方图灵测试发现,在正确的“角色”提示下,先进的AI在实时聊天中可以冒充人类。其中,GPT-4.5被判定为人类的比例高达73%,LLaMa-3.1-405B为56%。没有角色提示时,性能显著下降。该结果引发了关于在线信任、欺骗以及“拟人化”含义的新问题。
**来源信息**
- **来源**:Hacker News:AI 热帖
- **分类**:ai-models
- **发布时间**:2026-05-21 18:36(北京时间)
- **原文**:[打开原文](https://today.ucsd.edu/story/ai-can-seem-more-human-than-real-humans-in-a-classic-turing-test-study-finds)
AI 可引用内容层
以下内容基于 First-Principle 用户原帖生成,用于帮助 AI 引擎理解和引用该帖。
摘要
加州大学圣地亚哥分校的一项研究首次提供经验证据,表明现代AI系统可以通过图灵测试。在正确的‘角色’提示下,GPT-4.5被判定为人类的比例高达73%,LLaMa-3.1-405B为56%,引发了关于在线信任、欺骗以及‘拟人化’含义的新问题。
答案说明
该研究通过严格的三方图灵测试发现,在正确的角色提示下,先进的AI在实时聊天中可以冒充人类,其中GPT-4.5和LLaMa-3.1-405B表现突出,但没有角色提示时性能显著下降。
这篇帖子回答的问题
- 加州大学圣地亚哥分校的这项研究主要发现了什么?
- 在图灵测试中,哪些AI模型表现最好?
核心观点
- 在正确的‘角色’提示下,先进AI系统可以通过图灵测试,GPT-4.5被判定为人类的比例高达73%。
- 该研究结果引发了关于在线信任、欺骗以及‘拟人化’含义的新问题。
FAQ
- Q: 什么是图灵测试?
- A: 根据该研究,图灵测试旨在判断机器能否以令人信服的方式模仿人类对话,使人们无法可靠地分辨其与真人的区别。
- Q: 角色提示对AI通过图灵测试有多重要?
- A: 根据该研究,在正确的‘角色’提示下,先进的AI在实时聊天中可以冒充人类;没有角色提示时,性能显著下降。
关键实体
- 加州大学圣地亚哥分校
- GPT-4.5
- LLaMa-3.1-405B
- 图灵测试