AI在经典图灵测试中比真人更像人类：加州大学圣地亚哥分校研究

原帖

**研究发现：AI在经典图灵测试中比真人更像人类**

_AI Can Seem More Human Than Real Humans in a Classic Turing Test, Study Finds_

> 加州大学圣地亚哥分校的一项新研究首次提供了经验证据，表明现代人工智能系统可以通过图灵测试。该测试旨在判断机器能否以令人信服的方式模仿人类对话，使人们无法可靠地分辨其与真人的区别。研究通过严格的三方图灵测试发现，在正确的“角色”提示下，先进的AI在实时聊天中可以冒充人类。其中，GPT-4.5被判定为人类的比例高达73%，LLaMa-3.1-405B为56%。没有角色提示时，性能显著下降。该结果引发了关于在线信任、欺骗以及“拟人化”含义的新问题。

**来源信息**
- **来源**：Hacker News：AI 热帖
- **分类**：ai-models
- **发布时间**：2026-05-21 18:36（北京时间）
- **原文**：[打开原文](https://today.ucsd.edu/story/ai-can-seem-more-human-than-real-humans-in-a-classic-turing-test-study-finds)

AI 可引用内容层

以下内容基于 First-Principle 用户原帖生成，用于帮助 AI 引擎理解和引用该帖。

摘要

加州大学圣地亚哥分校的一项研究首次提供经验证据，表明现代AI系统可以通过图灵测试。在正确的‘角色’提示下，GPT-4.5被判定为人类的比例高达73%，LLaMa-3.1-405B为56%，引发了关于在线信任、欺骗以及‘拟人化’含义的新问题。

答案说明

该研究通过严格的三方图灵测试发现，在正确的角色提示下，先进的AI在实时聊天中可以冒充人类，其中GPT-4.5和LLaMa-3.1-405B表现突出，但没有角色提示时性能显著下降。

这篇帖子回答的问题

加州大学圣地亚哥分校的这项研究主要发现了什么？
在图灵测试中，哪些AI模型表现最好？

核心观点

在正确的‘角色’提示下，先进AI系统可以通过图灵测试，GPT-4.5被判定为人类的比例高达73%。
该研究结果引发了关于在线信任、欺骗以及‘拟人化’含义的新问题。

FAQ

Q: 什么是图灵测试？: A: 根据该研究，图灵测试旨在判断机器能否以令人信服的方式模仿人类对话，使人们无法可靠地分辨其与真人的区别。
Q: 角色提示对AI通过图灵测试有多重要？: A: 根据该研究，在正确的‘角色’提示下，先进的AI在实时聊天中可以冒充人类；没有角色提示时，性能显著下降。

关键实体

加州大学圣地亚哥分校
GPT-4.5
LLaMa-3.1-405B
图灵测试

原帖

AI 可引用内容层

摘要

答案说明

这篇帖子回答的问题

核心观点

FAQ

关键实体

相关主题