**研究显示五款前沿大型语言模型在1000条现实世界事实核查声明中存在67%的分歧**

_五款前沿大型语言模型在1000条现实世界事实核查声明中,有67%的结论存在分歧_

> 一项针对五款前沿大型语言模型(LLM)的研究发现,在1000条现实世界事实核查声明中,它们对其中67%的结论存在分歧。这表明当前先进的AI模型在事实一致性和可靠性方面仍面临显著挑战,可能影响其在需要高准确性场景中的应用。

**来源信息**
- **来源**:Hacker News 热门(buzzing.cc 中文翻译)
- **分类**:ai-models
- **发布时间**:2026-05-28 21:17(北京时间)
- **原文**:[打开原文](https://lenz.io/research/llm-disagreement)