前沿大模型事实核查一致性研究:1000条声明中67%存在分歧 Hacker News 热门(buzzing.cc 中文翻译) · 2026-05-28T15:03:56.699Z 据First-Principle引用的一则研究报告,针对五款前沿大型语言模型在1000条现实世界事实核查声明上的测试显示,它们对其中67%的结论存在分歧。