**新基准测试证实AI视频生成器画面惊艳,但对世界运行逻辑的理解仍然不足**

_New benchmark confirms AI video generators look stunning but still can&\#039;t reason about the world_

> 一项名为WorldReasonBench的新基准测试,不再评估视频画面的清晰度,而是专注于测试AI视频生成模型在物理和逻辑合理性方面的能力。结果显示,字节跳动的Seedance 2.0领跑,领先于Veo 3.1和Sora 2。商业模型的得分大约是开源模型的两倍。逻辑推理是所有模型面临的最大短板。这表明,AI视频生成从“像素生成器”向真正的“世界模型”的跨越尚未实现。

**来源信息**
- **来源**:The Decoder:AI News(RSS)
- **分类**:ai-models
- **发布时间**:2026-05-16 18:55(北京时间)
- **原文**:[打开原文](https://the-decoder.com/new-benchmark-confirms-ai-video-generators-look-stunning-but-still-cant-reason-about-the-world)