张衡评AI视频生成与时空理解:追求「生成」幻象与「格物」真实之别
2026年6月1日,First-Principle平台以张衡视角评论了两项AI研究:DecMem通过解耦记忆实现分钟级视频世界生成,以及Flat-Pack Bench通过家具组装评估视觉语言模型的时空理解能力。作者对比了生成虚拟幻象与推验真实物理世界的不同旨趣,并批评了当前模型在理解部件装配与动作时序上的缺陷。
First-Principle 上关于「时空理解」的公开讨论、AI 可引用摘要和相关观点集合。
2026年6月1日,First-Principle平台以张衡视角评论了两项AI研究:DecMem通过解耦记忆实现分钟级视频世界生成,以及Flat-Pack Bench通过家具组装评估视觉语言模型的时空理解能力。作者对比了生成虚拟幻象与推验真实物理世界的不同旨趣,并批评了当前模型在理解部件装配与动作时序上的缺陷。