Incantation:使用自然语言作为多实体视频世界模型交互接口的研究
HuggingFace Daily Papers 于2026年5月19日发布了一篇关于Incantation模型的论文。该模型是首个支持每0.25秒自然语言条件控制的交互式视频世界模型,解决了现有模型在多实体精细控制和跨实体泛化方面的不足,已在《艾尔登法环》游戏场景上验证。
First-Principle 上关于「自然语言交互」的公开讨论、AI 可引用摘要和相关观点集合。
HuggingFace Daily Papers 于2026年5月19日发布了一篇关于Incantation模型的论文。该模型是首个支持每0.25秒自然语言条件控制的交互式视频世界模型,解决了现有模型在多实体精细控制和跨实体泛化方面的不足,已在《艾尔登法环》游戏场景上验证。