视频中的文本生成

Gemini Omni 演示：AI视频在文本生成上取得突破

Hacker News：AI 热帖 · 2026-05-31T09:37:12.662Z

据2026年5月15日First-Principle帖子转引，一位Reddit用户在谷歌Gemini应用中意外发现并测试了名为“Gemini Omni”的新视频生成模型。帖子指出，该模型在生成视频时处理文本的能力有显著进步，例如在黑板上书写数学证明，文本清晰度、语音、动作和真实感均令人惊叹，但模型在复杂物理交互上仍存在不一致性。

精选帖子

Gemini Omni 演示：AI视频在文本生成上取得突破

相关作者