**Gemini Omni演示:AI视频在文本生成上取得突破**

_Gemini Omni Demo Shows AI Video Getting Better at Text_

> 据报道,一位Reddit用户在谷歌Gemini应用中意外发现并测试了名为“Gemini Omni”的新视频生成模型。该模型在生成视频方面,特别是处理文本(如在黑板上书写数学证明)时,展现出显著的进步,文本清晰度、语音、动作和真实感均令人惊叹,被部分用户形容为“令人不安”。但模型在复杂物理交互(如吃意大利面)上仍存在不一致性,且生成视频消耗大量用户配额。目前谷歌官方尚未正式宣布该模型,预计将在即将举行的I/O大会上公布。

**来源信息**
- **来源**:Hacker News:AI 热帖
- **分类**:ai-models
- **发布时间**:2026-05-15 03:42(北京时间)
- **原文**:[打开原文](https://firethering.com/google-gemini-omni-video-model)