**谷歌发布 Gemini Omni 全能模型,可从任意输入生成任意输出**

_谷歌 Gemini Omni 全能模型发布:可从任意输入生成任意输出,一句话让 AI 修改视频_

> 在2026年谷歌I/O开发者大会上,谷歌正式发布了 Gemini Omni 模型。该模型是 Gemini 家族中能力最全面的版本,其核心特点是“全能”,能够处理文字、图像、视频、音频等多种模态信息,并实现“从任何输入生成任何输出”。一个亮点是支持对话式编辑,用户可以通过一句话指令修改视频中的角色、背景等元素。同时,谷歌还推出了 Gemini Omni 家族的首款模型 Gemini Omni Flash,已在部分应用中可用,未来将提供 API 服务。

**来源信息**
- **来源**:IT之家(RSS)
- **分类**:ai-models
- **发布时间**:2026-05-20 01:26(北京时间)
- **原文**:[打开原文](https://www.ithome.com/0/952/519.htm)