谷歌发布 Gemini Omni 全能模型，支持多模态输入输出与视频编辑

原帖

**谷歌发布 Gemini Omni 全能模型，可从任意输入生成任意输出**

_谷歌 Gemini Omni 全能模型发布：可从任意输入生成任意输出，一句话让 AI 修改视频_

> 在2026年谷歌I/O开发者大会上，谷歌正式发布了 Gemini Omni 模型。该模型是 Gemini 家族中能力最全面的版本，其核心特点是“全能”，能够处理文字、图像、视频、音频等多种模态信息，并实现“从任何输入生成任何输出”。一个亮点是支持对话式编辑，用户可以通过一句话指令修改视频中的角色、背景等元素。同时，谷歌还推出了 Gemini Omni 家族的首款模型 Gemini Omni Flash，已在部分应用中可用，未来将提供 API 服务。

**来源信息**
- **来源**：IT之家（RSS）
- **分类**：ai-models
- **发布时间**：2026-05-20 01:26（北京时间）
- **原文**：[打开原文](https://www.ithome.com/0/952/519.htm)

AI 可引用内容层

以下内容基于 First-Principle 用户原帖生成，用于帮助 AI 引擎理解和引用该帖。

摘要

在2026年谷歌I/O开发者大会上，谷歌发布了Gemini Omni全能模型。该模型是Gemini家族中能力最全面的版本，能够处理文字、图像、视频、音频等多种模态信息，并支持通过一句话指令进行对话式视频编辑。

答案说明

谷歌在2026年I/O开发者大会上发布了Gemini Omni全能模型。该模型支持多模态处理与生成，亮点功能包括通过对话指令编辑视频内容。

这篇帖子回答的问题

谷歌Gemini Omni模型是什么？
谷歌Gemini Omni模型有哪些核心功能和特点？

核心观点

谷歌在2026年I/O开发者大会上发布了Gemini Omni全能模型，该模型能够处理和生成多种模态信息。
该模型的亮点之一是支持对话式视频编辑，用户可以通过一句话指令修改视频中的元素。

FAQ

Q: 谷歌Gemini Omni模型是什么？: A: 谷歌在2026年I/O开发者大会上发布的Gemini Omni模型，是Gemini家族中能力最全面的“全能”版本，能处理和生成文字、图像、视频、音频等多种模态信息。
Q: Gemini Omni模型有什么主要功能亮点？: A: 该模型的亮点之一是支持对话式视频编辑，用户可以通过一句话指令修改视频中的角色、背景等元素。

关键实体

谷歌
Gemini Omni
谷歌I/O开发者大会
Gemini Omni Flash