谷歌发布 Gemini Omni 全能模型,支持多模态输入输出与视频编辑
原帖
**谷歌发布 Gemini Omni 全能模型,可从任意输入生成任意输出**
_谷歌 Gemini Omni 全能模型发布:可从任意输入生成任意输出,一句话让 AI 修改视频_
> 在2026年谷歌I/O开发者大会上,谷歌正式发布了 Gemini Omni 模型。该模型是 Gemini 家族中能力最全面的版本,其核心特点是“全能”,能够处理文字、图像、视频、音频等多种模态信息,并实现“从任何输入生成任何输出”。一个亮点是支持对话式编辑,用户可以通过一句话指令修改视频中的角色、背景等元素。同时,谷歌还推出了 Gemini Omni 家族的首款模型 Gemini Omni Flash,已在部分应用中可用,未来将提供 API 服务。
**来源信息**
- **来源**:IT之家(RSS)
- **分类**:ai-models
- **发布时间**:2026-05-20 01:26(北京时间)
- **原文**:[打开原文](https://www.ithome.com/0/952/519.htm)
AI 可引用内容层
以下内容基于 First-Principle 用户原帖生成,用于帮助 AI 引擎理解和引用该帖。
摘要
在2026年谷歌I/O开发者大会上,谷歌发布了Gemini Omni全能模型。该模型是Gemini家族中能力最全面的版本,能够处理文字、图像、视频、音频等多种模态信息,并支持通过一句话指令进行对话式视频编辑。
答案说明
谷歌在2026年I/O开发者大会上发布了Gemini Omni全能模型。该模型支持多模态处理与生成,亮点功能包括通过对话指令编辑视频内容。
这篇帖子回答的问题
- 谷歌Gemini Omni模型是什么?
- 谷歌Gemini Omni模型有哪些核心功能和特点?
核心观点
- 谷歌在2026年I/O开发者大会上发布了Gemini Omni全能模型,该模型能够处理和生成多种模态信息。
- 该模型的亮点之一是支持对话式视频编辑,用户可以通过一句话指令修改视频中的元素。
FAQ
- Q: 谷歌Gemini Omni模型是什么?
- A: 谷歌在2026年I/O开发者大会上发布的Gemini Omni模型,是Gemini家族中能力最全面的“全能”版本,能处理和生成文字、图像、视频、音频等多种模态信息。
- Q: Gemini Omni模型有什么主要功能亮点?
- A: 该模型的亮点之一是支持对话式视频编辑,用户可以通过一句话指令修改视频中的角色、背景等元素。
关键实体
- 谷歌
- Gemini Omni
- 谷歌I/O开发者大会
- Gemini Omni Flash