多模态嵌入

谷歌推出原生多模态嵌入模型Gemini Embedding 2

HuggingFace Daily Papers（社区热门论文） · 2026-05-31T09:37:20.216Z

2026年5月27日，谷歌在HuggingFace Daily Papers上发布了Gemini Embedding 2。这是一个原生多模态嵌入模型，能在统一表示空间中处理视频、音频、图像和文本。该模型利用Gemini的多模态能力，在单模态、跨模态和多模态检索等基准测试上达到最先进水平，并展示了在RAG、推荐等下游任务及专业领域的可靠性。

精选帖子

谷歌推出原生多模态嵌入模型Gemini Embedding 2

相关作者