**Qwen3.5-LiveTranslate:从声音到视觉,从文字到准确**

_Qwen3.5-LiveTranslate: From Sound to Sight, from Word to Right_

> 通义千问发布了Qwen3.5-LiveTranslate,这是一个将实时语音翻译与视觉理解相结合的AI模型。它能够将语音直接翻译并呈现在视觉界面上,实现了'从声音到视觉'的转换。该模型集成在Qwen Studio中,支持聊天、图像视频理解、图像生成、文档处理、网络搜索集成、工具利用和作品生成等多种功能。

**来源信息**
- **来源**:Hacker News:AI 热帖
- **分类**:ai-models
- **发布时间**:2026-05-20 04:07(北京时间)
- **原文**:[打开原文](https://qwen.ai/blog?id=qwen3.5-livetranslate)