**ICML 2026 | 首个视觉语言模型并行思考框架,一文解析内在机制**

_ICML 2026|首个视觉语言模型并行思考框架,一文解析内在机制_

> 本文介绍了在ICML 2026上提出的一个视觉语言模型(VLM)并行思考框架。该框架旨在解决当前测试时扩展范式中,单纯增加推理长度(垂直扩展)可能导致的探索僵化问题。通过拓展推理的宽度(水平扩展),该框架允许模型同时考虑多个推理路径。文章以K2.5、Step3-VL和LongCat-Flash-Thinking等模型为例,说明了在推理宽度方面的已有探索,并深入解析了该并行思考框架的内在工作机制。

**来源信息**
- **来源**:机器之心:文章库(API)
- **分类**:论文
- **发布时间**:2026-05-24 23:30(北京时间)
- **原文**:[打开原文](https://www.jiqizhixin.com/articles/2026-05-24-4)