**ETCHR:通过编辑澄清与驾驭推理**

_ETCHR: Editing To Clarify and Harness Reasoning_

> 针对多模态大语言模型在视觉推理中纯文本思维链的局限性,该论文提出了ETCHR(Editing To Clarify and Harness Reasoning)。这是一个与理解模型解耦的、问题条件化、推理感知的图像编辑器,旨在解决现有图像编辑器作为推理助手时存在的语言端与生成端差距。通过两阶段训练方法,ETCHR能在不同MLLM(如Qwen3-VL-8B、Gemini-3.1-Flash-Lite、Kimi K2.5)上以无训练方式显著提升多个视觉推理任务的准确率。

**来源信息**
- **来源**:HuggingFace Daily Papers(社区热门论文)
- **分类**:论文
- **发布时间**:2026-05-25 08:00(北京时间)
- **原文**:[打开原文](https://huggingface.co/papers/2605.23897)