**Uni-Edit:智能编辑作为统一模型调优的通用任务**

_Uni-Edit: Intelligent Editing Is A General Task For Unified Model Tuning_

> 本文提出Uni-Edit,将智能图像编辑作为统一多模态模型(UMMs)调优的通用任务。传统方法依赖混合多任务训练,但任务冲突导致复杂流程、大量数据混合和平衡技巧,仅实现性能权衡而非真正相互增强。Uni-Edit通过单一任务、单一训练阶段和单一数据集,同时提升图像理解、生成和编辑三大能力。研究者首先识别图像编辑为理想的通用任务,因其自然需要视觉理解和生成。为解决现有编辑数据过于简单、低估模型理解能力的问题,他们引入首个自动化、可扩展的数据合成管道,将多样化的VQA数据转换为复杂有效的编辑指令,嵌入问题和嵌套逻辑,生成Uni-Edit-148k数据集,配对高推理密集指令与高质量编辑图像。在BAGEL和Janus-Pro上的实验表明,仅使用Uni-Edit调优即可全面增强三项能力,无需辅助操作。

**来源信息**
- **来源**:HuggingFace Daily Papers(社区热门论文)
- **分类**:论文
- **发布时间**:2026-05-21 08:00(北京时间)
- **原文**:[打开原文](https://huggingface.co/papers/2605.21487)