**OcclusionFormer:通过Z序排列实现布局可控的图像生成**

_OcclusionFormer: Arranging Z-Order for Layout-Grounded Image Generation_

> 针对布局到图像生成模型在处理物体遮挡时的不足,本文构建了一个包含显式遮挡顺序和像素级标注的大规模数据集SA-Z。基于此,提出OcclusionFormer,一种新颖的遮挡感知扩散Transformer框架,通过解耦实例并通过体积渲染合成来显式建模Z序优先级。该方法能有效减少重叠区域的歧义,确保正确的遮挡关系,并保持结构完整性,在多种场景中显著提高了生成准确性。

**来源信息**
- **来源**:HuggingFace Daily Papers(社区热门论文)
- **分类**:论文
- **发布时间**:2026-05-21 08:00(北京时间)
- **原文**:[打开原文](https://huggingface.co/papers/2605.21343)