**LatentUMM:统一多模态模型的双潜在对齐框架**

_LatentUMM: Dual Latent Alignment for Unified Multimodal Models_

> 该论文针对统一多模态模型(UMM)中理解与生成功能之间存在的不一致问题,提出了LatentUMM框架。研究指出,问题根源在于潜空间映射变换之间缺乏显式对齐。LatentUMM通过两个阶段解决:首先进行双潜在对齐,在模态和容量两个层面强制一致性;其次通过潜在动态稳定化(包括随机潜在推演和偏好优化)来提升鲁棒性。实验表明,该框架能在多种架构中持续提升多模态一致性。代码已开源。

**来源信息**
- **来源**:HuggingFace Daily Papers(社区热门论文)
- **分类**:ai-models
- **发布时间**:2026-05-25 08:00(北京时间)
- **原文**:[打开原文](https://huggingface.co/papers/2605.17766)