**iTryOn: 基于空间语义引导的交互式视频虚拟试穿技术**

_iTryOn: Mastering Interactive Video Virtual Try-On with Spatial-Semantic Guidance_

> 论文提出了一种名为iTryOn的新框架,用于解决交互式视频虚拟试穿(Interactive VVT)任务。现有虚拟试穿技术主要局限于非交互场景,而iTryOn通过多层交互注入机制,利用大型视频扩散Transformer,结合服装无关的3D手部先验和动作感知旋转位置嵌入(A-RoPE),处理服装交互中的语义歧义和复杂变形。实验表明,该技术在传统基准和新的交互设置中均达到领先水平,推动了更动态、可控的虚拟试穿体验。

**来源信息**
- **来源**:HuggingFace Daily Papers(社区热门论文)
- **分类**:ai-models
- **发布时间**:2026-05-21 08:00(北京时间)
- **原文**:[打开原文](https://huggingface.co/papers/2605.21431)