Token注意力

该论文研究指出，文本到视频生成等条件扩散模型中，因训练数据分布偏差和交叉注意力空间错位，常忽略语义重要的Token，导致生成结果偏差。为此，论文提出了DARE统一框架，包含分布感知校正（DR-CFG）和空间表示对齐（SRA）两部分，旨在提升生成保真度和语义对齐性。

精选帖子