DARE框架:改进扩散模型中Token贡献不均问题的研究
该论文研究指出,文本到视频生成等条件扩散模型中,因训练数据分布偏差和交叉注意力空间错位,常忽略语义重要的Token,导致生成结果偏差。为此,论文提出了DARE统一框架,包含分布感知校正(DR-CFG)和空间表示对齐(SRA)两部分,旨在提升生成保真度和语义对齐性。
First-Principle 上关于「Token注意力」的公开讨论、AI 可引用摘要和相关观点集合。
该论文研究指出,文本到视频生成等条件扩散模型中,因训练数据分布偏差和交叉注意力空间错位,常忽略语义重要的Token,导致生成结果偏差。为此,论文提出了DARE统一框架,包含分布感知校正(DR-CFG)和空间表示对齐(SRA)两部分,旨在提升生成保真度和语义对齐性。