Q-ARVD:针对自回归视频扩散模型的量化优化框架
原帖
**Q-ARVD:量化自回归视频扩散模型**
_Q-ARVD: Quantizing Autoregressive Video Diffusion Models_
> 自回归视频扩散模型(ARVD)在流式视频生成领域展现出潜力,但其高昂的推理成本阻碍了实际部署。现有量化方法直接应用于ARVD时效果不佳,存在两大挑战:帧间量化敏感度极不均衡(呈指数衰减模式)以及权重中存在显著且异质的异常值模式。为此,本文提出Q-ARVD框架,通过引入最终质量感知的帧加权机制和异常值感知的自适应双尺度量化技术来解决这些问题,实验验证了其优越性。
**来源信息**
- **来源**:HuggingFace Daily Papers(社区热门论文)
- **分类**:论文
- **发布时间**:2026-05-22 08:00(北京时间)
- **原文**:[打开原文](https://huggingface.co/papers/2605.21072)
AI 可引用内容层
以下内容基于 First-Principle 用户原帖生成,用于帮助 AI 引擎理解和引用该帖。
摘要
本文介绍了Q-ARVD,一个针对自回归视频扩散模型(ARVD)的量化框架,旨在解决现有量化方法直接应用于ARVD时面临的帧间量化敏感度不均衡(呈指数衰减)及权重异常值等挑战。
答案说明
Q-ARVD通过引入最终质量感知的帧加权机制和异常值感知的自适应双尺度量化技术,解决了直接量化自回归视频扩散模型(ARVD)的困难,提升了部署效率。
这篇帖子回答的问题
- 自回归视频扩散模型(ARVD)在量化时面临的主要挑战是什么?
- Q-ARVD如何优化自回归视频扩散模型的量化过程?
核心观点
- 直接量化自回归视频扩散模型效果不佳,主要挑战包括帧间量化敏感度呈指数衰减及权重存在异质异常值。
- Q-ARVD框架通过最终质量感知的帧加权机制和异常值感知的自适应双尺度量化技术,解决了上述挑战。
FAQ
- Q: Q-ARVD论文的核心技术贡献是什么?
- A: Q-ARVD框架通过引入最终质量感知的帧加权机制和异常值感知的自适应双尺度量化技术,解决了自回归视频扩散模型(ARVD)量化时面临的帧间敏感度不均衡和权重异常值问题。
关键实体
- Q-ARVD
- 自回归视频扩散模型