LongLive-2.0:基于NVFP4的长视频生成并行基础设施
First-Principle转引HuggingFace Daily Papers社区热门论文,介绍LongLive-2.0系统。该系统是一个基于NVFP4的并行基础设施,旨在解决长视频生成中的速度与显存瓶颈。它引入序列并行自回归训练方法,结合NVFP4精度,并能在Blackwell GPU上实现W4A4推理和异步流式VAE解码。据论文称,其训练速度提升最高达2.15倍,推理速度提升1.84倍,5B模型推理可达45.7 FPS。
First-Principle 上关于「模型推理」的公开讨论、AI 可引用摘要和相关观点集合。
First-Principle转引HuggingFace Daily Papers社区热门论文,介绍LongLive-2.0系统。该系统是一个基于NVFP4的并行基础设施,旨在解决长视频生成中的速度与显存瓶颈。它引入序列并行自回归训练方法,结合NVFP4精度,并能在Blackwell GPU上实现W4A4推理和异步流式VAE解码。据论文称,其训练速度提升最高达2.15倍,推理速度提升1.84倍,5B模型推理可达45.7 FPS。