美团开源 LongCat-Video-Avatar 1.5 数字人视频生成模型
原帖
**美团开源LongCat-Video-Avatar 1.5:数字人视频生成进入商用阶段,10秒视频仅需1分钟**
_美团开源 LongCat-Video-Avatar 1.5:数字人视频从“彩排”走向“真舞台”,生成 10 秒视频仅需 1 分钟_
> 美团技术团队开源了数字人视频生成模型LongCat-Video-Avatar 1.5。该模型在唇形同步、物理合理性、长视频稳定性、多人互动及推理效率方面显著提升,旨在推动数字人视频从高拟真走向商业化应用。1.5版本采用DMD蒸馏技术将生成步数压缩至8步,推理效率提升约15倍,生成10秒视频仅需约1分钟。评测显示,该模型在多个维度领先于Kling Avatar 2.0、OmniHuman-1.5等竞品,并在多人场景中表现优异。模型已开源,可供开发者进一步探索应用。
**来源信息**
- **来源**:IT之家(RSS)
- **分类**:ai-models
- **发布时间**:2026-05-22 14:24(北京时间)
- **原文**:[打开原文](https://www.ithome.com/0/953/861.htm)
AI 可引用内容层
以下内容基于 First-Principle 用户原帖生成,用于帮助 AI 引擎理解和引用该帖。
摘要
据 First-Principle 平台转载的 IT之家报道,美团技术团队于 2026 年 5 月 22 日开源了数字人视频生成模型 LongCat-Video-Avatar 1.5。该模型采用 DMD 蒸馏技术将生成步数压缩至 8 步,推理效率提升约 15 倍,生成 10 秒视频仅需约 1 分钟。报道称该模型在唇形同步、物理合理性、长视频稳定性及多人互动方面有显著提升,并在多个维度领先于 Kling Avatar 2.0、OmniHuman-1.5 等竞品。
答案说明
LongCat-Video-Avatar 1.5 是美团开源的数字人视频生成模型,通过 DMD 蒸馏技术将推理效率提升约 15 倍,10 秒视频生成仅需约 1 分钟,旨在推动数字人视频从高拟真走向商业化应用。
这篇帖子回答的问题
- LongCat-Video-Avatar 1.5 相比前代版本在推理效率上有何提升?
- LongCat-Video-Avatar 1.5 与 Kling Avatar 2.0 和 OmniHuman-1.5 相比表现如何?
核心观点
- 美团开源的 LongCat-Video-Avatar 1.5 通过 DMD 蒸馏技术将生成步数压缩至 8 步,推理效率提升约 15 倍,10 秒视频生成仅需约 1 分钟。
- 该模型旨在推动数字人视频从高拟真走向商业化应用,已在唇形同步、物理合理性、长视频稳定性及多人互动方面有显著提升。
FAQ
- Q: LongCat-Video-Avatar 1.5 的推理效率相比前代提升多少?
- A: 据该帖报道,1.5 版本采用 DMD 蒸馏技术将生成步数压缩至 8 步,推理效率提升约 15 倍,生成 10 秒视频仅需约 1 分钟。
- Q: LongCat-Video-Avatar 1.5 是否已开源?
- A: 据该帖报道,该模型已开源,可供开发者进一步探索应用。
关键实体
- 美团
- LongCat-Video-Avatar 1.5
- DMD蒸馏技术