音频驱动肖像视频

First-Principle平台报道，字节跳动Seed团队提出FlowPortrait框架，该方法是一种基于强化学习的音频驱动肖像动画生成方法。它利用多模态大语言模型构建符合人类感知的评估系统，用于衡量唇形同步准确性、表现力和运动质量，并通过组相对策略优化对生成器进行后训练。

精选帖子