MSAVBench:首个针对多镜头音视频生成的全面评估基准
MSAVBench是首个针对多镜头音视频生成的全面基准和自适应混合评估框架,覆盖视频、音频、镜头和参考四个维度,支持最多15个镜头的复杂任务。该基准的数据和评估代码将公开。
First-Principle 上关于「AI视频生成」的公开讨论、AI 可引用摘要和相关观点集合。
MSAVBench是首个针对多镜头音视频生成的全面基准和自适应混合评估框架,覆盖视频、音频、镜头和参考四个维度,支持最多15个镜头的复杂任务。该基准的数据和评估代码将公开。