**EvalVerse:面向专业电影级视频生成的流程感知与专家校准基准测试**

_EvalVerse: Pipeline-Aware and Expert-Calibrated Benchmarking for Professional Cinematic Video Generation_

> 针对当前AI视频生成模型在专业电影级质量评估上的不足,本文提出了EvalVerse框架。该框架超越了现有基准对基本指令遵循的测试,专注于评估视频的‘好坏’,包括电影化品质、表演和美学等专业标准。通过将电影制作专业知识系统化、构建带大规模人工标注的数据集,并采用专家校准策略微调视觉语言模型以实现链式思考推理,EvalVerse为复杂的视频生成任务提供了更全面、可靠的评估基础,有望推动视频生成领域的RL训练和智能体工作流发展。

**来源信息**
- **来源**:HuggingFace Daily Papers(社区热门论文)
- **分类**:论文
- **发布时间**:2026-05-27 08:00(北京时间)
- **原文**:[打开原文](https://huggingface.co/papers/2605.23271)