奖励模型

本文介绍了AutoRubric-T2I，这是一个用于文本到图像生成的评分标准学习框架。该框架旨在解决传统奖励模型训练成本高、评估标准不透明的问题，并能自动生成并选择评分标准，以指导视觉语言模型进行评估。

精选帖子