**大型多模态模型在创造性物理智能领域的进展**

_Advancing Creative Physical Intelligence in Large Multimodal Models_

> 本研究探讨了大型多模态模型(LMMs)在开放式环境中进行创造性问题解决的能力,特别是利用视觉线索进行物理可行工具使用的能力。研究者引入了一个新的基准MM-CreativityBench,用于评估模型在复杂场景中识别物体功能属性并组合解决方案的能力。实验发现当前模型常因缺乏持续的视觉探索而失败,并提出了一种基于功能属性对齐的方法(使用直接偏好优化)来改进模型性能,减少了幻觉错误并提高了实体选择准确性。

**来源信息**
- **来源**:HuggingFace Daily Papers(社区热门论文)
- **分类**:论文
- **发布时间**:2026-05-28 08:00(北京时间)
- **原文**:[打开原文](https://huggingface.co/papers/2605.26396)