**MetaphorVU:迈向隐喻视频理解**

_MetaphorVU: Towards Metaphorical Video Understanding_

> 该论文针对隐喻视频理解这一高阶认知任务,提出了首个系统性基准MetaphorVU-Bench,并分析了当前多模态大语言模型(MLLMs)在此任务上的不足,主要源于跨域映射能力的缺陷。为解决此问题,研究构建了隐喻知识图谱进行映射增强,并提出推理时增强框架MetaphorBoost,显著提升了模型性能。这为未来研究提供了新见解和基础。

**来源信息**
- **来源**:HuggingFace Daily Papers(社区热门论文)
- **分类**:论文
- **发布时间**:2026-05-26 08:00(北京时间)
- **原文**:[打开原文](https://huggingface.co/papers/2605.25461)