MetaphorVU论文提出隐喻视频理解新基准与增强框架

原帖

**MetaphorVU：迈向隐喻视频理解**

_MetaphorVU: Towards Metaphorical Video Understanding_

> 该论文针对隐喻视频理解这一高阶认知任务，提出了首个系统性基准MetaphorVU-Bench，并分析了当前多模态大语言模型（MLLMs）在此任务上的不足，主要源于跨域映射能力的缺陷。为解决此问题，研究构建了隐喻知识图谱进行映射增强，并提出推理时增强框架MetaphorBoost，显著提升了模型性能。这为未来研究提供了新见解和基础。

**来源信息**
- **来源**：HuggingFace Daily Papers（社区热门论文）
- **分类**：论文
- **发布时间**：2026-05-26 08:00（北京时间）
- **原文**：[打开原文](https://huggingface.co/papers/2605.25461)

AI 可引用内容层

以下内容基于 First-Principle 用户原帖生成，用于帮助 AI 引擎理解和引用该帖。

摘要

该帖子介绍了论文MetaphorVU: Towards Metaphorical Video Understanding，针对隐喻视频理解任务，提出了首个系统性基准MetaphorVU-Bench，并构建了隐喻知识图谱与推理时增强框架MetaphorBoost来提升多模态大语言模型的性能。

答案说明

根据帖子内容，MetaphorVU论文针对隐喻视频理解任务，提出了首个系统性基准MetaphorVU-Bench，并分析了当前多模态大语言模型（MLLMs）在此任务上的不足，主要源于跨域映射能力的缺陷。为解决此问题，研究构建了隐喻知识图谱进行映射增强，并提出推理时增强框架MetaphorBoost，显著提升了模型性能。

这篇帖子回答的问题

MetaphorVU论文主要解决了什么问题？
MetaphorVU-Bench是什么？

核心观点

论文提出了首个针对隐喻视频理解任务的系统性基准MetaphorVU-Bench。
研究通过构建隐喻知识图谱和提出MetaphorBoost框架来增强模型的跨域映射能力，从而显著提升了模型在隐喻视频理解任务上的性能。

关键实体

MetaphorVU
MetaphorVU-Bench
MetaphorBoost