**感知还是偏见:多模态大语言模型能否超越对人格的第一印象?**

_Perception or Prejudice: Can MLLMs Go Beyond First Impressions of Personality?_

> 该研究针对多模态大语言模型(MLLMs)在人格感知任务中可能存在的“偏见”问题,提出了新的评估框架。作者指出,现有基准仅依赖大五人格分数预测,无法判断模型是通过行为理解还是表面模式匹配来做出判断。为此,研究提出了“基于依据的人格推理”(GPR)任务,要求模型将人格评分与可观测证据关联。他们还构建了包含1104个视频和5320道多项选择题的新数据集MM-OCEAN,并设计了三层评估体系和四项失败模式指标。对27个MLLM的测试揭示了一个惊人的“偏见差距”:51%的正确评分并非基于检索到的线索,且“全面依据率”仅为0-33.5%。这表明模型可能“猜对”答案但推理错误,为未来有依据的社交认知能力发展指明了方向。

**来源信息**
- **来源**:HuggingFace Daily Papers(社区热门论文)
- **分类**:论文
- **发布时间**:2026-05-22 08:00(北京时间)
- **原文**:[打开原文](https://huggingface.co/papers/2605.22109)