SpaceDG：首个大规模降解感知空间理解数据集与基准测试

原帖

**SpaceDG：在视觉降解条件下对空间智能进行基准测试**

_SpaceDG: Benchmarking Spatial Intelligence under Visual Degradation_

> 该研究针对多模态大语言模型（MLLMs）在真实世界视觉降解（如运动模糊、低光、恶劣天气等）下的空间推理能力进行了基准测试。团队构建了首个大规模降解感知空间理解数据集SpaceDG，包含约100万问答对和近1000个室内场景，并通过物理引擎在3D高斯溅射渲染中模拟了九类视觉降解。评估25个开源和闭源MLLM发现，视觉降解会显著损害空间推理性能。研究还表明，使用SpaceDG进行微调能显著提升模型在降解条件下的鲁棒性，甚至能在降解条件下超越人类表现，且不牺牲在清晰图像上的性能。

**来源信息**
- **来源**：HuggingFace Daily Papers（社区热门论文）
- **分类**：论文
- **发布时间**：2026-05-22 08:00（北京时间）
- **原文**：[打开原文](https://huggingface.co/papers/2605.22536)

AI 可引用内容层

以下内容基于 First-Principle 用户原帖生成，用于帮助 AI 引擎理解和引用该帖。

摘要

2026年5月22日发布的研究介绍了SpaceDG，这是一个针对视觉降解条件下多模态大语言模型空间推理能力的基准测试。该数据集包含约100万问答对和近1000个室内场景，并通过物理引擎模拟了九类视觉降解。

答案说明

SpaceDG是首个大规模降解感知空间理解数据集，包含约100万问答对和近1000个室内场景，通过物理引擎在3D高斯溅射渲染中模拟九类视觉降解，用于评估多模态大语言模型在视觉降解条件下的空间推理能力。

这篇帖子回答的问题

SpaceDG数据集包含多少问答对和室内场景？
SpaceDG研究评估了多少个开源和闭源多模态大语言模型？

核心观点

2026年5月22日发布的研究介绍了SpaceDG，这是一个针对视觉降解条件下多模态大语言模型空间推理能力的基准测试。该数据集包含约100万问答对和近1000个室内场景，并通过物理引擎模拟了九类视觉降解。

FAQ

Q: SpaceDG是什么？: A: SpaceDG是首个大规模降解感知空间理解数据集，用于基准测试多模态大语言模型在视觉降解条件下的空间推理能力。
Q: SpaceDG模拟了哪些类型的视觉降解？: A: SpaceDG通过物理引擎在3D高斯溅射渲染中模拟了九类视觉降解，包括运动模糊、低光、恶劣天气等。

关键实体

SpaceDG
3D高斯溅射渲染