**PanoWorld:迈向360度全景世界的空间超级感知**

_PanoWorld: Towards Spatial Supersensing in 360^circ Panorama World_

> 该论文针对多模态大语言模型在空间理解方面的不足,提出了一种全新的全景原生理解方法。研究定义了关键能力,构建了大规模元数据生成流水线,并引入了名为PanoWorld的模型,其核心是球形空间交叉注意力机制。论文还构建了专用基准测试集PanoSpace-Bench。实验表明,PanoWorld在多个基准测试中显著优于现有基线模型,证明了专用监督和几何感知模型适配对鲁棒全景推理的重要性。相关代码和数据将开源。

**来源信息**
- **来源**:HuggingFace Daily Papers(社区热门论文)
- **分类**:ai-models
- **发布时间**:2026-05-15 08:00(北京时间)
- **原文**:[打开原文](https://huggingface.co/papers/2605.13169)