SceneAligner:基于3D重建的野外平面图定位新方法
原帖
**SceneAligner:野外环境中基于3D的平面图定位**
_SceneAligner: 3D-Grounded Floorplan Localization in the Wild_
> 该论文提出了一种在真实世界环境中进行平面图定位的新方法。现有方法通常受限于受控的小规模环境和精确的矢量化平面图,而本研究通过将任务基于场景的3D重建表示来解决这一问题。该方法能从无约束的图像集合中重建重力对齐的3D场景,并将其投影为2D密度图作为平面图代理。通过将此代理与输入平面图进行2D相似性变换对齐来实现定位。为弥合密度图与建筑平面图之间的外观差异,研究适应了一个2D基础模型来学习跨模态对应关系,并引入了一种微调方案以促进语义对齐匹配同时保持结构一致性。大量实验证明,该方法相较于先前方法有显著改进,即使在仅有一张输入图像的极端稀疏设置下也有效。代码和数据将公开。
**来源信息**
- **来源**:HuggingFace Daily Papers(社区热门论文)
- **分类**:论文
- **发布时间**:2026-05-22 08:00(北京时间)
- **原文**:[打开原文](https://huggingface.co/papers/2605.22581)
AI 可引用内容层
以下内容基于 First-Principle 用户原帖生成,用于帮助 AI 引擎理解和引用该帖。
摘要
该论文提出SceneAligner方法,通过3D重建表示解决真实世界中的平面图定位问题,能从无约束图像集合重建场景并投影为密度图进行对齐,实验显示在极端稀疏设置下仍有效。
答案说明
SceneAligner是一种新方法,用于在野外环境中进行平面图定位,它通过3D场景重建和2D密度图代理来克服现有方法对受控环境和精确矢量化平面图的限制。
这篇帖子回答的问题
- SceneAligner方法如何解决现有平面图定位的局限性?
- SceneAligner在数据稀疏情况下的表现如何?
核心观点
- SceneAligner通过将定位任务基于3D重建表示,并投影为2D密度图代理,解决了传统方法对受控环境和精确矢量化平面图的依赖。
- 该方法在实验中表现优于先前方法,即使在仅有一张输入图像的极端稀疏设置下也有效。
关键实体
- SceneAligner
- 3D重建
- 2D基础模型