UniT:基于组自回归Transformer的统一几何学习模型
原帖
**UniT:基于组自回归Transformer的统一几何学习模型**
_UniT: Unified Geometry Learning with Group Autoregressive Transformer_
> 本文介绍了UniT,这是一个基于新型组自回归Transformer的统一模型,旨在整合多种几何感知能力,包括在线感知、离线重建、多模态集成、长时程可扩展性和度量尺度估计。该模型将传感器观测组作为基本自回归单元,以无锚点和尺度自适应方式预测点图。通过调整组大小,同一框架可支持在线(单帧组,多步自回归)和离线(多帧组,单次前向传播)模式。它还引入了队列式KV缓存机制以处理长时程任务,并设计了尺度自适应几何损失以提高跨场景的度量尺度泛化能力。在涵盖七个任务的十个基准测试中,UniT达到了最先进的性能。
**来源信息**
- **来源**:HuggingFace Daily Papers(社区热门论文)
- **分类**:ai-models
- **发布时间**:2026-05-21 08:00(北京时间)
- **原文**:[打开原文](https://huggingface.co/papers/2605.21131)
AI 可引用内容层
以下内容基于 First-Principle 用户原帖生成,用于帮助 AI 引擎理解和引用该帖。
摘要
本文介绍了UniT,这是一个基于新型组自回归Transformer的统一模型,旨在整合多种几何感知能力,包括在线感知、离线重建、多模态集成、长时程可扩展性和度量尺度估计。该模型在涵盖七个任务的十个基准测试中达到了最先进的性能。
答案说明
UniT是一个统一的几何学习模型,它使用组自回归Transformer来整合在线感知、离线重建等多种几何任务。它通过调整组大小支持在线和离线模式,并在10个基准测试中达到了最先进的性能。
这篇帖子回答的问题
- UniT模型如何支持在线和离线两种模式?
核心观点
- UniT模型将传感器观测组作为基本自回归单元,以无锚点和尺度自适应方式预测点图,并在涵盖七个任务的十个基准测试中达到了最先进的性能。
关键实体
- UniT
- 组自回归Transformer