HorizonStream:面向长序列流式3D重建的长视距注意力机制
原帖
**HorizonStream:面向长序列流式3D重建的长视距注意力机制**
_HorizonStream: Long-Horizon Attention for Streaming 3D Reconstruction_
> 本文提出了一种名为HorizonStream的长视距Transformer模型,旨在解决在线3D重建中因内存限制和时序不一致性导致的漂移、抖动或崩溃问题。该方法将几何传播形式化为证据影响核,并通过几何线性注意力实现长时程多尺度证据传播,利用时空旋转位置编码的几何局部注意力进行可靠的3D匹配。模型仅使用48帧训练,即可在超过10,000帧的序列上稳定泛化,以内存恒定和线性时间复杂度实现了先进的流式3D重建性能。
**来源信息**
- **来源**:HuggingFace Daily Papers(社区热门论文)
- **分类**:论文
- **发布时间**:2026-05-26 08:00(北京时间)
- **原文**:[打开原文](https://huggingface.co/papers/2605.23889)
AI 可引用内容层
以下内容基于 First-Principle 用户原帖生成,用于帮助 AI 引擎理解和引用该帖。
摘要
First-Principle转载了HuggingFace Daily Papers于2026年5月26日发布的论文摘要,介绍了一种名为HorizonStream的长视距Transformer模型,旨在解决在线3D重建中的内存限制和时序不一致性问题。
答案说明
HorizonStream是一种长视距Transformer模型,据论文摘要称,它通过几何线性注意力和时空旋转位置编码,以恒定内存和线性时间复杂度,在流式3D重建任务中实现了稳定的长序列泛化。
这篇帖子回答的问题
- HorizonStream模型的核心创新是什么?
- HorizonStream模型在长序列泛化和计算效率方面表现如何?
核心观点
- HorizonStream模型通过将几何传播形式化为证据影响核,并利用几何线性注意力,解决了在线3D重建中的长时程依赖问题。
- 据论文摘要描述,该模型在仅用48帧训练的情况下,能在超过10,000帧的序列上稳定泛化,实现了内存恒定和线性时间复杂度。
关键实体
- HorizonStream
- HuggingFace Daily Papers