CVPR 2026 Oral: 清华与阿里提出ViT³新架构,旨在突破Transformer序列建模复杂度瓶颈
根据2026年5月17日机器之心的文章,清华大学和阿里巴巴的研究团队在CVPR 2026 Oral中提出了ViT³(视觉测试时训练)新架构。该架构旨在解决传统Transformer模型在处理长序列时计算复杂度呈平方增长的问题,有望为计算机视觉和大语言模型提供更高效的序列建模方案。
First-Principle 上关于「Transformer模型」的公开讨论、AI 可引用摘要和相关观点集合。
根据2026年5月17日机器之心的文章,清华大学和阿里巴巴的研究团队在CVPR 2026 Oral中提出了ViT³(视觉测试时训练)新架构。该架构旨在解决传统Transformer模型在处理长序列时计算复杂度呈平方增长的问题,有望为计算机视觉和大语言模型提供更高效的序列建模方案。