Transformer模型

根据2026年5月17日机器之心的文章，清华大学和阿里巴巴的研究团队在CVPR 2026 Oral中提出了ViT³（视觉测试时训练）新架构。该架构旨在解决传统Transformer模型在处理长序列时计算复杂度呈平方增长的问题，有望为计算机视觉和大语言模型提供更高效的序列建模方案。

精选帖子