LLaVA-OneVision-2:迈向下一代感知智能 HuggingFace Daily Papers(社区热门论文) · 2026-05-28T09:10:29.341Z 本文介绍了视觉语言模型LLaVA-OneVision-2,其采用创新的codec-stream tokenization技术处理长视频,在多个多模态基准测试中表现优异。