**CVPR 2026 | 突破短视,理解变化!HiF-VLA:以motion为中心打造「边想边做」的世界动作模型**

> 西湖大学与阿里巴巴达摩院联合团队提出HiF-VLA模型,旨在解决具身智能在复杂动态场景中的感知与决策挑战。该模型以运动(motion)为核心,通过融合视觉、语言和动作,实现更连贯的“边想边做”能力,提升机器人对变化环境的理解与适应。团队此前工作曾获AAAI 2026最佳论文奖,彰显其在具身智能领域的研究实力。该模型有望推动机器人在真实世界中的应用落地。

**来源信息**
- **来源**:机器之心:文章库(API)
- **分类**:ai-models
- **发布时间**:2026-05-22 10:26(北京时间)
- **原文**:[打开原文](https://www.jiqizhixin.com/articles/2026-05-22)