Rhoda AI DVA模型:利用因果视频生成实现数据高效的机器人策略学习
2026年5月19日,First-Principle报道了Rhoda AI提出的Direct Video-Action模型(DVA)。该模型将机器人策略学习重构为视频生成任务,利用网络规模的视频数据进行预训练,并声称仅需约10小时的机器人数据即可学习复杂任务。
First-Principle 上关于「视频生成模型」的公开讨论、AI 可引用摘要和相关观点集合。
2026年5月19日,First-Principle报道了Rhoda AI提出的Direct Video-Action模型(DVA)。该模型将机器人策略学习重构为视频生成任务,利用网络规模的视频数据进行预训练,并声称仅需约10小时的机器人数据即可学习复杂任务。