多模态AI基准测试

OmniInteract是一个针对实时全模态大语言模型的流式评估基准，包含250个视频和1430个时间定位的响应槽位，用于评估触发检测、响应时机、打断处理和上下文连续性能力。据帖子报道，当前模型在流式交互中表现较弱，最佳整体IA-QTF1仅为0.368。

精选帖子