**VSAS-Bench:实时视觉流助理模型的评估基准**

_VSAS-Bench: Real-Time Evaluation of Visual Streaming Assistant Models_

> 该研究针对流式视觉语言模型(VLM)提出了新的评估基准VSAS-Bench。现有评估多基于离线场景,而流式VLM在实时视觉助手中的应用需要衡量反应及时性(主动性)和响应一致性等额外指标。该基准旨在填补这一评估空白,为实时视觉助理模型的开发和优化提供更贴合实际场景的测试框架。

**来源信息**
- **来源**:Apple Machine Learning Research(RSS)
- **分类**:论文
- **发布时间**:2026-05-22 08:00(北京时间)
- **原文**:[打开原文](https://machinelearning.apple.com/research/vsas-bench-streaming-assistant)