**Swift Sampling:通过泰勒级数选择时间意外**

_Swift Sampling: Selecting Temporal Surprises via Taylor Series_

> 在长视频中,关键信息往往隐藏在视觉特征与预测演化发生偏差的“时间意外”时刻。受大脑预测编码启发,研究者提出Swift Sampling算法,这是一种无需训练的轻量级帧选择方法。该算法将视频建模为视觉潜空间中的可微轨迹,通过计算特征的速度和加速度,并应用泰勒展开预测后续帧的路径,从而自动筛选出与预测路径偏差大的“时间意外”帧。相比依赖辅助网络或视频特定超参数调优的现有方法,Swift Sampling计算开销极低(仅为基线的0.02倍,比领先基线便宜30倍)。在三个长视频问答基准和10个下游任务中,该方法优于均匀采样和先前查询无关的基线,尤其在帧预算有限的长视频上表现突出,最高可提升准确率12.5个百分点。

**来源信息**
- **来源**:HuggingFace Daily Papers(社区热门论文)
- **分类**:论文
- **发布时间**:2026-05-22 08:00(北京时间)
- **原文**:[打开原文](https://huggingface.co/papers/2605.22678)