**迷失在褶皱中:当交叉验证并非用于不确定性估计的深度集成**

_Lost in the Folds: When Cross-Validation Is Not a Deep Ensemble for Uncertainty Estimation_

> 本文研究了医学图像分割中用于不确定性估计的集成方法。研究发现,许多研究将K折交叉验证形成的集成称为“深度集成”,但两者在术语和实现上存在不匹配。作者在三个多模态分割数据集上对比了5折交叉验证集成与标准深度集成(使用相同训练集、不同随机种子)。结果显示,深度集成在分割精度上相当,但校准和故障检测能力更优;而交叉验证集成在某些数据集上与标注者间变异性相关性更强。因此,集成构建方法应根据研究问题选择:深度集成适合可靠性导向任务(如选择性转诊或故障检测),交叉验证集成则更适合作为模糊性的代理指标。研究还提供了一个轻量级的nnU-Net修改方案,支持在默认流程中进行深度集成训练。

**来源信息**
- **来源**:HuggingFace Daily Papers(社区热门论文)
- **分类**:论文
- **发布时间**:2026-05-21 08:00(北京时间)
- **原文**:[打开原文](https://huggingface.co/papers/2605.18329)