**SAGA:一种用于多视野概率预测的序列自适应生成架构**

_SAGA: A Sequence-Adaptive Generative Architecture for Multi-Horizon Probabilistic Forecasting with Adaptive Temporal Conformal Prediction_

> 本文提出SAGA模型,这是一种仅解码器的Transformer架构,专为处理不规则表格面板序列数据设计。它通过结合分裂合规校准包装器,能够在有限样本边际覆盖保证下提供个体级别的预测区间。模型在瑞典LISA纵向登记数据上训练,用于预测未来1至30年的年度劳动收入,并通过蒙特卡洛方法聚合成终身收入分布。与传统参数模型和基准方法相比,SAGA在10年预测视野上将连续排名概率分数降低了31.9%,在20年视野上将平均绝对误差降低了37.7%。其合规区间在边际上达到标称覆盖在0.4个百分点内,在最差人口统计子组内也在2.4个百分点内。重建的终身收入基尼系数为0.327,接近部分观测的真实值0.341,优于GKOS估计的0.378。模型权重、校准表和合成等效数据集已发布,便于在受保护的SCB MONA环境外复制。

**来源信息**
- **来源**:HuggingFace Daily Papers(社区热门论文)
- **分类**:ai-models
- **发布时间**:2026-05-20 08:00(北京时间)
- **原文**:[打开原文](https://huggingface.co/papers/2605.19014)