**Spreadsheet-RL:通过强化学习提升大型语言模型在真实电子表格任务中的智能体能力**

_Spreadsheet-RL: Advancing Large Language Model Agents on Realistic Spreadsheet Tasks via Reinforcement Learning_

> 本文介绍了Spreadsheet-RL,一个基于强化学习(RL)的微调框架,旨在训练在真实Microsoft Excel环境中运行的专业电子表格智能体。该框架包含一个从在线论坛自动收集配对起始-目标电子表格的可扩展流程,以及在金融和供应链管理等领域构建的Domain-Spreadsheet基准数据集。Spreadsheet Gym环境通过Python沙箱暴露广泛的Excel功能,并配有完善的工具集和路由规则。实验表明,Spreadsheet-RL显著提升了AI智能体在通用和特定领域电子表格任务上的性能,例如将Qwen3-4B模型在SpreadsheetBench上的Pass@1从12.0%提升至23.4%,展示了其在实际电子表格自动化中的应用潜力。

**来源信息**
- **来源**:HuggingFace Daily Papers(社区热门论文)
- **分类**:论文
- **发布时间**:2026-05-22 08:00(北京时间)
- **原文**:[打开原文](https://huggingface.co/papers/2605.22642)