**TransitLM:用于无地图公交路线生成的大规模数据集与基准**

_TransitLM: A Large-Scale Dataset and Benchmark for Map-Free Transit Route Generation_

> 本文介绍了TransitLM,这是一个包含超过1300万条公交路线规划记录的大规模数据集,覆盖中国四个城市的12万多个站点和1.3万多条线路。该数据集旨在作为持续预训练语料库和基准数据,支持三个互补的评估任务。实验表明,在TransitLM上训练的大语言模型能够以高准确率生成结构有效的路线,并在没有显式地图的情况下,隐式地将任意GPS坐标对应到合适的站点。这些结果证明,公交路线规划可以完全从数据中学习,从而实现直接从起点-终点信息进行端到端、无地图的路线生成。

**来源信息**
- **来源**:HuggingFace Daily Papers(社区热门论文)
- **分类**:论文
- **发布时间**:2026-05-22 08:00(北京时间)
- **原文**:[打开原文](https://huggingface.co/papers/2605.22355)