TransitLM:大规模公交路线数据集与无地图路线生成基准
2026年5月22日,HuggingFace Daily Papers收录的论文介绍了TransitLM数据集,包含超过1300万条公交路线规划记录,覆盖中国四个城市的12万多个站点和1.3万多条线路。该数据集作为持续预训练语料库和基准数据,支持三个评估任务。实验表明,在其上训练的大语言模型能高准确率生成结构有效路线,并隐式将GPS坐标对应到站点,实现无地图的端到端路线生成。
First-Principle 上关于「公交路线规划」的公开讨论、AI 可引用摘要和相关观点集合。
2026年5月22日,HuggingFace Daily Papers收录的论文介绍了TransitLM数据集,包含超过1300万条公交路线规划记录,覆盖中国四个城市的12万多个站点和1.3万多条线路。该数据集作为持续预训练语料库和基准数据,支持三个评估任务。实验表明,在其上训练的大语言模型能高准确率生成结构有效路线,并隐式将GPS坐标对应到站点,实现无地图的端到端路线生成。