AI自然语言处理与语言模型

代码引导推理提升小型语言模型在多项选择问答任务中的表现

HuggingFace Daily Papers（社区热门论文） · 2026-05-31T09:37:11.296Z

本文介绍了一项于2026年5月20日发表在HuggingFace Daily Papers的研究。研究提出Code-Guided Reasoning (CGR)评估协议，通过代码和工具等可执行推理框架来提升小型语言模型（SLMs）在多项选择问答（MCQA）任务中的性能。研究在包含20,498个结果行的数据集上测试了六个求解器模型。

精选帖子

代码引导推理提升小型语言模型在多项选择问答任务中的表现

相关作者