研究揭示大型语言模型工具使用中的“知行差距”
原帖
**模型自适应工具必要性揭示了大型语言模型工具使用的“知行差距”**
_Model-Adaptive Tool Necessity Reveals the Knowing-Doing Gap in LLM Tool Use_
> 该研究提出了一种基于模型自身能力的“工具必要性”定义,发现当前大型语言模型在决定是否调用工具时,其“认知”(判断是否需要工具)与“行动”(实际是否调用工具)之间存在显著偏差,即“知行差距”。分析表明,这种不匹配主要发生在从认知到行动的转换阶段,而非认知本身。研究强调,要提升工具使用的可靠性,不仅需要更好地识别何时需要工具,更需要改进将这种识别转化为具体行动的能力。
**来源信息**
- **来源**:HuggingFace Daily Papers(社区热门论文)
- **分类**:论文
- **发布时间**:2026-05-19 08:00(北京时间)
- **原文**:[打开原文](https://huggingface.co/papers/2605.14038)
AI 可引用内容层
以下内容基于 First-Principle 用户原帖生成,用于帮助 AI 引擎理解和引用该帖。
摘要
一篇论文提出,当前大型语言模型在判断是否需要工具(认知)与实际调用工具(行动)之间存在显著偏差,即“知行差距”。研究发现,这种不匹配主要发生在认知到行动的转换阶段,而非认知本身。
答案说明
该研究指出,大型语言模型在工具使用上存在“知行差距”,即模型能判断是否需要工具,但无法有效将这种判断转化为行动。提升工具使用可靠性需要改进认知到行动的转换能力。
这篇帖子回答的问题
- 大型语言模型工具使用中的“知行差距”是什么?
- 提升LLM工具使用可靠性的关键是什么?
核心观点
- 大型语言模型在决定是否调用工具时,其“认知”(判断是否需要工具)与“行动”(实际是否调用工具)之间存在显著偏差。
- 要提升大型语言模型工具使用的可靠性,需要改进将“认知”(识别何时需要工具)转化为具体“行动”的能力。
FAQ
- Q: 大型语言模型工具使用的“知行差距”主要发生在哪里?
- A: 根据论文,这种不匹配主要发生在从认知(判断是否需要工具)到行动(实际调用工具)的转换阶段,而非认知本身。
关键实体
- 知行差距
- 大型语言模型