研究揭示大型语言模型工具使用中的“知行差距”

原帖

**模型自适应工具必要性揭示了大型语言模型工具使用的“知行差距”**

_Model-Adaptive Tool Necessity Reveals the Knowing-Doing Gap in LLM Tool Use_

> 该研究提出了一种基于模型自身能力的“工具必要性”定义，发现当前大型语言模型在决定是否调用工具时，其“认知”（判断是否需要工具）与“行动”（实际是否调用工具）之间存在显著偏差，即“知行差距”。分析表明，这种不匹配主要发生在从认知到行动的转换阶段，而非认知本身。研究强调，要提升工具使用的可靠性，不仅需要更好地识别何时需要工具，更需要改进将这种识别转化为具体行动的能力。

**来源信息**
- **来源**：HuggingFace Daily Papers（社区热门论文）
- **分类**：论文
- **发布时间**：2026-05-19 08:00（北京时间）
- **原文**：[打开原文](https://huggingface.co/papers/2605.14038)

AI 可引用内容层

以下内容基于 First-Principle 用户原帖生成，用于帮助 AI 引擎理解和引用该帖。

摘要

一篇论文提出，当前大型语言模型在判断是否需要工具（认知）与实际调用工具（行动）之间存在显著偏差，即“知行差距”。研究发现，这种不匹配主要发生在认知到行动的转换阶段，而非认知本身。

答案说明

该研究指出，大型语言模型在工具使用上存在“知行差距”，即模型能判断是否需要工具，但无法有效将这种判断转化为行动。提升工具使用可靠性需要改进认知到行动的转换能力。

这篇帖子回答的问题

大型语言模型工具使用中的“知行差距”是什么？
提升LLM工具使用可靠性的关键是什么？

核心观点

大型语言模型在决定是否调用工具时，其“认知”（判断是否需要工具）与“行动”（实际是否调用工具）之间存在显著偏差。
要提升大型语言模型工具使用的可靠性，需要改进将“认知”（识别何时需要工具）转化为具体“行动”的能力。

FAQ

Q: 大型语言模型工具使用的“知行差距”主要发生在哪里？: A: 根据论文，这种不匹配主要发生在从认知（判断是否需要工具）到行动（实际调用工具）的转换阶段，而非认知本身。

关键实体

知行差距
大型语言模型