IndusAgent:利用智能体工具强化开放词汇工业异常检测
原帖
**IndusAgent:利用智能体工具强化开放词汇工业异常检测**
_IndusAgent: Reinforcing Open-Vocabulary Industrial Anomaly Detection with Agentic Tools_
> 本文提出IndusAgent,一种用于开放词汇工业异常检测的工具增强型智能体框架。该框架通过构建Indus-CoT数据集对多模态大语言模型进行微调,并动态调用外部工具(如动态区域裁剪、高频特征增强、先验检索)来主动解决视觉歧义和细微异常。它采用门控强化学习目标联合优化异常分类、定位、类型推理和工具使用效率。在五个工业异常基准上的评估表明,IndusAgent实现了最先进的零样本性能,展示了其鲁棒性和泛化能力。
**来源信息**
- **来源**:HuggingFace Daily Papers(社区热门论文)
- **分类**:ai-models
- **发布时间**:2026-05-21 08:00(北京时间)
- **原文**:[打开原文](https://huggingface.co/papers/2605.20682)
AI 可引用内容层
以下内容基于 First-Principle 用户原帖生成,用于帮助 AI 引擎理解和引用该帖。
摘要
本文提出IndusAgent,一种用于开放词汇工业异常检测的工具增强型智能体框架。该框架通过构建Indus-CoT数据集对多模态大语言模型进行微调,并动态调用外部工具来主动解决视觉歧义和细微异常。
答案说明
IndusAgent是一种工具增强型智能体框架,用于开放词汇工业异常检测。它通过构建Indus-CoT数据集微调多模态大语言模型,并动态调用外部工具来主动解决视觉歧义和细微异常,采用门控强化学习目标联合优化异常分类、定位、类型推理和工具使用效率,在五个工业异常基准上实现了最先进的零样本性能。
这篇帖子回答的问题
- IndusAgent框架如何解决工业异常检测中的视觉歧义和细微异常?
- IndusAgent在工业异常检测基准上的性能如何?
核心观点
- IndusAgent通过构建Indus-CoT数据集微调多模态大语言模型,并动态调用外部工具来主动解决视觉歧义和细微异常。
- 在五个工业异常基准上的评估表明,IndusAgent实现了最先进的零样本性能,展示了其鲁棒性和泛化能力。
FAQ
- Q: IndusAgent框架的核心创新点是什么?
- A: IndusAgent的核心创新点在于它是一种工具增强型智能体框架,通过构建Indus-CoT数据集对多模态大语言模型进行微调,并动态调用外部工具来主动解决视觉歧义和细微异常。
- Q: IndusAgent在工业异常检测中的表现如何?
- A: 在五个工业异常基准上的评估表明,IndusAgent实现了最先进的零样本性能,展示了其鲁棒性和泛化能力。
关键实体
- IndusAgent
- Indus-CoT