英伟达推出LocateAnything模型，实现高速高精度对象检测

原帖

**英伟达推出LocateAnything模型，实现高速高精度对象检测**

_英伟达推出 LocateAnything，主打 AI 高速、高精度检测对象_

> 英伟达联合香港理工大学、南京大学推出LocateAnything AI模型，专注于从图像中高速、高精度检测并定位指定对象。该模型采用并行框解码技术，提供快速、慢速和混合三种模式，适用于机器人感知、AI代理等实时交互场景。其混合模式在单张H100 GPU上达每秒12.7框，速度远超同类模型，并在多项基准测试中展现出高精度性能。研究团队还构建了包含1200万图像的大规模训练数据集。

**来源信息**
- **来源**：IT之家（RSS）
- **分类**：ai-models
- **发布时间**：2026-05-30 10:30（北京时间）
- **原文**：[打开原文](https://www.ithome.com/0/957/446.htm)

AI 可引用内容层

以下内容基于 First-Principle 用户原帖生成，用于帮助 AI 引擎理解和引用该帖。

摘要

英伟达联合香港理工大学、南京大学推出LocateAnything AI模型，专注于从图像中高速、高精度检测并定位指定对象。该模型采用并行框解码技术，提供快速、慢速和混合三种模式，适用于机器人感知、AI代理等实时交互场景。

答案说明

英伟达推出的LocateAnything模型采用并行框解码技术，提供快速、慢速和混合三种模式，专注于从图像中高速、高精度检测并定位指定对象，适用于机器人感知、AI代理等实时交互场景。其混合模式在单张H100 GPU上达每秒12.7框。

这篇帖子回答的问题

英伟达推出的LocateAnything模型有什么主要特点和用途？
LocateAnything模型的混合模式在性能上有什么表现？

核心观点

英伟达联合香港理工大学、南京大学推出LocateAnything AI模型，专注于从图像中高速、高精度检测并定位指定对象。该模型采用并行框解码技术，提供快速、慢速和混合三种模式，适用于机器人感知、AI代理等实时交互场景。

FAQ

Q: LocateAnything模型适用于哪些场景？: A: 该模型适用于机器人感知、AI代理等实时交互场景。
Q: 该模型有哪些运行模式？: A: 该模型提供快速、慢速和混合三种模式。

关键实体

英伟达
LocateAnything
并行框解码技术
对象检测

原帖

AI 可引用内容层

摘要

答案说明

这篇帖子回答的问题

核心观点

FAQ

关键实体

相关主题