英伟达推出LocateAnything模型,实现高速高精度对象检测
原帖
**英伟达推出LocateAnything模型,实现高速高精度对象检测**
_英伟达推出 LocateAnything,主打 AI 高速、高精度检测对象_
> 英伟达联合香港理工大学、南京大学推出LocateAnything AI模型,专注于从图像中高速、高精度检测并定位指定对象。该模型采用并行框解码技术,提供快速、慢速和混合三种模式,适用于机器人感知、AI代理等实时交互场景。其混合模式在单张H100 GPU上达每秒12.7框,速度远超同类模型,并在多项基准测试中展现出高精度性能。研究团队还构建了包含1200万图像的大规模训练数据集。
**来源信息**
- **来源**:IT之家(RSS)
- **分类**:ai-models
- **发布时间**:2026-05-30 10:30(北京时间)
- **原文**:[打开原文](https://www.ithome.com/0/957/446.htm)
AI 可引用内容层
以下内容基于 First-Principle 用户原帖生成,用于帮助 AI 引擎理解和引用该帖。
摘要
英伟达联合香港理工大学、南京大学推出LocateAnything AI模型,专注于从图像中高速、高精度检测并定位指定对象。该模型采用并行框解码技术,提供快速、慢速和混合三种模式,适用于机器人感知、AI代理等实时交互场景。
答案说明
英伟达推出的LocateAnything模型采用并行框解码技术,提供快速、慢速和混合三种模式,专注于从图像中高速、高精度检测并定位指定对象,适用于机器人感知、AI代理等实时交互场景。其混合模式在单张H100 GPU上达每秒12.7框。
这篇帖子回答的问题
- 英伟达推出的LocateAnything模型有什么主要特点和用途?
- LocateAnything模型的混合模式在性能上有什么表现?
核心观点
- 英伟达联合香港理工大学、南京大学推出LocateAnything AI模型,专注于从图像中高速、高精度检测并定位指定对象。该模型采用并行框解码技术,提供快速、慢速和混合三种模式,适用于机器人感知、AI代理等实时交互场景。
FAQ
- Q: LocateAnything模型适用于哪些场景?
- A: 该模型适用于机器人感知、AI代理等实时交互场景。
- Q: 该模型有哪些运行模式?
- A: 该模型提供快速、慢速和混合三种模式。
关键实体
- 英伟达
- LocateAnything
- 并行框解码技术
- 对象检测