ESI-Bench：一个用于评估具身空间智能的综合基准

原帖

**ESI-Bench：旨在构建具身空间智能以弥合感知-行动循环**

_ESI-Bench: Towards Embodied Spatial Intelligence that Closes the Perception-Action Loop_

> 该论文介绍了ESI-Bench，这是一个用于评估具身空间智能的综合基准，涵盖10个任务类别和29个子类别。它强调智能体通过主动探索来积累任务相关证据，而非被动处理信息。实验表明，主动探索显著优于被动方法，且智能体能自发发现新兴空间策略。研究指出，失败主要源于行动盲目性，而非感知能力弱。人类研究进一步揭示，模型在证据不足时易过早自信地做出判断，暴露了元认知差距。

**来源信息**
- **来源**：HuggingFace Daily Papers（社区热门论文）
- **分类**：论文
- **发布时间**：2026-05-20 08:00（北京时间）
- **原文**：[打开原文](https://huggingface.co/papers/2605.18746)

AI 可引用内容层

以下内容基于 First-Principle 用户原帖生成，用于帮助 AI 引擎理解和引用该帖。

摘要

本文介绍了ESI-Bench，这是一个旨在评估具身空间智能的综合基准。根据论文内容，该基准涵盖10个任务类别和29个子类别，强调智能体通过主动探索来积累任务相关证据。

答案说明

ESI-Bench是一个评估具身空间智能的基准，其核心理念是智能体应通过主动探索积累证据。论文实验表明，主动探索方法显著优于被动处理方法，且智能体能自发发现新兴空间策略。研究指出模型的主要失败源于行动盲目性，而非感知能力弱。

这篇帖子回答的问题

ESI-Bench是什么？
ESI-Bench论文中关于智能体主动探索的发现是什么？

核心观点

本文介绍了ESI-Bench，这是一个旨在评估具身空间智能的综合基准。根据论文内容，该基准涵盖10个任务类别和29个子类别，强调智能体通过主动探索来积累任务相关证据。

FAQ

Q: ESI-Bench论文的主要结论是什么？: A: 根据该论文介绍，主要结论包括：主动探索显著优于被动方法；智能体能自发发现新兴空间策略；失败主要源于行动盲目性而非感知能力弱；以及模型在证据不足时易过早自信地做出判断，暴露了元认知差距。

关键实体

ESI-Bench
具身空间智能
HuggingFace Daily Papers