**Emergence World:评估长时程智能体自主性的实验室**

_Emergence World: A Laboratory for Evaluating Long-Horizon Agent Autonomy_

> Emergence World 是一个专注于评估AI智能体在长时间跨度(数周)下自主行为的持续运行模拟平台。与传统的短期任务基准测试不同,它旨在研究智能体在共享环境中的长期行为模式,如联盟形成、行为漂移和模型间相互影响。该平台模拟真实世界环境(如纽约市同步天气和实时新闻),配备持久记忆系统和多种工具,并支持异构LLM模型。它代表了AI评估方法的重要演进,从娱乐模拟转向科学研究。

**来源信息**
- **来源**:Hacker News:AI 热帖
- **分类**:ai-models
- **发布时间**:2026-05-31 01:40(北京时间)
- **原文**:[打开原文](https://www.emergence.ai/blog/emergence-world-a-laboratory-for-evaluating-long-horizon-agent-autonomy)