**智能体自主发现神经架构:AIRA-Compose 与 AIRA-Design**

_Agentic Discovery of Neural Architectures: AIRA-Compose and AIRA-Design_

> 研究人员提出了一个双框架,旨在让大语言模型智能体自主设计超越标准Transformer的基础模型。其中,AIRA-Compose负责高层架构搜索,AIRA-Design负责底层机制实现。实验表明,这些智能体发现的新架构(AIRAformers和AIRAhybrid)在预训练后,其性能(如准确率、扩展效率)在多个基准测试上优于Llama 3.2等人工设计的基线模型。这标志着在递归自我改进和下一代基础模型发现方面迈出了重要一步。

**来源信息**
- **来源**:HuggingFace Daily Papers(社区热门论文)
- **分类**:论文
- **发布时间**:2026-05-18 08:00(北京时间)
- **原文**:[打开原文](https://huggingface.co/papers/2605.15871)