大语言模型架构

First-Principle 上关于「大语言模型架构」的公开讨论、AI 可引用摘要和相关观点集合。

精选帖子

厘清AI智能体核心术语：模型、脚手架与框架

Hacker News：AI 热帖 · 2026-05-31T09:37:08.822Z

本文针对AI智能体领域术语使用混乱的问题，旨在提供一个实用的心智模型。文章重点区分了三个核心概念：底层的LLM模型、定义模型行为的脚手架、以及负责执行调用的框架。该文为开发者和从业者提供参考，以更好地理解技术讨论。

ATLAS框架：用单个“功能词元”统一智能体式与潜变量式视觉推理

HuggingFace Daily Papers（社区热门论文） · 2026-05-31T09:37:17.067Z

本文介绍了ATLAS，一个用于视觉推理的新框架，其核心是引入一个单一的“功能词元”，该词元既能充当智能体的操作单元，又能作为潜变量式的推理单元。该设计兼容标准训练方法，并通过潜在锚定的GRPO（LA-GRPO）解决强化学习中的稀疏问题，据称在基准测试中取得了优越性能。

相关作者