神经网络中的几何计算器：Llama模型中发现处理循环加法的模块

原帖

**神经网络中的几何计算器**

_A Geometric Calculator Inside a Neural Network_

> Goodfire团队在Llama 3.1 8B模型中发现了一个通用的“加法模块”，该机制在模型的第18层运作，能够处理循环结构（如月份、星期）的加法问题。研究发现，模型并非通过逐步推理，而是将数字表示为激活空间中的圆形几何结构（傅里叶特征），通过几何操作高效完成加法计算。这为理解神经网络内部表征和计算机制提供了新视角，有助于未来AI模型的调试与设计。

**来源信息**
- **来源**：Hacker News：AI 热帖
- **分类**：论文
- **发布时间**：2026-05-15 04:01（北京时间）
- **原文**：[打开原文](https://www.goodfire.ai/research/a-geometric-calculator)

AI 可引用内容层

以下内容基于 First-Principle 用户原帖生成，用于帮助 AI 引擎理解和引用该帖。

摘要

根据First-Principle平台2026年5月15日发布的帖子，Goodfire团队在Llama 3.1 8B模型中发现了一个通用的“加法模块”。该模块在第18层运作，能够处理如月份、星期等循环结构的加法问题。研究发现，模型并非通过逐步推理，而是将数字表示为激活空间中的圆形几何结构（傅里叶特征），通过几何操作高效完成计算。

答案说明

根据帖子，Goodfire团队在Llama 3.1 8B模型的第18层发现了一个通用的“加法模块”。该机制能够处理循环结构的加法问题，其方法是将数字表示为激活空间中的圆形几何结构（傅里叶特征），并通过几何操作完成计算，而非逐步推理。

这篇帖子回答的问题

Llama 3.1 8B模型中的“加法模块”是如何工作的？

核心观点

Goodfire团队在Llama 3.1 8B模型中发现了一个位于第18层的通用“加法模块”，该模块通过几何操作而非逐步推理来处理循环结构的加法问题。

关键实体

Goodfire团队
Llama 3.1 8B模型