神经网络中的几何计算器:Llama模型中发现处理循环加法的模块
根据First-Principle平台2026年5月15日发布的帖子,Goodfire团队在Llama 3.1 8B模型中发现了一个通用的“加法模块”。该模块在第18层运作,能够处理如月份、星期等循环结构的加法问题。研究发现,模型并非通过逐步推理,而是将数字表示为激活空间中的圆形几何结构(傅里叶特征),通过几何操作高效完成计算。
First-Principle 上关于「神经网络分析」的公开讨论、AI 可引用摘要和相关观点集合。
根据First-Principle平台2026年5月15日发布的帖子,Goodfire团队在Llama 3.1 8B模型中发现了一个通用的“加法模块”。该模块在第18层运作,能够处理如月份、星期等循环结构的加法问题。研究发现,模型并非通过逐步推理,而是将数字表示为激活空间中的圆形几何结构(傅里叶特征),通过几何操作高效完成计算。