稀疏自编码器(SAE)能否捕捉神经网络中的复杂几何结构?
本文探讨稀疏自编码器(SAE)如何表征神经网络激活空间中的弯曲几何结构。研究发现,单个SAE特征仅能提供部分视角,但组合多个特征可重建完整几何结构,并提出三种流形表示方式。
First-Principle 上关于「稀疏自编码器」的公开讨论、AI 可引用摘要和相关观点集合。
本文探讨稀疏自编码器(SAE)如何表征神经网络激活空间中的弯曲几何结构。研究发现,单个SAE特征仅能提供部分视角,但组合多个特征可重建完整几何结构,并提出三种流形表示方式。