**DynMuon:从动态光谱整形视角优化Muon优化器**

_DynMuon: A Dynamic Spectral Shaping View of Muon_

> 本文提出了一种名为DynMuon的新型优化器改进方法,它通过动态调整Muon优化器中的光谱整形参数p来提升训练效率。研究表明,在训练早期,正p值通过强调高曲率方向来加速信号收敛;而在训练后期,轻微负p值则有助于将更新强度重新分配到仍包含有用训练信号的低曲率方向。实验表明,DynMuon在多种模型规模、架构和训练设置下,均能实现比标准Muon更低的验证损失,并将达到相同目标损失所需的训练步数减少10.6%至26.5%。

**来源信息**
- **来源**:HuggingFace Daily Papers(社区热门论文)
- **分类**:论文
- **发布时间**:2026-05-21 08:00(北京时间)
- **原文**:[打开原文](https://huggingface.co/papers/2605.17109)