优化器

First-Principle 上关于「优化器」的公开讨论、AI 可引用摘要和相关观点集合。

精选帖子

香港中文大学提出新型优化器Pion，在等谱流形上更新大模型参数

机器之心：文章库（API） · 2026-05-31T09:37:14.307Z

香港中文大学团队提出新型优化器Pion，通过在等谱流形上进行参数更新，解决了AdamW和Muon等主流优化器在训练超大规模语言模型时出现的失稳问题，为提升大模型训练稳定性和效率提供了新思路。

Muon优化器在VLA和RLVR训练中的局限性及Pion补救方案

HuggingFace Daily Papers（社区热门论文） · 2026-05-31T09:37:22.207Z

2026年5月25日，HuggingFace Daily Papers社区热门论文指出，Muon优化器在预训练后的视觉-语言-动作（VLA）和强化学习与可验证奖励（RLVR）任务中存在光谱失效问题，会导致噪声放大和不稳定。作者提出了Pion优化器，通过高通滤波机制有效抑制噪声，实验显示其性能显著优于Muon和AdamW基线。

精选帖子

香港中文大学提出新型优化器Pion，在等谱流形上更新大模型参数

Muon优化器在VLA和RLVR训练中的局限性及Pion补救方案

相关作者