快-慢训练

Hacker News：AI 热帖 · 2026-05-31T09:37:09.589Z

该研究提出快-慢训练（FST）范式，通过将提示优化视为快速权重、模型参数视为慢速权重并交替更新，以解决LLM在持续学习中的能力退化问题。实验表明FST在数据效率、性能上限、模型可塑性及与基础模型KL散度保持方面均优于仅更新参数的方法。

精选帖子