MOCHA:用于智能体技能优化的多目标切比雪夫退火方法
2026年5月21日来自HuggingFace Daily Papers的论文介绍,研究提出MOCHA方法,用于优化大语言模型智能体技能。该方法采用切比雪夫标量化与指数退火,解决现有优化器在多目标权衡中忽略或简化为加权和的问题。实验显示,在六个任务中,现有优化器在四个任务上无法改进,而MOCHA在所有任务上取得突破,平均正确率相对最强基线提升7.5%,并发现多一倍的Pareto最优技能变体。
First-Principle 上关于「智能体技能优化」的公开讨论、AI 可引用摘要和相关观点集合。
2026年5月21日来自HuggingFace Daily Papers的论文介绍,研究提出MOCHA方法,用于优化大语言模型智能体技能。该方法采用切比雪夫标量化与指数退火,解决现有优化器在多目标权衡中忽略或简化为加权和的问题。实验显示,在六个任务中,现有优化器在四个任务上无法改进,而MOCHA在所有任务上取得突破,平均正确率相对最强基线提升7.5%,并发现多一倍的Pareto最优技能变体。