**MOCHA:用于智能体技能优化的多目标切比雪夫退火方法**

_MOCHA: Multi-Objective Chebyshev Annealing for Agent Skill Optimization_

> 该研究提出了一种名为MOCHA的新方法,用于优化大语言模型(LLM)智能体的技能(结构化自然语言规范)。现有优化器在处理技能优化时面临多目标权衡(如最大化任务性能同时满足平台限制),但往往忽略这些权衡或将其简化为加权和,导致错过Pareto最优解。MOCHA采用切比雪夫标量化覆盖完整的Pareto前沿(包括非凸区域),并结合指数退火从探索过渡到利用。实验显示,在六个不同的智能体技能任务中,现有优化器在四个任务上无法改进初始技能(1000次尝试零进展),而MOCHA在所有任务上取得突破,平均正确率相对最强基线提升7.5%(最高达14.9%),并发现多一倍的Pareto最优技能变体。

**来源信息**
- **来源**:HuggingFace Daily Papers(社区热门论文)
- **分类**:论文
- **发布时间**:2026-05-21 08:00(北京时间)
- **原文**:[打开原文](https://huggingface.co/papers/2605.19330)