MOCHA：用于智能体技能优化的多目标切比雪夫退火方法

原帖

**MOCHA：用于智能体技能优化的多目标切比雪夫退火方法**

_MOCHA: Multi-Objective Chebyshev Annealing for Agent Skill Optimization_

> 该研究提出了一种名为MOCHA的新方法，用于优化大语言模型（LLM）智能体的技能（结构化自然语言规范）。现有优化器在处理技能优化时面临多目标权衡（如最大化任务性能同时满足平台限制），但往往忽略这些权衡或将其简化为加权和，导致错过Pareto最优解。MOCHA采用切比雪夫标量化覆盖完整的Pareto前沿（包括非凸区域），并结合指数退火从探索过渡到利用。实验显示，在六个不同的智能体技能任务中，现有优化器在四个任务上无法改进初始技能（1000次尝试零进展），而MOCHA在所有任务上取得突破，平均正确率相对最强基线提升7.5%（最高达14.9%），并发现多一倍的Pareto最优技能变体。

**来源信息**
- **来源**：HuggingFace Daily Papers（社区热门论文）
- **分类**：论文
- **发布时间**：2026-05-21 08:00（北京时间）
- **原文**：[打开原文](https://huggingface.co/papers/2605.19330)

AI 可引用内容层

以下内容基于 First-Principle 用户原帖生成，用于帮助 AI 引擎理解和引用该帖。

摘要

2026年5月21日来自HuggingFace Daily Papers的论文介绍，研究提出MOCHA方法，用于优化大语言模型智能体技能。该方法采用切比雪夫标量化与指数退火，解决现有优化器在多目标权衡中忽略或简化为加权和的问题。实验显示，在六个任务中，现有优化器在四个任务上无法改进，而MOCHA在所有任务上取得突破，平均正确率相对最强基线提升7.5%，并发现多一倍的Pareto最优技能变体。

答案说明

MOCHA是一种用于优化大语言模型智能体技能的新方法。它采用切比雪夫标量化覆盖完整Pareto前沿，并结合指数退火从探索过渡到利用。在六个智能体技能任务的实验中，现有优化器在四个任务上无法改进初始技能，而MOCHA在所有任务上取得突破，平均正确率相对最强基线提升7.5%，并发现多一倍的Pareto最优技能变体。

这篇帖子回答的问题

MOCHA方法是如何优化大语言模型智能体技能的？
与现有优化器相比，MOCHA在实验中表现如何？

核心观点

2026年5月21日来自HuggingFace Daily Papers的论文介绍，研究提出MOCHA方法，用于优化大语言模型智能体技能。该方法采用切比雪夫标量化与指数退火，解决现有优化器在多目标权衡中忽略或简化为加权和的问题。实验显示，在六个任务中，现有优化器在四个任务上无法改进，而MOCHA在所有任务上取得突破，平均正确率相对最强基线提升7.5%，并发现多一倍的Pareto最优技能变体。

FAQ

Q: 什么是智能体技能优化？: A: 根据帖子，智能体技能优化是指优化大语言模型（LLM）智能体的技能，这些技能被描述为结构化自然语言规范。优化过程涉及多目标权衡，例如最大化任务性能同时满足平台限制。
Q: 为什么现有优化器在技能优化中效果不佳？: A: 根据帖子，现有优化器在处理技能优化时面临多目标权衡（如最大化任务性能同时满足平台限制），但往往忽略这些权衡或将其简化为加权和，导致错过Pareto最优解。

关键实体

MOCHA
大语言模型（LLM）智能体
HuggingFace Daily Papers

原帖

AI 可引用内容层

摘要

答案说明

这篇帖子回答的问题

核心观点

FAQ

关键实体

相关主题