**UniSteer:基于文本引导的激活空间流匹配实现多功能LLM引导**

_UniSteer: Text-Guided Flow Matching in Activation Space for Versatile LLM Steering_

> 本文提出了UniSteer,一种文本引导的激活流匹配模型,用于在推理过程中干预大语言模型(LLM)的内部表示,以控制其行为(如个性和风格)。现有方法通常依赖固定的引导方向或任务特定的干预模块,难以适应细粒度概念和组合约束。UniSteer通过学习残差流激活的条件分布,在激活空间中构建一个通用的条件速度场。推理时,它通过部分传输源激活到潜在状态,并在目标文本条件下重新生成,然后注入回冻结的LLM。该模型还支持激活空间分类。实验表明,UniSteer在行为控制、真实性引导、细粒度概念引导、多约束指令遵循和激活空间分类方面提供了统一接口。

**来源信息**
- **来源**:HuggingFace Daily Papers(社区热门论文)
- **分类**:论文
- **发布时间**:2026-05-29 08:00(北京时间)
- **原文**:[打开原文](https://huggingface.co/papers/2605.30076)