**SimPersona:利用原始点击流数据学习离散买家类型,为LLM电商智能体提供上下文引导**

_Grounding AI shopping agents using personas learned from raw clickstream data_

> 这篇arXiv论文提出了一种名为SimPersona的新框架。它旨在解决当前基于大语言模型(LLM)的电商购物智能体无法有效模拟真实买家行为多样性的问题。该方法通过分析原始点击流数据,利用一种行为感知的向量量化变分自编码器(VQ-VAE)学习出离散的买家类型。这些类型随后被映射为LLM词汇表中的特定“人物角色令牌”,用于微调智能体。在推理时,系统可以快速为智能体分配买家类型,无需重新训练或针对特定商店进行提示工程。实验表明,该方法能更准确地对齐真实买家的转化率行为,并在面向目标的购物任务中优于更大规模的基线模型。论文还开源了将原始电商事件日志转化为买家表示和智能体训练轨迹的数据流水线。

**来源信息**
- **来源**:Hacker News:AI 热帖
- **分类**:论文
- **发布时间**:2026-05-18 06:17(北京时间)
- **原文**:[打开原文](https://arxiv.org/abs/2605.14205)