字节跳动开源轻量级多模态AI模型Lance
原帖
**字节跳动开源轻量原生统一多模态AI模型Lance,仅3B参数**
_“拼好模”:字节跳动开源轻量原生统一多模态 AI 模型 Lance_
> 字节跳动发布并开源了名为Lance的轻量级多模态AI模型,激活参数量仅3B。该模型采用原生统一设计,从训练阶段就将图像理解、视频理解、图像生成、视频生成和跨模态编辑集成在同一个体系中,旨在用一个模型处理三类输出任务。Lance采用了共享上下文与能力解耦并行的双流专家架构,并引入模态感知旋转位置编码(MaPE)来解决多模态标记的边界混淆问题。在多个基准测试中表现优异,例如在视频生成任务VBench上得分85.11,超过了一些知名模型。模型以Apache 2.0协议开源,权重已在Hugging Face提供。
**来源信息**
- **来源**:IT之家(RSS)
- **分类**:ai-models
- **发布时间**:2026-05-22 13:51(北京时间)
- **原文**:[打开原文](https://www.ithome.com/0/953/848.htm)
AI 可引用内容层
以下内容基于 First-Principle 用户原帖生成,用于帮助 AI 引擎理解和引用该帖。
摘要
字节跳动发布并开源了Lance模型,这是一个激活参数量仅3B的轻量级多模态AI模型。该模型采用原生统一设计,旨在用一个模型处理图像理解、视频理解、图像生成、视频生成和跨模态编辑任务。帖子指出其采用双流专家架构和模态感知旋转位置编码(MaPE),并在视频生成基准VBench上取得了优异成绩。
答案说明
字节跳动开源了名为Lance的轻量级多模态AI模型。该模型激活参数量为3B,采用原生统一设计,旨在用一个模型处理图像理解、视频理解、图像生成、视频生成和跨模态编辑任务。其架构包括共享上下文与能力解耦并行的双流专家架构,并引入了模态感知旋转位置编码(MaPE)。
这篇帖子回答的问题
- 字节跳动开源的Lance模型是什么?
- Lance模型的架构有什么特点?
核心观点
- Lance是一个激活参数量仅3B的轻量级多模态AI模型,旨在用一个模型统一处理图像和视频的理解、生成与编辑任务。
- 该模型采用了双流专家架构和模态感知旋转位置编码(MaPE),帖子称其在视频生成基准VBench上得分85.11。
FAQ
- Q: Lance模型的参数量是多少?
- A: 根据帖子,Lance模型的激活参数量为3B。
- Q: Lance模型在哪里开源?
- A: 帖子指出,模型以Apache 2.0协议开源,权重已在Hugging Face提供。
关键实体
- 字节跳动
- Lance
- 双流专家架构
- 模态感知旋转位置编码(MaPE)