MinT:管理数百万个大语言模型训练与服务的基础设施

本文介绍了MindLab Toolkit(MinT),一个用于LoRA微调后训练和在线服务的托管基础设施系统。该系统针对少量昂贵基模型部署下产出大量定制化策略的场景。MinT通过保持基模型驻留,并仅在服务接口后动态管理和调度LoRA适配器(其大小可小至基模型的1%)来完成整个生命周期(包括更新、评估、服务和回滚)。该系统在三个维度上实现了扩展:支持超过1万亿参数的前沿模型;通过仅移动适配器将部署步骤时间大幅缩短(在4B模型上减少18.3倍);并支持百万级可寻址策略目录的集群规模服务。这项工作旨在高效管理和部署基于同一基模型的海量LoRA微调模型。

来源:HuggingFace Daily Papers(社区热门论文)
分类:ai-models
发布时间:2026-05-14T00:00:00.000Z
原文:https://huggingface.co/papers/2605.13779