≡ AI工具

LMDeploy – 上海AI Lab开源的大模型推理部署工具

分类:AI工具
LMDeploy – 上海AI Lab开源的大模型推理部署工具

LMDeploy是什么

LMDeploy 是上海人工智能实验室推出的大模型推理部署工具,能显著提升大模型的推理性能,支持多种硬件架构,包括 NVIDIA 的 Hopper 和 Ampere 系列 GPU,实现了 FP8 和 MXFP4 等高效量化技术。LMDeploy 提供从模型量化到推理优化的全流程支持,支持多机多卡分布式推理,能满足大规模生产环境的需求。LMDeploy 具备良好的兼容性和易用性,方便开发者快速部署和使用大语言模型。

LMDeploy