整体架构
MindFormers整体架构可分为如下几个部分:
在硬件层面,MindFormers支持用户在Ascend服务器上运行大模型;
在软件层面,MindFormers通过MindSpore提供的Python接口实现大模型相关代码,并由昇腾AI处理器配套软件包提供的算子库进行数据运算;
MindFormers目前支持的基础功能特性如下:
支持大模型分布式并行运行训练和推理等任务,并行能力包括数据并行、模型并行、超长序列并行等;
支持模型权重转换、分布式权重切分与合并、不同格式数据集加载以及断点续训等功能;
支持20+大模型预训练、微调、推理和评测等功能,同时支持对模型参数进行量化,具体支持模型列表可参考模型库;
MindFormers支持用户通过MindIE进行模型服务化部署功能,同时支持使用MindX实现大规模集群调度;后续将支持更多第三方平台,敬请期待。