整体架构

查看源文件

MindFormers整体架构可分为如下几个部分:

  1. 在硬件层面,MindFormers支持用户在Ascend服务器上运行大模型;

  2. 在软件层面,MindFormers通过MindSpore提供的Python接口实现大模型相关代码,并由昇腾AI处理器配套软件包提供的算子库进行数据运算;

  3. MindFormers目前支持的基础功能特性如下:

    1. 支持大模型分布式并行运行训练和推理等任务,并行能力包括数据并行、模型并行、超长序列并行等;

    2. 支持模型权重转换分布式权重切分与合并、不同格式数据集加载以及断点续训等功能;

    3. 支持20+大模型预训练微调推理评测等功能,同时支持对模型参数进行量化,具体支持模型列表可参考模型库

  4. MindFormers支持用户通过MindIE进行模型服务化部署功能,同时支持使用MindX实现大规模集群调度;后续将支持更多第三方平台,敬请期待。

/overall_architecture