MindSpore Lite总体架构

Linux Windows 端侧 推理应用 中级 高级 贡献者

查看源文件

MindSpore Lite框架的总体架构如下所示:

architecture

  • 前端(Frontend): 负责模型生成,用户可以通过模型构建接口构建模型,将第三方模型和MindSpore训练的模型转换为MindSpore Lite模型,其中第三方模型包括TensorFlow Lite、Caffe 1.0和ONNX模型。

  • IR: 负责MindSpore的Tensor定义、算子定义和图定义。

  • Backend: 基于IR进行图优化,包括GHLO、GLLO和量化三部分。其中,GHLO负责和硬件无关的优化,如算子融合、常量折叠等;GLLO负责与硬件相关的优化;量化Quantizer支持权重量化、激活值量化等训练后量化手段。

  • Runtime: 智能终端的推理运行时,其中session负责会话管理,提供对外接口;线程池和并行原语负责图执行使用的线程池管理,内存分配负责图执行中各个算子的内存复用,算子库提供CPU、GPU和NPU算子。

  • Micro: IoT设备的运行时,包括模型生成.c文件、线程池、内存复用和算子库。

其中,Runtime和Micro共享底层的算子库、内存分配、线程池、并行原语等基础设施层。