# MindSpore Lite总体架构

`Linux` `Windows` `端侧` `推理应用` `中级` `高级` `贡献者`

[![查看源文件](../../_static/logo_source.png)](https://gitee.com/mindspore/docs/blob/r1.2/docs/note/source_zh_cn/design/mindspore/architecture_lite.md)

MindSpore Lite框架的总体架构如下所示：

![architecture](./images/MindSpore-Lite-architecture.png)

- **前端（Frontend）：** 负责模型生成，用户可以通过模型构建接口构建模型，将第三方模型和MindSpore训练的模型转换为MindSpore Lite模型，其中第三方模型包括TensorFlow Lite、Caffe 1.0和ONNX模型。

- **IR：** 负责MindSpore的Tensor定义、算子定义和图定义。

- **Backend：** 基于IR进行图优化，包括GHLO、GLLO和量化三部分。其中，GHLO负责和硬件无关的优化，如算子融合、常量折叠等；GLLO负责与硬件相关的优化；量化Quantizer支持权重量化、激活值量化等训练后量化手段。

- **Runtime：** 智能终端的推理运行时，其中session负责会话管理，提供对外接口；线程池和并行原语负责图执行使用的线程池管理，内存分配负责图执行中各个算子的内存复用，算子库提供CPU、GPU和NPU算子。

- **Micro：** IoT设备的运行时，包括模型生成.c文件、线程池、内存复用和算子库。

其中，Runtime和Micro共享底层的算子库、内存分配、线程池、并行原语等基础设施层。