基本介绍 || 快速入门 || 张量 Tensor || 数据加载与处理 || 网络构建 || 函数式自动微分 || 模型训练 || 保存与加载 || Graph Mode加速 ||

保存与加载

上一章节主要介绍了如何调整超参数，并进行网络模型训练。在训练网络模型的过程中，通常希望保存中间和最后的结果，用于微调（fine-tune）和后续的模型推理与部署，本章节我们将介绍如何保存与加载模型。

[1]:

import numpy as np
import mindspore
from mindspore import nn
from mindspore import Tensor

[2]:

def network():
    model = nn.SequentialCell(
                nn.Flatten(),
                nn.Dense(28*28, 512),
                nn.ReLU(),
                nn.Dense(512, 512),
                nn.ReLU(),
                nn.Dense(512, 10))
    return model

保存和加载模型权重

保存模型使用mindspore.save_checkpoint接口，传入网络和指定的保存路径：

[3]:

model = network()
mindspore.save_checkpoint(model, "model.ckpt")

为了加载模型权重，需要先创建相同模型的实例，然后使用load_checkpoint和load_param_into_net方法加载参数。

[4]:

model = network()
param_dict = mindspore.load_checkpoint("model.ckpt")
param_not_load, _ = mindspore.load_param_into_net(model, param_dict)
print(param_not_load)

[4]:

[]

param_not_load是未被加载的参数列表，为空时代表所有参数均加载成功。

当环境中安装有MindX DL（昇腾深度学习组件）6.0及以上版本时，默认启动MindIO加速CheckPoint功能，详情查看MindIO介绍。MindX DL在此处下载。

保存和加载MindIR

除Checkpoint外，MindSpore提供了云侧（训练）和端侧（推理）统一的中间表示（Intermediate Representation，IR）。可使用export接口直接将模型保存为MindIR（当前仅支持严格图模式）。

[5]:

mindspore.set_context(mode=mindspore.GRAPH_MODE, jit_syntax_level=mindspore.STRICT)
model = network()
inputs = Tensor(np.ones([1, 1, 28, 28]).astype(np.float32))
mindspore.export(model, inputs, file_name="model", file_format="MINDIR")

MindIR同时保存了Checkpoint和模型结构，因此需要定义输入Tensor来获取输入shape。

已有的MindIR模型可以方便地通过load接口加载，传入mindspore.nn.GraphCell即可进行推理。

nn.GraphCell仅支持图模式。

[6]:

graph = mindspore.load("model.mindir")
model = nn.GraphCell(graph)
outputs = model(inputs)
print(outputs.shape)

[6]:

(1, 10)

语法支持范围

并不是所有的 Python 语法和数据类型都支持 MindIR 导出，若不在支持范围内，导出时会报错。

MindIR导出仅支持STRICT级别的基础语法，详细的支持范围，可参考静态图语法支持。
返回值的数据类型只支持：
- Python 内置类型：int、float、bool、str、tuple、list。
- MindSpore 框架内置类型：Tensor、Parameter、COOTensor、CSRTensor。
例如下面的程序，返回值类型是 mindspore.dtype，不在支持范围内，MindIR 导出的时候就会报错。
```
import mindspore
from mindspore import nn, Tensor

class Model(nn.Cell):

    def construct(self, x: Tensor) -> mindspore.dtype:
        return x.dtype
```
nn.Cell的construct()方法中，不支持使用 mindspore.mint 包下的随机数生成接口，如mint.rand、mint.randn、mint.randint、mint.randperm。（建议改为使用 mindspore.ops 包下的随机数生成接口）。

Parameter对象只能定义在nn.Cell的__init__()方法中或者作为函数的输入参数，否则 MindIR 不支持导出该Parameter。例如下面的程序，有一个Parameter是全局变量，导出时会报错不支持。

import mindspore
from mindspore import Parameter, nn

# Parameter在nn.Cell外创建，并作为全局变量被Model使用。
global_param = Parameter([1, 2, 3], name='global_param')

class Model(nn.Cell):

    def __init__(self):
        super().__init__()
        # Parameter定义在nn.Cell的__init__()方法中，支持导出。
        self.bias = Parameter([0, 1, -1])

    def construct(self, x: Parameter):  # Parameter是函数的入参，支持导出。
        # global_param是全局变量，导出时会报错。
        return x + global_param + self.bias

model = Model()
param = Parameter([1, 2, 3], name='input_param')
mindspore.export(model, param, file_name="model", file_format="MINDIR")