mindspore.nn.DynamicLossScaleUpdateCell
- class mindspore.nn.DynamicLossScaleUpdateCell(loss_scale_value, scale_factor, scale_window)[源代码]
用于动态更新损失缩放系数(loss scale)的神经元。
使用混合精度功能进行训练时,初始损失缩放系数值为 loss_scale_value。在每个训练步骤中,当出现溢出时,通过计算公式 loss_scale/scale_factor 减小损失缩放系数。如果连续 scale_window 步(step)未溢出,则将通过 loss_scale * scale_factor 增大损失缩放系数。
该类是
mindspore.amp.DynamicLossScaleManager
的 get_update_cell 方法的返回值。训练过程中,类mindspore.nn.TrainOneStepWithLossScaleCell
会调用该Cell来更新损失缩放系数。- 参数:
loss_scale_value (float) - 初始的损失缩放系数。
scale_factor (int) - 增减系数。
scale_window (int) - 未溢出时,增大损失缩放系数的最大连续训练步数。
- 输入:
loss_scale (Tensor) - 训练期间的损失缩放系数,是一个标量。
overflow (bool) - 是否发生溢出。
- 输出:
Bool,即输入 overflow 。
- 支持平台:
Ascend
GPU
样例:
>>> import numpy as np >>> from mindspore import Tensor, Parameter, nn >>> import mindspore.ops as ops >>> >>> class Net(nn.Cell): ... def __init__(self, in_features, out_features): ... super(Net, self).__init__() ... self.weight = Parameter(Tensor(np.ones([in_features, out_features]).astype(np.float32)), ... name='weight') ... self.matmul = ops.MatMul() ... ... def construct(self, x): ... output = self.matmul(x, self.weight) ... return output ... >>> in_features, out_features = 16, 10 >>> net = Net(in_features, out_features) >>> loss = nn.MSELoss() >>> optimizer = nn.Momentum(net.trainable_params(), learning_rate=0.1, momentum=0.9) >>> net_with_loss = nn.WithLossCell(net, loss) >>> manager = nn.DynamicLossScaleUpdateCell(loss_scale_value=2**12, scale_factor=2, scale_window=1000) >>> train_network = nn.TrainOneStepWithLossScaleCell(net_with_loss, optimizer, scale_sense=manager) >>> input = Tensor(np.ones([out_features, in_features]), mindspore.float32) >>> labels = Tensor(np.ones([out_features,]), mindspore.float32) >>> output = train_network(input, labels)