mindspore.ops.BatchNorm

class mindspore.ops.BatchNorm(is_training=False, epsilon=1e-5, momentum=0.1, data_format='NCHW')[源代码]

对输入数据进行归一化(Batch Normalization)和更新参数。

批量归一化广泛应用于卷积神经网络中。此运算对输入应用归一化，避免内部协变量偏移，详见论文 Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift 。使用mini-batch数据和学习参数进行训练，学习的参数见如下公式中，

\[y = \frac{x - mean}{\sqrt{variance + \epsilon}} * \gamma + \beta\]

其中， \(\gamma\) 为 scale， \(\beta\) 为 bias， \(\epsilon\) 为 epsilon， \(mean\) 为 \(x\) 的均值， \(variance\) 为 \(x\) 的方差。

警告

如果该运算用于推理，并且输出"reserve_space_1"和"reserve_space_2"可用，则"reserve_space_1"的值与"mean"相同，"reserve_space_2"的值与"variance"相同。
对于Ascend 310，由于平方根指令，结果精度未能达到1‰。

参数：

is_training (bool，可选) - 如果 is_training 为True，则在训练期间计算 mean 和 variance。如果 is_training 为False，则在推理期间从checkpoint加载。默认值： False 。
epsilon (float，可选) - 添加到分母上的值，以确保数值稳定性。默认值： 1e-5 ，取值范围为(0, 1] 。
momentum (float，可选) - 动态均值和动态方差所使用的动量。（例如 \(new\_running\_mean = (1 - momentum) * running\_mean + momentum * current\_mean\)）。动量值必须为[0, 1]。默认值： 0.1 。
data_format (str，可选) - 输入数据格式，可选值有： 'NHWC' 或 'NCHW' ， 'NHWC' 仅在GPU上支持。默认值： 'NCHW' 。

输入：

input_x (Tensor) - 数据输入，shape为 \((N, C)\) 的Tensor，数据类型为float16或float32。
scale (Union[Parameter, Tensor]) - 输入Scalar，shape为 \((C,)\) 的Tensor或Parameter，数据类型为float16或float32。
bias (Union[Parameter, Tensor]) - 输入偏置项，shape为 \((C,)\) 的Tensor或Parameter，具有与 scale 相同的数据类型。
mean (Union[Parameter, Tensor]) - 输入均值，shape为 \((C,)\) 的Tensor或Parameter，具有与 scale 相同的数据类型。
variance (Union[Parameter, Tensor]) - 输入方差，shape为 \((C,)\) 的TTensor或Parameter，具有与 scale 相同的数据类型。

输出：

5个Tensor组成的tuple、归一化输入和更新的参数。

output_x (Tensor) - 数据类型和shape与输入 input_x 相同。shape为 \((N, C)\) 。
batch_mean (Tensor) - 输入的均值，shape为 \((C,)\) 的一维Tensor。
batch_variance (Tensor) - 输入的方差，shape为 \((C,)\) 的一维Tensor。
reserve_space_1 (Tensor) - 需要计算梯度时，被重新使用的均值，shape为 \((C,)\) 的一维Tensor。
reserve_space_2 (Tensor) - 需要计算梯度时，被重新使用的方差，shape为 \((C,)\) 的一维Tensor。

异常：

TypeError： is_training 不是bool。
TypeError： epsilon 或 momentum 的数据类型不是float。
TypeError： data_format 不是str。
TypeError： input_x、scale、bias、mean 或 variance 不是Tensor。
TypeError： input_x 和 scale 的数据类型既不是float16，也不是float32。

支持平台：

Ascend GPU CPU

样例：

>>> import mindspore
>>> import numpy as np
>>> from mindspore import Tensor, ops
>>> input_x = Tensor(np.ones([2, 2]), mindspore.float32)
>>> scale = Tensor(np.ones([2]), mindspore.float32)
>>> bias = Tensor(np.ones([2]), mindspore.float32)
>>> mean = Tensor(np.ones([2]), mindspore.float32)
>>> variance = Tensor(np.ones([2]), mindspore.float32)
>>> batch_norm = ops.BatchNorm()
>>> output = batch_norm(input_x, scale, bias, mean, variance)
>>> print(output[0])
[[1. 1.]
 [1. 1.]]