mindspore.mint.nn.functional.batch_norm

查看源文件
mindspore.mint.nn.functional.batch_norm(input, running_mean, running_var, weight=None, bias=None, training=False, momentum=0.1, eps=1e-05)[源代码]

对输入数据进行批量归一化和更新参数。

批量归一化广泛应用于卷积神经网络中。此运算对输入应用归一化,避免内部协变量偏移,详见论文 Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift 。使用mini-batch数据和学习参数进行训练,学习的参数见如下公式中,

\[y = \frac{x - mean}{\sqrt{variance + \epsilon}} * \gamma + \beta\]

其中, \(\gamma\)weight\(\beta\)bias\(\epsilon\)eps\(mean\)\(x\) 的均值, \(variance\)\(x\) 的方差。

参数:
  • input (Tensor) - 数据输入,shape为 \((N, C, *)\) 的Tensor,其中 \(*\) 表示任意的附加维度。对于Atlas 训练系列产品,当前仅支持2-4维。支持数据类型为bfloat16,float16或float32。

  • running_mean (Tensor) - shape为 \((C,)\) ,数据类型为bfloat16,float16或float32。

  • running_var (Tensor) - shape为 \((C,)\) ,数据类型为bfloat16,float16或float32。

  • weight (Tensor, 可选) - shape为 \((C,)\) ,数据类型为bfloat16,float16或float32,默认值: None 。为 None 时,初始化为 1

  • bias (Tensor, 可选) - shape为 \((C,)\) ,数据类型为bfloat16,float16或float32,默认值: None 。为 None 时,初始化为 0

  • training (bool,可选) - 如果 trainingTruerunning_meanrunning_var 会在训练过程中进行计算。 如果 trainingFalse ,它们会在推理阶段从checkpoint中加载。默认值: False

  • momentum (float, 可选) - 动态均值和动态方差所使用的动量。(例如 \(new\_running\_mean = (1 - momentum) * running\_mean + momentum * current\_mean\))。默认值: 0.1

  • eps (float, 可选) - 添加到分母上的值,以确保数值稳定性。默认值: 1e-5

返回:

Tensor,数据类型与shape大小与 input 相同,其中,shape大小为 \((N, C, *)\)

异常:
  • TypeError - training 不是bool。

  • TypeError - epsmomentum 的数据类型不是float。

  • TypeError - inputweightbiasrunning_meanrunning_var 不是Tensor。

支持平台:

Ascend

样例:

>>> import mindspore
>>> from mindspore import Tensor, mint
>>> input_x = Tensor([[1.0, 2.0], [3.0, 4.0]], mindspore.float32)
>>> running_mean = Tensor([0.5, 1.5], mindspore.float32)
>>> running_var = Tensor([0.1, 0.2], mindspore.float32)
>>> weight = Tensor([2.0, 2.0], mindspore.float32)
>>> bias = Tensor([-1.0, -1.0], mindspore.float32)
>>> output = mint.nn.functional.batch_norm(input_x, running_mean, running_var, weight, bias)
>>> print(output)
[[ 2.1621194  1.2360122]
 [14.810596  10.180061 ]]