mindspore.nn.BatchNorm2d

查看源文件
class mindspore.nn.BatchNorm2d(num_features, eps=1e-05, momentum=0.9, affine=True, gamma_init='ones', beta_init='zeros', moving_mean_init='zeros', moving_var_init='ones', use_batch_statistics=None, data_format='NCHW', dtype=mstype.float32)[源代码]

在四维输入(具有额外通道维度的小批量二维输入)上应用批归一化处理(Batch Normalization Layer),以避免内部协变量偏移。批归一化广泛应用于卷积网络中。请见论文 Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift 。使用mini-batch数据和学习参数进行训练,这些参数见以下公式:

\[y = \frac{x - \mathrm{E}[x]}{\sqrt{\mathrm{Var}[x] + \epsilon}} * \gamma + \beta\]

说明

BatchNorm的实现在图模式和PyNative模式下是不同的,因此不建议在网络初始化后更改其模式。

需要注意的是,更新 \(moving\_mean\)\(moving\_var\) 的公式为:

\[\begin{split}\text{moving_mean}=\text{moving_mean*momentum}+μ_β\text{*(1−momentum)}\\ \text{moving_var}=\text{moving_var*momentum}+σ^2_β\text{*(1−momentum)}\end{split}\]

其中, \(moving\_mean\) 是更新后的均值, \(moving\_var\) 是更新后的方差, \(μ_β, σ^2_β\) 是每一批的数据的观测值(均值和方差)。

参数:
  • num_features (int) - 通道数量,输入Tensor shape \((N, C, H, W)\) 中的 C

  • eps (float) - \(\epsilon\) 加在分母上的值,以确保数值稳定。默认值: 1e-5

  • momentum (float) - 动态均值和动态方差所使用的动量。默认值: 0.9

  • affine (bool) - bool类型。设置为 True 时,可学习 \(\gamma\)\(\beta\) 值。默认值: True

  • gamma_init (Union[Tensor, str, Initializer, numbers.Number]) - \(\gamma\) 参数的初始化方法。str的值引用自函数 mindspore.common.initializer ,包括 'zeros''ones' 等。默认值: 'ones'

  • beta_init (Union[Tensor, str, Initializer, numbers.Number]) - \(\beta\) 参数的初始化方法。str的值引用自函数 mindspore.common.initializer ,包括 'zeros''ones' 等。默认值: 'zeros'

  • moving_mean_init (Union[Tensor, str, Initializer, numbers.Number]) - 动态平均值的初始化方法。str的值引用自函数 mindspore.common.initializer ,包括 'zeros''ones' 等。默认值: 'zeros'

  • moving_var_init (Union[Tensor, str, Initializer, numbers.Number]) - 动态方差的初始化方法。str的值引用自函数 mindspore.common.initializer ,包括 'zeros''ones' 等。默认值: 'ones'

  • use_batch_statistics (bool) - 默认值: None

    • 如果为 True ,则使用当前批处理数据的平均值和方差值,并跟踪运行平均值和运行方差。

    • 如果为 False ,则使用指定值的平均值和方差值,不跟踪统计值。

    • 如果为 None ,则根据训练和验证模式自动设置 use_batch_statisticsTrueFalse 。在训练时, use_batch_statistics会 设置为 True 。在验证时, use_batch_statistics 会自动设置为 False

  • data_format (str) - 数据格式可为 'NHWC''NCHW' 。默认值:'NCHW'

  • dtype (mindspore.dtype) - Parameters的dtype。默认值: mstype.float32

输入:
  • x (Tensor) - 输入shape为 \((N, C, H, W)\) 的Tensor。支持数据类型:float16、float32。

输出:

Tensor,归一化后的Tensor,shape为 \((N, C, H, W)\)

异常:
  • TypeError - num_features 不是整数。

  • TypeError - eps 不是浮点数。

  • ValueError - num_features 小于1。

  • ValueError - momentum 不在范围[0, 1]内。

  • ValueError - data_format 既不是'NHWC'也不是'NCHW'。

支持平台:

Ascend GPU CPU

样例:

>>> import numpy as np
>>> import mindspore as ms
>>> net = ms.nn.BatchNorm2d(num_features=3)
>>> x = ms.Tensor(np.ones([1, 3, 2, 2]).astype(np.float32))
>>> output = net(x)
>>> print(output)
[[[[ 0.999995 0.999995 ]
   [ 0.999995 0.999995 ]]
  [[ 0.999995 0.999995 ]
   [ 0.999995 0.999995 ]]
  [[ 0.999995 0.999995 ]
   [ 0.999995 0.999995 ]]]]