文档反馈

问题文档片段

问题文档片段包含公式时，显示为空格。

提交类型

issue

有点复杂...

找人问问吧。

PR

小问题，全程线上修改...

一键搞定！

请选择提交类型

问题类型

规范和低错类

- 规范和低错类：

- 错别字或拼写错误，标点符号使用错误、公式错误或显示异常。

- 链接错误、空单元格、格式错误。

- 英文中包含中文字符。

- 界面和描述不一致，但不影响操作。

- 表述不通顺，但不影响理解。

- 版本号不匹配：如软件包名称、界面版本号。

易用性

- 易用性：

- 关键步骤错误或缺失，无法指导用户完成任务。

- 缺少主要功能描述、关键词解释、必要前提条件、注意事项等。

- 描述内容存在歧义指代不明、上下文矛盾。

- 逻辑不清晰，该分类、分项、分步骤的没有给出。

正确性

- 正确性：

- 技术原理、功能、支持平台、参数类型、异常报错等描述和软件实现不一致。

- 原理图、架构图等存在错误。

- 命令、命令参数等错误。

- 代码片段错误。

- 命令无法完成对应功能。

- 界面错误，无法指导操作。

- 代码样例运行报错、运行结果不符。

风险提示

- 风险提示：

- 对重要数据或系统存在风险的操作，缺少安全提示。

内容合规

- 内容合规：

- 违反法律法规，涉及政治、领土主权等敏感词。

- 内容侵权。

请选择问题类型

问题描述

点击输入详细问题描述，以帮助我们快速定位问题。

文档反馈

mindspore.common.initializer

初始化神经元参数。

class mindspore.common.initializer.Initializer(**kwargs)[源代码]

初始化器的抽象基类。

说明

Initializer本意是用于在并行模式中延迟Tensor的数据的初始化，而非初始化Tensor。如果必须使用Initializer来初始化Tensor，大多情况下需要在初始化之后使用 mindspore.Tensor.init_data() 。

参数：

kwargs (dict) - Initializer 的关键字参数。

mindspore.common.initializer.initializer(init, shape=None, dtype=mstype.float32)[源代码]

创建并初始化一个Tensor。

参数：

init (Union[Tensor, str, Initializer, numbers.Number]) - 初始化方式。
- Tensor - 用于初始化Tensor的Tensor。
- str - init 是继承自 Initializer 的类的别名，实际使用时会调用相应的类。 init 的值可以是 "normal" 、 "ones" 或 "zeros" 等。
- Initializer - init 是继承自 Initializer ，用于初始化Tensor的类。
- numbers.Number - 用于初始化Tensor的常量。
shape (Union[tuple, list, int]) - 被初始化的Tensor的shape，默认值： None 。
dtype (mindspore.dtype) - 被初始化的Tensor的数据类型，默认值： mstype.float32 。

返回：

返回shape是入参 shape 的Tensor。如果 shape 是 None，返回Tensor的shape是 init 的shape。

异常：

TypeError - 参数 init 的类型不正确。
ValueError - 当 init 传入Tensor对象时， init 的shape与形参 shape 内的数值不一致。

样例：

>>> import numpy as np
>>> import mindspore
>>> from mindspore import Tensor
>>> from mindspore.common.initializer import initializer, One
>>> from mindspore import Parameter
>>> data = Tensor(np.zeros([1, 2, 3]), mindspore.float32)
>>> w1 = Parameter(initializer(data, [1, 2, 3], mindspore.float32))
>>> w2 = Parameter(initializer('ones', [1, 2, 3], mindspore.float32))
>>> w3 = Parameter(initializer(One(), [1, 2, 3], mindspore.float32))
>>> w4 = Parameter(initializer(0, [1, 2, 3], mindspore.float32))

class mindspore.common.initializer.TruncatedNormal(sigma=0.01, mean=0.0, a=- 2.0, b=2.0)[源代码]

生成一个服从截断正态（高斯）分布的随机数组用于初始化Tensor。

参数：

sigma (float) - 截断正态分布的标准差，默认值： 0.01 。
mean (float) - 截断正态分布的平均值，默认值： 0.0 。
a (float) - 截断区间的下界，默认值： -2.0 。
b (float) - 截断区间的上界，默认值： 2.0 。

样例：

>>> import mindspore
>>> from mindspore.common.initializer import initializer, TruncatedNormal
>>> from mindspore import Parameter
>>> w1 = Parameter(initializer(TruncatedNormal(), [1, 2, 3], mindspore.float32))
>>> w2 = Parameter(initializer('truncatedNormal', [1, 2, 3], mindspore.float32))

class mindspore.common.initializer.Normal(sigma=0.01, mean=0.0)[源代码]

生成一个服从正态分布 $N (sigma, mean)$ 的随机数组用于初始化Tensor。

f (x) = \frac{1}{\sqrt{2 * π} * s i g m a} e x p (- \frac{(x - m e a n)^{2}}{2 * {s i g m a}^{2}})

参数：

sigma (float) - 正态分布的标准差，默认值： 0.01 。
mean (float) - 正态分布的均值，默认值： 0.0 。

样例：

>>> import mindspore
>>> from mindspore.common.initializer import initializer, Normal
>>> from mindspore import Parameter
>>> w1 = Parameter(initializer(Normal(), [1, 2, 3], mindspore.float32))
>>> w2 = Parameter(initializer('normal', [1, 2, 3], mindspore.float32))

class mindspore.common.initializer.Uniform(scale=0.07)[源代码]

生成一个服从均匀分布 $U (- scale, scale)$ 的随机数组用于初始化Tensor。

参数：

scale (float) - 均匀分布的边界，默认值： 0.07 。

样例：

>>> import mindspore
>>> from mindspore.common.initializer import initializer, Uniform
>>> from mindspore import Parameter
>>> w1 = Parameter(initializer(Uniform(), [1, 2, 3], mindspore.float32))
>>> w2 = Parameter(initializer('uniform', [1, 2, 3], mindspore.float32))

class mindspore.common.initializer.HeUniform(negative_slope=0, mode='fan_in', nonlinearity='leaky_relu')[源代码]

生成一个服从HeKaiming均匀分布 $U (- boundary, boundary)$ 的随机数组用于初始化Tensor，其中：

b o u n d a r y = gain \times \sqrt{\frac{3}{f a n_m o d e}}

$g a i n$ 是一个可选的缩放因子。如果参数 mode 是 'fan_in' ，则公式中的 $f a n_m o d e$ 是权重Tensor中输入单元的数量。如果参数 mode 是 'fan_out' ，则公式中的 $f a n_m o d e$ 是权重Tensor中输出单元的数量。

有关HeUniform算法，详情可参考 https://arxiv.org/abs/1502.01852。

参数：

negative_slope (int, float, bool) - 本层激活函数的负数区间斜率（仅适用于非线性激活函数 'leaky_relu'），默认值： 0 。
mode (str) - 可选 'fan_in' 或 'fan_out' 。 'fan_in' 会保留前向传递中权重方差的量级， 'fan_out' 会保留反向传递的量级。默认值： 'fan_in' 。
nonlinearity (str) - 非线性激活函数，推荐使用 'relu' 或 'leaky_relu' ，默认值： 'leaky_relu' 。

样例：

>>> import mindspore
>>> from mindspore.common.initializer import initializer, HeUniform
>>> from mindspore import Parameter
>>> w1 = Parameter(initializer(HeUniform(), [1, 2, 3], mindspore.float32))
>>> w2 = Parameter(initializer('he_uniform', [1, 2, 3], mindspore.float32))

class mindspore.common.initializer.HeNormal(negative_slope=0, mode='fan_in', nonlinearity='leaky_relu')[源代码]

生成一个服从HeKaiming正态分布 $N (0, {sigma}^{2})$ 的随机数组用于初始化Tensor，其中：

s i g m a = \frac{g a i n}{\sqrt{f a n_m o d e}}

$g a i n$ 是一个可选的缩放因子。如果参数 mode 是 'fan_in' ，则公式中的 $f a n_m o d e$ 是权重Tensor中输入单元的数量。如果参数 mode 是 'fan_out' ，则公式中的 $f a n_m o d e$ 是权重Tensor中输出单元的数量。

HeNormal 算法的详细信息，请查看 https://arxiv.org/abs/1502.01852。

参数：

negative_slope (int, float) - 本层激活函数的负数区间斜率（仅适用于非线性激活函数 'leaky_relu'），默认值： 0 。
mode (str) - 可选 'fan_in' 或 'fan_out' 。 'fan_in' 会保留前向传递中权重方差的量级， 'fan_out' 会保留反向传递的量级。默认值： 'fan_in' 。
nonlinearity (str) - 非线性激活函数，推荐使用 'relu' 或 'leaky_relu' ，默认值： 'leaky_relu' 。

样例：

>>> import mindspore
>>> from mindspore.common.initializer import initializer, HeNormal
>>> from mindspore import Parameter
>>> w1 = Parameter(initializer(HeNormal(), [1, 2, 3], mindspore.float32))
>>> w2 = Parameter(initializer('he_normal', [1, 2, 3], mindspore.float32))

class mindspore.common.initializer.XavierNormal(gain=1)[源代码]

生成一个服从Xavier正态分布的随机数组 $N (0, {sigma}^{2})$ 用于初始化Tensor，其中：

s i g m a = g a i n * \sqrt{\frac{2}{n_{i n} + n_{o u t}}}

$g a i n$ 是一个可选的缩放因子。 $n_{i n}$ 为权重Tensor中输入单元的数量， $n_{o u t}$ 为权重Tensor中输出单元的数量。

有关 XavierNormal 算法的详细信息，请查看 http://proceedings.mlr.press/v9/glorot10a.html。

参数：

gain (float) - 可选的缩放因子，默认值： 1 。

样例：

>>> import mindspore
>>> from mindspore.common.initializer import initializer, XavierNormal
>>> from mindspore import Parameter
>>> w1 = Parameter(initializer(XavierNormal(), [1, 2, 3], mindspore.float32))
>>> w2 = Parameter(initializer('xavier_normal', [1, 2, 3], mindspore.float32))

class mindspore.common.initializer.XavierUniform(gain=1)[源代码]

生成一个服从Xavier均匀分布 $U (- boundary, boundary)$ 的随机数组用于初始化Tensor，均匀分布的取值范围为[-boundary, boundary]，其中：

b o u n d a r y = g a i n * \sqrt{\frac{6}{n_{i n} + n_{o u t}}}

$g a i n$ 是一个可选的缩放因子。 $n_{i n}$ 为权重Tensor中输入单元的数量， $n_{o u t}$ 为权重Tensor中输出单元的数量。

有关 XavierUniform 算法的详细信息，请查看 http://proceedings.mlr.press/v9/glorot10a.html。

参数：

gain (float) - 可选的缩放因子，默认值： 1 。

样例：

>>> import mindspore
>>> from mindspore.common.initializer import initializer, XavierUniform
>>> from mindspore import Parameter
>>> w1 = Parameter(initializer(XavierUniform(), [1, 2, 3], mindspore.float32))
>>> w2 = Parameter(initializer('xavier_uniform', [1, 2, 3], mindspore.float32))

class mindspore.common.initializer.One(**kwargs)[源代码]

生成一个值全为1的常量数组用于初始化Tensor。

样例：

>>> import mindspore
>>> from mindspore.common.initializer import initializer, One
>>> from mindspore import Parameter
>>> w1 = Parameter(initializer(One(), [1, 2, 3], mindspore.float32))
>>> w2 = Parameter(initializer('ones', [1, 2, 3], mindspore.float32))

class mindspore.common.initializer.Zero(**kwargs)[源代码]

生成一个值全为0的常量数组用于初始化Tensor。

样例：

>>> import mindspore
>>> from mindspore.common.initializer import initializer, Zero
>>> from mindspore import Parameter
>>> w1 = Parameter(initializer(Zero(), [1, 2, 3], mindspore.float32))
>>> w2 = Parameter(initializer('zeros', [1, 2, 3], mindspore.float32))

class mindspore.common.initializer.Constant(value)[源代码]

生成一个常量数组用于初始化Tensor。

参数：

value (Union[int, numpy.ndarray]) - 用于初始化的常数值或者数组。

样例：

>>> import mindspore
>>> from mindspore.common.initializer import initializer, Constant
>>> from mindspore import Parameter
>>> w1 = Parameter(initializer(Constant(3), [1, 2, 3], mindspore.float32))

class mindspore.common.initializer.Identity(**kwargs)[源代码]

生成一个二维的单位矩阵用于初始化Tensor。

异常：

ValueError - 被初始化的Tensor的维度不等于2。

样例：

>>> import mindspore
>>> from mindspore.common.initializer import initializer, Identity
>>> from mindspore import Parameter
>>> w1 = initializer(Identity(), [2, 3], mindspore.float32)
>>> w2 = initializer('identity', [2, 3], mindspore.float32)

class mindspore.common.initializer.Sparse(sparsity, sigma=0.01)[源代码]

生成一个二维的稀疏矩阵用于初始化Tensor。矩阵非0的位置的值服从正态分布 $N (0, s i g m a)$ 。

参数：

sparsity (float) - 矩阵每列中元素被置0的比例。
sigma (float) - 正态分布的标准差，默认值： 0.01 。

异常：

ValueError - 被初始化的Tensor的维度不等于2。

样例：

>>> import mindspore
>>> from mindspore.common.initializer import initializer, Sparse
>>> from mindspore import Parameter
>>> w1 = Parameter(initializer(Sparse(sparsity=0.1, sigma=0.01), [5, 8], mindspore.float32))

class mindspore.common.initializer.Dirac(groups=1)[源代码]

利用Dirac delta函数生成一个矩阵用于初始化Tensor。Dirac初始化方式通常用于卷积层，会尽可能多的保留输入的特性。

参数：

groups (int) - 卷积层中的分组数量，每个组执行相同的初始化。默认值： 1 。

异常：

ValueError - 被初始化的Tensor的维度不在[3, 4, 5]的范围内。
ValueError - 被初始化的Tensor的第一个维度不能被groups整除。

样例：

>>> import mindspore
>>> from mindspore.common.initializer import initializer, Dirac
>>> from mindspore import Parameter
>>> w1 = Parameter(initializer(Dirac(groups=2), [6, 4, 3, 3], mindspore.float32))
>>> w2 = Parameter(initializer("dirac", [6, 4, 3, 3], mindspore.float32))

class mindspore.common.initializer.Orthogonal(gain=1.)[源代码]

生成一个正交或半正交矩阵用于初始化Tensor。被初始化的Tensor的维度至少为2。如果维度大于2，多余的维度将会被展平。

参数：

gain (float) - 可选的比例因子，默认值为 1.0 。

异常：

ValueError - 被初始化的Tensor的维度小于2。

样例：

>>> import mindspore
>>> from mindspore.common.initializer import initializer, Orthogonal
>>> from mindspore import Parameter
>>> w1 = Parameter(initializer(Orthogonal(gain=2.), [2, 3, 4], mindspore.float32))
>>> w2 = Parameter(initializer('orthogonal', [2, 3, 4], mindspore.float32))

class mindspore.common.initializer.VarianceScaling(scale=1.0, mode='fan_in', distribution='truncated_normal')[源代码]

生成一个随机的矩阵用于初始化Tensor。

当 distribution 是 'truncated_normal' 或者 'untruncated_normal' 时，矩阵中的值将服从均值为0，标准差为 $s t d d e v = \sqrt{\frac{s c a l e}{n}}$ 的截断或者非截断正态分布。

如果 mode 是 'fan_in'， $n$ 是输入单元的数量；如果 mode 是 'fan_out'， $n$ 是输出单元的数量；如果 mode 是 'fan_avg' ， $n$ 是输入输出单元数量的均值。

当 distribution 是 'uniform' 时，矩阵中的值将服从均匀分布 $[- \sqrt{\frac{3 * s c a l e}{n}}, \sqrt{\frac{3 * s c a l e}{n}}]$ 。

参数：

scale (float) - 比例因子，默认值； 1.0 。
mode (str) - 其值应为 'fan_in' 、 'fan_out' 或者 'fan_avg' ，默认值： 'fan_in' 。
distribution (str) - 用于采样的分布类型。其值应为 'uniform' 、 'truncated_normal' 或 'untruncated_normal' ，默认值： 'truncated_normal' 。

异常：

ValueError - scale 小于等于0。
ValueError - mode 不是 'fan_in' 、 'fan_out' 或者 'fan_avg' 。
ValueError - distribution 不是 'truncated_normal' 、 'untruncated_normal' 或者 'uniform' 。

样例：

>>> import mindspore
>>> from mindspore.common.initializer import initializer, VarianceScaling
>>> from mindspore import Parameter
>>> w1 = Parameter(initializer(VarianceScaling(scale=1.0, mode='fan_out',
...                                            distribution='untruncated_normal'), [2, 3], mindspore.float32))
>>> w2 = Parameter(initializer('varianceScaling', [2, 3], mindspore.float32))