mindspore.nn.BiDense

class mindspore.nn.BiDense(in1_channels, in2_channels, out_channels, weight_init=None, bias_init=None, has_bias=True)[源代码]

双线性全连接层。

公式如下:

\[y = x_1^T A x_2 + b,\]

其中 \(x_{1}\) 是第一个输入Tensor,\(x_{2}\) 是第二个输入Tensor,\(A\) 是一个权重矩阵,其数据类型与 \(x_{*}\) 相同, \(b\) 是一个偏置向量,其数据类型与 \(x_{*}\) 相同(仅当has_bias为True时)。

参数:

  • in1_channels (int) - BiDense层第一个输入Tensor的空间维度。

  • in2_channels (int) - BiDense层第二个输入Tensor的空间维度。

  • out_channels (int) - BiDense层输出Tensor的空间维度。

  • weight_init (Union[Tensor, str, Initializer, numbers.Number]) - 权重参数的初始化方法。str的值引用自函数 initializer。默认值:None。

  • bias_init (Union[Tensor, str, Initializer, numbers.Number]) - 偏置参数的初始化方法。str的值引用自函数 initializer。默认值:None。

  • has_bias (bool) - 是否使用偏置向量 \(\text{bias}\) 。默认值:True。

形状:

  • input1 - \((*, H_{in1})\),其中 \(H_{in1}=\text{in1_channels}\)\(*\) 为任意维度. input1除最后一维外的维度需与其他输入保持一致。

  • input2 - \((*, H_{in2})\),其中 \(H_{in2}=\text{in2_channels}\)\(*\) 为任意维度. input2除最后一维外的维度需与其他输入保持一致。

  • output - \((*, H_{out})\),其中 \(H_{out}=\text{out_channels}\)\(*\) 为任意维度. output除最后一维外的维度需与所有输入保持一致。

数据类型:

  • input1 (Tensor) - 数据类型必须为float16或float32,且与input1一致。

  • input2 (Tensor) - 数据类型必须为float16或float32,且与input2一致。

  • output (Tensor) - 数据类型与输入保持一致。

权重:

  • weight (Parameter) - 权重参数,shape为 \((\text{out_channels}, \text{in1_channels}, \text{in2_channels})\)。 当 weight_init 设为 None 时,其初始化值服从 \(\mathcal{U}(-\sqrt{k}, \sqrt{k})\),其中 \(k = \frac{1}{\text{in1_channels}}\)

  • bias (Parameter) - 偏置参数,shape为 \((\text{out_channels})\)。 当 has_bias 设为 Truebias_init 设为 None 时,其初始化值服从 \(\mathcal{U}(-\sqrt{k}, \sqrt{k})\),其中 \(k = \frac{1}{\text{in1_channels}}\)

异常:

  • TypeError - in_channelsout_channels 不是整数。

  • TypeError - has_bias 不是bool值。

  • ValueError - weight_init 的shape长度不等于3,weight_init 的shape[0]不等于 out_channels,或者 weight_init 的shape[1]不等于 in1_channels,或者 weight_init 的shape[2]不等于 in2_channels

  • ValueError - bias_init 的shape长度不等于1或 bias_init 的shape[0]不等于 out_channels

支持平台:

Ascend GPU CPU

样例:

>>> x1 = Tensor(np.random.randn(128, 20), mindspore.float32)
>>> x2 = Tensor(np.random.randn(128, 30), mindspore.float32)
>>> net = nn.BiDense(20, 30, 40)
>>> output = net(x1, x2)
>>> print(output.shape)
(128, 40)