mindspore.nn.GELU

class mindspore.nn.GELU(approximate=True)[源代码]

高斯误差线性单元激活函数(Gaussian error linear unit activation function)。

对输入的每个元素计算GELU。 输入是任意有效形状的Tensor。

GELU的定义如下:

GELU(xi)=xiP(X<xi),

其中 P 是标准高斯分布的累积分布函数, xi 是输入的元素。

GELU相关图参见 GELU

参数:

  • approximate (bool) - 是否启用approximation,默认值:True。如果approximate的值为True,则高斯误差线性激活函数为:

0.5x(1+tanh(sqrt(2/pi)(x+0.044715x3)))

否则为: xP(X<=x)=0.5x(1+erf(x/sqrt(2))), where P(X) ~ N(0, 1) 。

输入:

  • x (Tensor) - 用于计算GELU的Tensor。数据类型为float16或float32。shape是 (N,) 表示任意的附加维度数。

输出:

Tensor,具有与 x 相同的数据类型和shape。

异常:

  • TypeError - x 的数据类型既不是float16也不是float32。

支持平台:

Ascend GPU CPU

样例:

>>> x = Tensor(np.array([[-1.0, 4.0, -8.0], [2.0, -5.0, 9.0]]), mindspore.float32)
>>> gelu = nn.GELU()
>>> output = gelu(x)
>>> print(output)
[[-1.5880802e-01  3.9999299e+00 -3.1077917e-21]
 [ 1.9545976e+00 -2.2918017e-07  9.0000000e+00]]
>>> gelu = nn.GELU(approximate=False)
>>> # CPU not support "approximate=False", using "approximate=True" instead
>>> output = gelu(x)
>>> print(output)
[[-1.5865526e-01  3.9998732e+00 -0.0000000e+00]
 [ 1.9544997e+00 -1.4901161e-06  9.0000000e+00]]