mindspore.mint.nn.functional.smooth_l1_loss

查看源文件
mindspore.mint.nn.functional.smooth_l1_loss(input, target, reduction='mean', beta=1.0)[源代码]

计算平滑L1损失,该L1损失函数有稳健性。

平滑L1损失是一种类似于MSELoss的损失函数,但对异常值相对不敏感,可以参阅论文 Fast R-CNN

给定长度为 \(N\) 的两个输入 \(x,\ y\) ,平滑L1损失的计算如下:

\[\begin{split}L_{i} = \begin{cases} \frac{0.5 (x_i - y_i)^{2}}{\text{beta}}, & \text{if } |x_i - y_i| < \text{beta} \\ |x_i - y_i| - 0.5 * \text{beta}, & \text{otherwise. } \end{cases}\end{split}\]

reduction 不是设定为 none 时,计算如下:

\[\begin{split}L = \begin{cases} \operatorname{mean}(L_{i}), & \text{if reduction} = \text{'mean';}\\ \operatorname{sum}(L_{i}), & \text{if reduction} = \text{'sum'.} \end{cases}\end{split}\]

其中, \(\text{beta}\) 控制损失函数在线性与二次间变换的阈值, \(\text{beta} \geq 0\) ,默认值是 1.0\(N\) 为batch size。

警告

这是一个实验性API,后续可能修改或删除。

说明

参数 inputtarget 遵循隐式类型转换规则,使数据类型保持一致。如果两参数数据类型不一致,则低精度类型会被转换成较高精度类型。

参数:
  • input (Tensor) - shape: \((N, *)\) ,其中 \(*\) 表示任意数量的附加维度。支持数据类型:

    • Ascend:float16、float32、bfloat16。

  • target (Tensor) - shape: \((N, *)\) ,与 input 的shape相同。支持数据类型:

    • Ascend:float16、float32、bfloat16。

  • reduction (str,可选) - 指定应用于输出结果的规约计算方式,可选 'none''mean''sum' ,默认值: 'mean'

    • 'none':不应用规约方法。

    • 'mean':计算输出元素的平均值。

    • 'sum':计算输出元素的总和。

  • beta (number,可选) - 控制损失函数在L1Loss和L2Loss间变换的阈值,该值必须大于等于0。默认值: 1.0

返回:

Tensor,数据类型与 input 相同。如果 reduction'none' ,则输出为Tensor且与 input 的shape相同。否则shape为 \(()\)

异常:
  • TypeError - inputtarget 不是 Tensor。

  • RuntimeError - inputtarget 的数据类型不是float16,float32和bfloat16中的任一者。

  • ValueError - inputtarget 的shape不同。

  • ValueError - reduction 不是 'none''mean''sum' 中的任一者。

  • TypeError - beta 不是float,bool或int。

  • RuntimeError - beta 小于0。

支持平台:

Ascend

样例:

>>> import mindspore
>>> import numpy as np
>>> from mindspore import Tensor, mint
>>> input = Tensor(np.array([2, 2, 3]), mindspore.float32)
>>> target = Tensor(np.array([2, 2, 2]), mindspore.float32)
>>> beta = 1.0
>>> reduction_1 = 'none'
>>> output = mint.nn.functional.smooth_l1_loss(input, target, reduction_1, beta)
>>> print(output)
[0.  0.  0.5]
>>> reduction_2 = 'mean'
>>> output = mint.nn.functional.smooth_l1_loss(input, target, reduction_2, beta)
>>> print(output)
0.16666667
>>> reduction_3 = 'sum'
>>> output = mint.nn.functional.smooth_l1_loss(input, target, reduction_3, beta)
>>> print(output)
0.5