mindspore.ops.smooth_l1_loss

mindspore.ops.smooth_l1_loss(logits, labels, beta=1.0, reduction='none')[源代码]

计算平滑L1损失,该L1损失函数有稳健性。

平滑L1损失是一种类似于MSELoss的损失函数,但对异常值相对不敏感。参阅论文 Fast R-CNN

给定长度为 \(N\) 的两个输入 \(x,\ y\) ,平滑L1损失的计算如下:

\[\begin{split}L_{i} = \begin{cases} \frac{0.5 (x_i - y_i)^{2}}{\beta}, & \text{if } |x_i - y_i| < \beta \\ |x_i - y_i| - 0.5 * \beta, & \text{otherwise. } \end{cases}\end{split}\]

reduction 不是设定为 none 时,计算如下:

\[\begin{split}L = \begin{cases} \operatorname{mean}(L_{i}), & \text{if reduction} = \text{'mean';}\\ \operatorname{sum}(L_{i}), & \text{if reduction} = \text{'sum'.} \end{cases}\end{split}\]

其中, \(\text{beta}\) 控制损失函数从二次元变为线性的point。默认值是1.0。 \(N\) 为batch size。

Note

在Ascend上,目前不支持 logits 的数据类型是float64。

参数:
  • logits (Tensor) - shape: \((N, *)\) ,其中 \(*\) 表示任意数量的附加维度。数据类型为float16或float32, CPU和GPU后端还支持float64。

  • labels (Tensor) - shape: \((N, *)\) ,与 logits 的shape和数据类型相同。

  • beta (float) - 控制损失函数在L1Loss和L2Loss间变换的阈值。默认值:1.0。

  • reduction (str) - 缩减输出的方法。默认值:’none’。其他选项:’mean’和’sum’。

返回:

Tensor。如果 reduction 为’none’,则输出为Tensor且与 logits 的shape相同。否则shape为 (1,)

异常:
  • TypeError - beta 不是float类型。

  • ValueError - reduction 不是’none’,’mean’和’sum’中的任一者。

  • TypeError - logitslabels 的数据类型不是float16,float32和float64中的任一者。

  • ValueError - beta 小于0。

  • ValueError - logitslabels 的shape不同。

  • TypeError - Ascend后端不支持数据类型是float64的 logits 输入。

支持平台:

Ascend GPU CPU

样例:

>>> logits = Tensor(np.array([1, 2, 3]), mindspore.float32)
>>> labels = Tensor(np.array([1, 2, 2]), mindspore.float32)
>>> output = ops.smooth_l1_loss(logits, labels)
>>> print(output)
[0.  0.  0.5]