mindspore.ops.smooth_l1_loss

mindspore.ops.smooth_l1_loss(input, target, beta=1.0, reduction='none')[源代码]

计算平滑L1损失，该L1损失函数有稳健性。

平滑L1损失是一种类似于MSELoss的损失函数，但对异常值相对不敏感，可以参阅论文 Fast R-CNN 。

给定长度为 $N$ 的两个输入 $x, y$ ，平滑L1损失的计算如下：

\begin{array}{r} L_{i} = {\begin{cases} \frac{0.5 (x_{i} - y_{i})^{2}}{beta}, & if | x_{i} - y_{i} | < beta \\ | x_{i} - y_{i} | - 0.5 * beta, & otherwise. \end{cases} \end{array}

当 reduction 不是设定为 none 时，计算如下：

\begin{array}{r} L = {\begin{cases} mean (L_{i}), & if reduction ='mean'; \\ sum (L_{i}), & if reduction ='sum'. \end{cases} \end{array}

其中， $beta$ 控制损失函数在线性与二次间变换的阈值， $beta > 0$ ，默认值是 1.0 。 $N$ 为batch size。

警告

该API在CPU上性能较差，推荐在Ascend/GPU上运行。

参数：

input (Tensor) - shape： $(N, *)$ ，其中 $*$ 表示任意数量的附加维度。支持数据类型：
- Ascend：float16、float32、bfloat16。
- CPU/GPU：float16、float32、float64。
target (Tensor) - shape： $(N, *)$ 。
- CPU/Ascend：与 input 的shape相同， input 和 target 遵循隐式类型转换规则，使数据类型一致。
- GPU：与 input 的shape和数据类型相同。
beta (number，可选) - 控制损失函数在L1Loss和L2Loss间变换的阈值，默认 1.0 。
- Ascend：该值必须大于等于0。
- CPU/GPU：该值必须大于0。
reduction (str，可选) - 指定应用于输出结果的规约计算方式，可选 'none' 、 'mean' 、 'sum' ，默认 'none' 。
- "none"：不应用规约方法。
- "mean"：计算输出元素的平均值。
- "sum"：计算输出元素的总和。

返回：

Tensor。如果 reduction 为'none'，则输出为Tensor且与 input 的shape相同。否则shape为 $()$ 。

异常：

TypeError - input 或 target 不是 Tensor。
RuntimeError - input 或 target 的数据类型不是float16、float32、float64和bfloat16中的任一者。
ValueError - input 与 target 的shape不同。
ValueError - reduction 不是 'none' ， 'mean' 和 'sum' 中的任一者。
TypeError - beta 不是float，bool或int。
RuntimeError - beta 小于等于0。

支持平台：

Ascend GPU CPU

样例：

>>> import mindspore
>>> import numpy as np
>>> from mindspore import Tensor, ops
>>> logits = Tensor(np.array([1, 2, 3]), mindspore.float32)
>>> labels = Tensor(np.array([1, 2, 2]), mindspore.float32)
>>> output = ops.smooth_l1_loss(logits, labels)
>>> print(output)
[0.  0.  0.5]