mindspore.ops.smooth_l1_loss
- mindspore.ops.smooth_l1_loss(input, target, beta=1.0, reduction='none')[源代码]
计算平滑L1损失,该L1损失函数有稳健性。
平滑L1损失是一种类似于MSELoss的损失函数,但对异常值相对不敏感,可以参阅论文 Fast R-CNN 。
给定长度为 \(N\) 的两个输入 \(x,\ y\) ,平滑L1损失的计算如下:
\[\begin{split}L_{i} = \begin{cases} \frac{0.5 (x_i - y_i)^{2}}{\beta}, & \text{if } |x_i - y_i| < \beta \\ |x_i - y_i| - 0.5 * \beta, & \text{otherwise. } \end{cases}\end{split}\]当 reduction 不是设定为 none 时,计算如下:
\[\begin{split}L = \begin{cases} \operatorname{mean}(L_{i}), & \text{if reduction} = \text{'mean';}\\ \operatorname{sum}(L_{i}), & \text{if reduction} = \text{'sum'.} \end{cases}\end{split}\]其中, \(\text{beta}\) 控制损失函数在线性与二次间变换的阈值, \(\text{beta}>0\) ,默认值是
1.0
。 \(N\) 为batch size。- 参数:
input (Tensor) - shape: \((N, *)\) ,其中 \(*\) 表示任意数量的附加维度。支持数据类型:
Ascend:float16、float32、bfloat16。
CPU/GPU: float16、float32、float64。
target (Tensor) - shape: \((N, *)\) 。
CPU/Ascend: 与 input 的shape相同, input 和 target 遵循隐式类型转换规则,使数据类型一致。
GPU: 与 input 的shape和数据类型相同。
beta (number,可选) - 控制损失函数在L1Loss和L2Loss间变换的阈值,默认值:
1.0
。Ascend: 该值必须大于等于0。
CPU/GPU: 该值必须大于0。
reduction (str,可选) - 指定应用于输出结果的规约计算方式,可选
'none'
、'mean'
、'sum'
,默认值:'none'
。"none"
:不应用规约方法。"mean"
:计算输出元素的平均值。"sum"
:计算输出元素的总和。
- 返回:
Tensor。如果 reduction 为'none',则输出为Tensor且与 input 的shape相同。否则shape为 \(()\)。
- 异常:
TypeError - input 或 target 不是 Tensor。
RuntimeError - input 或 target 的数据类型不是float16,float32,float64和bfloat16中的任一者。
ValueError - input 与 target 的shape不同。
ValueError - reduction 不是
'none'
,'mean'
和'sum'
中的任一者。TypeError - beta 不是float,bool或int。
RuntimeError - beta 小于等于0。
- 支持平台:
Ascend
GPU
CPU
样例:
>>> import mindspore >>> import numpy as np >>> from mindspore import Tensor, ops >>> logits = Tensor(np.array([1, 2, 3]), mindspore.float32) >>> labels = Tensor(np.array([1, 2, 2]), mindspore.float32) >>> output = ops.smooth_l1_loss(logits, labels) >>> print(output) [0. 0. 0.5]