mindspore.ops.smooth_l1_loss

查看源文件
mindspore.ops.smooth_l1_loss(input, target, beta=1.0, reduction='none')[源代码]

计算平滑L1损失,该L1损失函数有稳健性。

平滑L1损失是一种类似于MSELoss的损失函数,但对异常值相对不敏感,可以参阅论文 Fast R-CNN

给定长度为 N 的两个输入 x, y ,平滑L1损失的计算如下:

Li={0.5(xiyi)2beta,if |xiyi|<beta|xiyi|0.5beta,otherwise. 

reduction 不是设定为 none 时,计算如下:

L={mean(Li),if reduction='mean';sum(Li),if reduction='sum'.

其中, beta 控制损失函数在线性与二次间变换的阈值, beta>0 ,默认值是 1.0N 为batch size。

警告

该API在CPU上性能较差,推荐在Ascend/GPU上运行。

参数:
  • input (Tensor) - shape: (N,) ,其中 表示任意数量的附加维度。支持数据类型:

    • Ascend:float16、float32、bfloat16。

    • CPU/GPU:float16、float32、float64。

  • target (Tensor) - shape: (N,)

    • CPU/Ascend:与 input 的shape相同, inputtarget 遵循隐式类型转换规则,使数据类型一致。

    • GPU:与 input 的shape和数据类型相同。

  • beta (number,可选) - 控制损失函数在L1Loss和L2Loss间变换的阈值,默认 1.0

    • Ascend:该值必须大于等于0。

    • CPU/GPU:该值必须大于0。

  • reduction (str,可选) - 指定应用于输出结果的规约计算方式,可选 'none''mean''sum' ,默认 'none'

    • "none":不应用规约方法。

    • "mean":计算输出元素的平均值。

    • "sum":计算输出元素的总和。

返回:

Tensor。如果 reduction 为'none',则输出为Tensor且与 input 的shape相同。否则shape为 ()

异常:
  • TypeError - inputtarget 不是 Tensor。

  • RuntimeError - inputtarget 的数据类型不是float16、float32、float64和bfloat16中的任一者。

  • ValueError - inputtarget 的shape不同。

  • ValueError - reduction 不是 'none''mean''sum' 中的任一者。

  • TypeError - beta 不是float,bool或int。

  • RuntimeError - beta 小于等于0。

支持平台:

Ascend GPU CPU

样例:

>>> import mindspore
>>> import numpy as np
>>> from mindspore import Tensor, ops
>>> logits = Tensor(np.array([1, 2, 3]), mindspore.float32)
>>> labels = Tensor(np.array([1, 2, 2]), mindspore.float32)
>>> output = ops.smooth_l1_loss(logits, labels)
>>> print(output)
[0.  0.  0.5]