mindspore.ops.KLDivLoss
- class mindspore.ops.KLDivLoss(reduction='mean')[源代码]
计算输入 logits 和 labels 的KL散度。
对于相同形状的张量
和 ,KLDivLoss的计算公式如下:输出
其中
代表 logits ; 代表 labels ; 为 output 。说明
目前Ascend平台不支持float64数据类型。
仅当 reduction 设置为
'batchmean'
时输出才与Kullback-Leibler散度的数学定义一致。在Ascend平台上, reduction 的可选值为
'batchmean'
、'none'
或'sum'
。在GPU平台上, reduction 的可选值为
'mean'
、'none'
或'sum'
。在CPU平台上, reduction 的可选值为
'mean'
、'batchmean'
、'none'
或'sum'
。
- 参数:
reduction (str,可选) - 指定输出结果的计算方式。默认值:
'mean'
。'none'
:不应用规约方法。'mean'
:计算输出元素的平均值。'sum'
:计算输出元素的总和。'batchmean'
:计算批次的平均损失,类似于mean模式。
- 输入:
logits (Tensor) - 数据类型支持float16、float32和float64。
labels (Tensor) - 标签Tensor,与 logits 的shape和数据类型相同。
- 输出:
Tensor或标量。如果 reduction 为
"none"
,则输出为Tensor且与 logits 的shape相同,否则为标量。- 异常:
TypeError - reduction 不是str。
TypeError - logits 或 labels 不是Tensor。
TypeError - logits 或 labels 的数据类型不是支持的类型。
ValueError - logits 和 labels 的shape不一致。
RuntimeError - logits 或 labels 是标量并且 reduction 是
'batchmean'
。
- 支持平台:
Ascend
GPU
CPU
样例:
>>> import mindspore >>> import numpy as np >>> from mindspore import Tensor, nn, ops >>> class Net(nn.Cell): ... def __init__(self): ... super(Net, self).__init__() ... self.kldiv_loss = ops.KLDivLoss(reduction='sum') ... def construct(self, logits, labels): ... result = self.kldiv_loss(logits, labels) ... return result ... >>> net = Net() >>> logits = Tensor(np.array([0.2, 0.7, 0.1]), mindspore.float32) >>> labels = Tensor(np.array([0., 1., 0.]), mindspore.float32) >>> output = net(logits, labels) >>> print(output) -0.7