mindspore.nn.SoftmaxCrossEntropyWithLogits

class mindspore.nn.SoftmaxCrossEntropyWithLogits(sparse=False, reduction='none')[源代码]

计算预测值与真实值之间的交叉熵。

使用交叉熵损失函数计算出输入概率(使用softmax函数计算)和真实值之间的误差。

函数的输入是未标准化的值,表示为x,格式为 \((N, C)\) ,以及相应的目标。

通常情况下,该函数的输入为各类别的分数值以及对应的目标值,输入格式是 \((N, C)\)

对于每个实例 \(x_i\) ,i的范围为0到N-1,则可得损失为:

\[\ell(x_i, c) = - \log\left(\frac{\exp(x_i[c])}{\sum_j \exp(x_i[j])}\right) = -x_i[c] + \log\left(\sum_j \exp(x_i[j])\right)\]

其中 \(x_i\) 是一维的Tensor, \(c\) 为one-hot中等于1的位置。

说明

虽然目标值是互斥的,即目标值中只有一个为正,但预测的概率不为互斥。只要求输入的预测概率分布有效。

参数:
  • sparse (bool) - 指定目标值是否使用稀疏格式。默认值:False。

  • reduction (str) - 指定应用于输出结果的计算方式。取值为”mean”,”sum”,或”none”。取值为”none”,则不执行reduction。默认值:”none”。

输入:
  • logits (Tensor) - shape \((N, C)\) 的Tensor。数据类型为float16或float32。

  • labels (Tensor) - shape \((N, )\) 的Tensor。如果 sparse 为True,则 labels 的类型为int32或int64。否则,labels 的类型与 logits 的类型相同。

输出:

Tensor,一个shape和数据类型与logits相同的Tensor。

异常:
  • TypeError - sparse 不是bool。

  • TypeError - sparse 为True,并且 labels 的dtype既不是int32,也不是int64。

  • TypeError - sparse 为False,并且 labels 的dtype既不是float16,也不是float32。

  • ValueError - reduction 不为”mean”、”sum”,或”none”。

支持平台:

Ascend GPU CPU

样例:

>>> # case 1: sparse=True
>>> loss = nn.SoftmaxCrossEntropyWithLogits(sparse=True)
>>> logits = Tensor(np.array([[3, 5, 6, 9, 12, 33, 42, 12, 32, 72]]), mindspore.float32)
>>> labels_np = np.array([1]).astype(np.int32)
>>> labels = Tensor(labels_np)
>>> output = loss(logits, labels)
>>> print(output)
[67.]
>>> # case 2: sparse=False
>>> loss = nn.SoftmaxCrossEntropyWithLogits(sparse=False)
>>> logits = Tensor(np.array([[3, 5, 6, 9, 12, 33, 42, 12, 32, 72]]), mindspore.float32)
>>> labels_np = np.array([[0, 0, 0, 0, 0, 0, 1, 0, 0, 0]]).astype(np.float32)
>>> labels = Tensor(labels_np)
>>> output = loss(logits, labels)
>>> print(output)
[30.]