mindspore.ops.ctc_loss
- mindspore.ops.ctc_loss(log_probs, targets, input_lengths, target_lengths, blank=0, reduction='mean', zero_infinity=False)[源代码]
计算CTC(Connectist Temporal Classification)损失和梯度。
CTC是序列标注问题中的一种损失函数,主要用于处理序列标注问题中的输入与输出标签的对齐问题。 传统序列标注算法需要每一时刻输入与输出符号完全对齐,而CTC拓展了标签集合,添加了空元素。 在使用拓展标签集合对序列进行标注后,所有可以通过映射函数转换为真实序列的预测序列,都是正确的预测结果,也就是说无需数据对齐处理,即可得到预测序列。 其目标函数就是最大化所有正确的预测序列的概率和。
关于CTCLoss算法详细介绍,请参考 Connectionist Temporal Classification: Labeling Unsegmented Sequence Data withRecurrent Neural Networks 。
- 参数:
log_probs (Tensor) - 输入Tensor,shape \((T, N, C)\) 。其中T表示输入长度,N表示批次大小,C是分类数,包含空白。
targets (Tensor) - 目标Tensor,shape \((N, S)\) 。其中S表示最大目标长度。
input_lengths (Union(tuple, Tensor)) - 输入长度,shape为N的Tensor或tuple。
target_lengths (Union(tuple, Tensor)) - 目标长度,shape为N的Tensor或tuple。
blank (int,可选) - 空白标签。默认值:0。
reduction (str,可选) - 对输出应用归约方法。可选值为”none”、”mean”或”sum”,分别表示不指定计算方式、使用均值计算和使用求和计算。默认值:”mean”。
zero_infinity (bool,可选) - 是否设置无限损失和相关梯度为零。默认值:False。
- 返回:
neg_log_likelihood (Tensor) - 对每一个输入节点可微调的损失值,shape是 \((N)\)。
log_alpha (Tensor) - shape为 \((N, T, 2 * S + 1)\) 的输入到输出的轨迹概率。
- 异常:
TypeError - zero_infinity 不是布尔值, reduction 不是字符串。
TypeError - log_probs 的数据类型不是float或double。
TypeError - targets 、 input_lengths 或 target_lengths 数据类型不是int32或int64。
ValueError - log_probs 的秩不是3。
ValueError - targets 的秩不是2。
ValueError - input_lengths 的shape大小不等于N。N是 log_probs 的批次大小。
ValueError - target_lengths 的shape大小不等于N。N是 log_probs 的批次大小。
ValueError - blank 值不介于0到C之间。C是 log_probs 的分类数。
RuntimeError - input_lengths 的值大于T。T是 log_probs 的长度。
RuntimeError - target_lengths[i] 的取值范围不在0到 input_length[i] 之间。
- 支持平台:
Ascend
GPU
CPU
样例:
>>> log_probs = Tensor(np.array([[[0.3, 0.6, 0.6]], ... [[0.9, 0.4, 0.2]]]).astype(np.float32)) >>> targets = Tensor(np.array([[0, 1]]), mstype.int32) >>> input_lengths = Tensor(np.array([2]), mstype.int32) >>> target_lengths = Tensor(np.array([1]), mstype.int32) >>> loss, log_alpha = ops.ctc_loss(log_probs, targets, input_lengths, ... target_lengths, 0, 'mean', True) >>> print(loss) -2.2986124 >>> print(log_alpha) [[[0.3 0.3 -inf -inf -inf] [1.2 1.8931472 1.2 -inf -inf]]]