文档反馈

问题文档片段

问题文档片段包含公式时，显示为空格。

提交类型

issue

有点复杂...

找人问问吧。

PR

小问题，全程线上修改...

一键搞定！

请选择提交类型

问题类型

规范和低错类

- 规范和低错类：

- 错别字或拼写错误，标点符号使用错误、公式错误或显示异常。

- 链接错误、空单元格、格式错误。

- 英文中包含中文字符。

- 界面和描述不一致，但不影响操作。

- 表述不通顺，但不影响理解。

- 版本号不匹配：如软件包名称、界面版本号。

易用性

- 易用性：

- 关键步骤错误或缺失，无法指导用户完成任务。

- 缺少主要功能描述、关键词解释、必要前提条件、注意事项等。

- 描述内容存在歧义指代不明、上下文矛盾。

- 逻辑不清晰，该分类、分项、分步骤的没有给出。

正确性

- 正确性：

- 技术原理、功能、支持平台、参数类型、异常报错等描述和软件实现不一致。

- 原理图、架构图等存在错误。

- 命令、命令参数等错误。

- 代码片段错误。

- 命令无法完成对应功能。

- 界面错误，无法指导操作。

- 代码样例运行报错、运行结果不符。

风险提示

- 风险提示：

- 对重要数据或系统存在风险的操作，缺少安全提示。

内容合规

- 内容合规：

- 违反法律法规，涉及政治、领土主权等敏感词。

- 内容侵权。

请选择问题类型

问题描述

点击输入详细问题描述，以帮助我们快速定位问题。

文档反馈

mindspore.ops.CTCLossV2

class mindspore.ops.CTCLossV2(blank=0, reduction='none', zero_infinity=False)[源代码]

计算CTC(Connectionist Temporal Classification)损失和梯度。

CTC算法是在 Connectionist Temporal Classification: Labeling Unsegmented Sequence Data with Recurrent Neural Networks 中提出的。

警告

这是一个实验性API，后续可能修改或删除。

参数：

blank (int，可选) - 空白标签。默认值： 0 。
reduction (str，可选) - 指定应用于输出结果的规约计算方式。目前仅支持 'none' ，默认值： 'none' 。
zero_infinity (bool，可选) - 在损失无限大的时候，是否将无限损失和相关梯度置为零。默认值： False 。

输入：

log_probs (Tensor) - 输入Tensor，其shape为 $(T, N, C)$ 的三维Tensor。 $T$ 表示输入长度， $N$ 表示批大小， $C$ 表示类别数，包含空白标签。支持的数据类型：float32、float64。
targets (Tensor) - 标签序列。其shape为 $(N, S)$ 的三维Tensor。 $S$ 表示最大标签长度。支持的数据类型：int32、int64。
input_lengths (Union(Tuple, Tensor)) - 输入的长度。其shape为 $(N)$ 。支持的数据类型：int32、int64。
target_lengths (Union(Tuple, Tensor)) - 标签的长度。其shape为 $(N)$ 。支持的数据类型：int32、int64。

输出：

neg_log_likelihood (Tensor) - 相对于每个输入节点可微分的损失值。
log_alpha (Tensor) - 输入到目标的可能跟踪概率。

异常：

TypeError - 如果 zero_infinity 不是bool类型。
TypeError - 如果 reduction 不是string类型。
TypeError - 如果 log_probs 的dtype不是float类型或double类型。
TypeError - 如果 targets、 input_lengths 或 target_lengths 的dtype不是int32类型或int64类型。
ValueError - 如果 log_probs 的秩不等于2。
ValueError - 如果 targets 的秩不等于2。
ValueError - 如果 input_lengths 的shape与批大小 $N$ 不匹配。
ValueError - 如果 targets 的shape与批大小 $N$ 不匹配。
TypeError - 如果 targets、 input_lengths 或 target_lengths 的类型不同。
ValueError - 如果 blank 的数值不在[0, C)范围内。
RuntimeError - 如果 input_lengths 中任意一个元素值大于(num_labels|C)。
RuntimeError - 如果任何 target_lengths[i] 不在范围 [0, input_length[i]] 范围内。

支持平台：

Ascend GPU CPU

样例：

>>> import numpy as np
>>> from mindspore import Tensor, ops
>>> from mindspore import dtype as mstype
>>> log_probs = Tensor(np.array([[[0.3, 0.6, 0.6]],
...                              [[0.9, 0.4, 0.2]]]).astype(np.float32))
>>> targets = Tensor(np.array([[0, 1]]), mstype.int32)
>>> input_lengths = Tensor(np.array([2]), mstype.int32)
>>> target_lengths = Tensor(np.array([1]), mstype.int32)
>>> CTCLossV2 = ops.CTCLossV2(blank=0, reduction='none', zero_infinity=False)
>>> neg_log_hood, log_alpha = CTCLossV2(
...     log_probs, targets, input_lengths, target_lengths)
>>> print(neg_log_hood)
[-2.2986124]
>>> print(log_alpha)
[[[0.3       0.3            -inf      -inf      -inf]
  [1.2       1.8931472 1.2            -inf      -inf]]]