文档反馈

问题文档片段

问题文档片段包含公式时,显示为空格。

提交类型
issue

有点复杂...

找人问问吧。

PR

小问题,全程线上修改...

一键搞定!

请选择提交类型

问题类型
规范和低错类

- 规范和低错类:

- 错别字或拼写错误,标点符号使用错误、公式错误或显示异常。

- 链接错误、空单元格、格式错误。

- 英文中包含中文字符。

- 界面和描述不一致,但不影响操作。

- 表述不通顺,但不影响理解。

- 版本号不匹配:如软件包名称、界面版本号。

易用性

- 易用性:

- 关键步骤错误或缺失,无法指导用户完成任务。

- 缺少主要功能描述、关键词解释、必要前提条件、注意事项等。

- 描述内容存在歧义指代不明、上下文矛盾。

- 逻辑不清晰,该分类、分项、分步骤的没有给出。

正确性

- 正确性:

- 技术原理、功能、支持平台、参数类型、异常报错等描述和软件实现不一致。

- 原理图、架构图等存在错误。

- 命令、命令参数等错误。

- 代码片段错误。

- 命令无法完成对应功能。

- 界面错误,无法指导操作。

- 代码样例运行报错、运行结果不符。

风险提示

- 风险提示:

- 对重要数据或系统存在风险的操作,缺少安全提示。

内容合规

- 内容合规:

- 违反法律法规,涉及政治、领土主权等敏感词。

- 内容侵权。

请选择问题类型

问题描述

点击输入详细问题描述,以帮助我们快速定位问题。

mindspore.ops.ctc_loss

查看源文件
mindspore.ops.ctc_loss(log_probs, targets, input_lengths, target_lengths, blank=0, reduction='mean', zero_infinity=False)[源代码]

计算CTC(Connectist Temporal Classification)损失和梯度。

CTC是序列标注问题中的一种损失函数,主要用于处理序列标注问题中的输入与输出标签的对齐问题。 传统序列标注算法需要每一时刻输入与输出符号完全对齐,而CTC拓展了标签集合,添加了空元素。 在使用拓展标签集合对序列进行标注后,所有可以通过映射函数转换为真实序列的预测序列,都是正确的预测结果,也就是说无需数据对齐处理,即可得到预测序列。 其目标函数就是最大化所有正确的预测序列的概率和。

关于CTCLoss算法详细介绍,请参考 Connectionist Temporal Classification: Labeling Unsegmented Sequence Data withRecurrent Neural Networks

参数:
  • log_probs (Tensor) - 输入Tensor,shape (T,N,C) 。其中T表示输入长度,N表示批次大小,C是分类数,包含空白。

  • targets (Tensor) - 目标Tensor,shape (N,S) 。其中S表示最大目标长度。

  • input_lengths (Union(tuple, Tensor)) - 输入长度,shape为 (N) 的Tensor或tuple。

  • target_lengths (Union(tuple, Tensor)) - 目标长度,shape为 (N) 的Tensor或tuple。

  • blank (int,可选) - 空白标签。默认值: 0

  • reduction (str,可选) - 指定应用于输出结果的规约计算方式,可选 'none''mean''sum' ,默认值: 'mean'

    • 'none':不应用规约方法。

    • 'mean':计算输出元素的平均值。

    • 'sum':计算输出元素的总和。

  • zero_infinity (bool,可选) - 是否设置无限损失和相关梯度为零。默认值: False

返回:
  • neg_log_likelihood (Tensor) - 对每一个输入节点可微调的损失值,shape是 (N)

  • log_alpha (Tensor) - shape为 (N,T,2S+1) 的输入到输出的轨迹概率。

异常:
  • TypeError - zero_infinity 不是布尔值, reduction 不是字符串。

  • TypeError - log_probs 的数据类型不是float或double。

  • TypeError - targetsinput_lengthstarget_lengths 数据类型不是int32或int64。

  • ValueError - log_probs 的秩不是3。

  • ValueError - targets 的秩不是2。

  • ValueError - input_lengths 的shape大小不等于N。N是 log_probs 的批次大小。

  • ValueError - target_lengths 的shape大小不等于N。N是 log_probs 的批次大小。

  • ValueError - blank 值不介于0到C之间。C是 log_probs 的分类数。

  • RuntimeError - input_lengths 的值大于T。T是 log_probs 的长度。

  • RuntimeError - target_lengths[i] 的取值范围不在0到 input_length[i] 之间。

支持平台:

Ascend GPU CPU

样例:

>>> import numpy as np
>>> from mindspore import Tensor, ops
>>> from mindspore import dtype as mstype
>>> log_probs = Tensor(np.array([[[0.3, 0.6, 0.6]],
...                              [[0.9, 0.4, 0.2]]]).astype(np.float32))
>>> targets = Tensor(np.array([[0, 1]]), mstype.int32)
>>> input_lengths = Tensor(np.array([2]), mstype.int32)
>>> target_lengths = Tensor(np.array([1]), mstype.int32)
>>> loss, log_alpha = ops.ctc_loss(log_probs, targets, input_lengths,
...                                target_lengths, 0, 'mean', True)
>>> print(loss)
-2.2986124
>>> print(log_alpha)
[[[0.3       0.3            -inf      -inf      -inf]
  [1.2       1.8931472 1.2            -inf      -inf]]]