文档反馈

问题文档片段

问题文档片段包含公式时，显示为空格。

提交类型

issue

有点复杂...

找人问问吧。

PR

小问题，全程线上修改...

一键搞定！

请选择提交类型

问题类型

规范和低错类

- 规范和低错类：

- 错别字或拼写错误，标点符号使用错误、公式错误或显示异常。

- 链接错误、空单元格、格式错误。

- 英文中包含中文字符。

- 界面和描述不一致，但不影响操作。

- 表述不通顺，但不影响理解。

- 版本号不匹配：如软件包名称、界面版本号。

易用性

- 易用性：

- 关键步骤错误或缺失，无法指导用户完成任务。

- 缺少主要功能描述、关键词解释、必要前提条件、注意事项等。

- 描述内容存在歧义指代不明、上下文矛盾。

- 逻辑不清晰，该分类、分项、分步骤的没有给出。

正确性

- 正确性：

- 技术原理、功能、支持平台、参数类型、异常报错等描述和软件实现不一致。

- 原理图、架构图等存在错误。

- 命令、命令参数等错误。

- 代码片段错误。

- 命令无法完成对应功能。

- 界面错误，无法指导操作。

- 代码样例运行报错、运行结果不符。

风险提示

- 风险提示：

- 对重要数据或系统存在风险的操作，缺少安全提示。

内容合规

- 内容合规：

- 违反法律法规，涉及政治、领土主权等敏感词。

- 内容侵权。

请选择问题类型

问题描述

点击输入详细问题描述，以帮助我们快速定位问题。

文档反馈

mindspore.mint.nn.functional.binary_cross_entropy_with_logits

mindspore.mint.nn.functional.binary_cross_entropy_with_logits(input, target, weight=None, reduction='mean', pos_weight=None)[源代码]

输入经过sigmoid激活函数后作为预测值， binary_cross_entropy_with_logits 计算预测值和目标值之间的二值交叉熵损失。与 mindspore.ops.binary_cross_entropy_with_logits 功能一致。

将输入 input 设置为 $X$ ，输入 target 设置为 $Y$ ，输入 weight 设置为 $W$ ，输出设置为 $L$ 。则，

\begin{array}{r} \begin{array}{ll} p_{i j} = s i g m o i d (X_{i j}) = \frac{1}{1 + e^{- X_{i j}}} \\ L_{i j} = - [Y_{i j} l o g (p_{i j}) + (1 - Y_{i j}) l o g (1 - p_{i j})] \end{array} \end{array}

$i$ 表示 $i^{t h}$ 样例， $j$ 表示类别。则，

\begin{array}{r} ℓ (x, y) = {\begin{cases} L, & if reduction ='none'; \\ mean (L), & if reduction ='mean'; \\ sum (L), & if reduction ='sum'. \end{cases} \end{array}

$ℓ$ 表示计算损失的方法。有三种方法：第一种方法是直接提供损失值，第二种方法是计算所有损失的平均值，第三种方法是计算所有损失的总和。

该算子会将输出乘以相应的权重。 $w e i g h t$ 表示一个batch中的每条数据分配不同的权重， $p o s_w e i g h t$ 为每个类别的正例子添加相应的权重。

此外，它可以通过向正例添加权重来权衡召回率和精度。在多标签分类的情况下，损失可以描述为：

\begin{array}{r} \begin{array}{ll} p_{i j, c} = s i g m o i d (X_{i j, c}) = \frac{1}{1 + e^{- X_{i j, c}}} \\ L_{i j, c} = - [P_{c} Y_{i j, c} * l o g (p_{i j, c}) + (1 - Y_{i j, c}) l o g (1 - p_{i j, c})] \end{array} \end{array}

其中 c 是类别数目（c>1 表示多标签二元分类，c=1 表示单标签二元分类），n 是批次中样本的数量， $P_{c}$ 是第c类正例的权重。 $P_{c} > 1$ 增大召回率, $P_{c} < 1$ 增大精度。

参数：

input (Tensor) - 输入预测值，shape $(N, *)$ ，其中 $*$ 代表任意数量的附加维度。其数据类型为float16、float32或bfloat16（仅Atlas A2训练系列产品支持）。
target (Tensor) - 输入目标值，shape与 input 相同。数据类型为float16、float32或bfloat16（仅Atlas A2训练系列产品支持）。
weight (Tensor, 可选) - 指定每个批次二值交叉熵的权重。支持广播，使其shape与 target 的shape保持一致。数据类型必须为float16、float32或bfloat16（仅Atlas A2训练系列产品支持）。默认值：None ， weight 是值为 1 的Tensor。
reduction (str, 可选) - 指定应用于输出结果的规约计算方式，可选 'none' 、 'mean' 、 'sum' ，默认值： 'mean' 。
- 'none'：不应用规约方法。
- 'mean'：计算输出元素的加权平均值。
- 'sum'：计算输出元素的总和。
pos_weight (Tensor, 可选) - 指定正类的权重。是一个长度等于分类数的向量。支持广播，使其shape与 target 的shape保持一致。数据类型必须为float16、float32或bfloat16（仅Atlas A2训练系列产品支持）。默认值：None ，此时 pos_weight 等价于值为 1 的Tensor。

返回：

Tensor或Scalar，如果 reduction 为 'none' ，则为shape和数据类型与输入 target 相同的Tensor。否则，输出为Scalar。

异常：

TypeError - 输入 input ， target ， weight ， pos_weight 不为Tensor。
TypeError - reduction 输入数据类型不为string。
ValueError - weight 或 pos_weight 不能广播到shape为 input 的Tensor。
ValueError - reduction 不为 'none' 、 'mean' 或 'sum' 。

支持平台：

Ascend

样例：

>>> import mindspore
>>> import numpy as np
>>> from mindspore import Tensor, mint
>>> input = Tensor(np.array([[-0.8, 1.2, 0.7], [-0.1, -0.4, 0.7]]), mindspore.float32)
>>> target = Tensor(np.array([[0.3, 0.8, 1.2], [-0.6, 0.1, 2.2]]), mindspore.float32)
>>> weight = Tensor(np.array([1.0, 1.0, 1.0]), mindspore.float32)
>>> pos_weight = Tensor(np.array([1.0, 1.0, 1.0]), mindspore.float32)
>>> output = mint.nn.functional.binary_cross_entropy_with_logits(input, target, weight, 'mean', pos_weight)
>>> print(output)
0.3463612