文档反馈

问题文档片段

问题文档片段包含公式时，显示为空格。

提交类型

issue

有点复杂...

找人问问吧。

请选择提交类型

问题类型

规范和低错类

- 规范和低错类：

- 错别字或拼写错误，标点符号使用错误、公式错误或显示异常。

- 链接错误、空单元格、格式错误。

- 英文中包含中文字符。

- 界面和描述不一致，但不影响操作。

- 表述不通顺，但不影响理解。

- 版本号不匹配：如软件包名称、界面版本号。

易用性

- 易用性：

- 关键步骤错误或缺失，无法指导用户完成任务。

- 缺少主要功能描述、关键词解释、必要前提条件、注意事项等。

- 描述内容存在歧义指代不明、上下文矛盾。

- 逻辑不清晰，该分类、分项、分步骤的没有给出。

正确性

- 正确性：

- 技术原理、功能、支持平台、参数类型、异常报错等描述和软件实现不一致。

- 原理图、架构图等存在错误。

- 命令、命令参数等错误。

- 代码片段错误。

- 命令无法完成对应功能。

- 界面错误，无法指导操作。

- 代码样例运行报错、运行结果不符。

风险提示

- 风险提示：

- 对重要数据或系统存在风险的操作，缺少安全提示。

内容合规

- 内容合规：

- 违反法律法规，涉及政治、领土主权等敏感词。

- 内容侵权。

请选择问题类型

问题描述

点击输入详细问题描述，以帮助我们快速定位问题。

文档反馈

mindspore.mint.nn.functional.conv2d

mindspore.mint.nn.functional.conv2d(input, weight, bias=None, stride=1, padding=0, dilation=1, groups=1)[源代码]

对输入Tensor计算二维卷积。通常输入的shape为 $(N, C_{i n}, H_{i n}, W_{i n})$ 或 $(C_{i n}, H_{i n}, W_{i n})$ ，其中 $N$ 为batch size， $C$ 为通道数， $H$ 为特征图的高度， $W$ 为特征图的宽度。

根据以下公式计算输出：

out (N_{i}, C_{{out}_{j}}) = bias (C_{{out}_{j}}) + \sum_{k = 0}^{C_{i n} - 1} ccor (weight (C_{{out}_{j}}, k), X (N_{i}, k))

其中， $b i a s$ 为输出偏置， $c c o r$ 为 cross-correlation 操作， $w e i g h t$ 为卷积核的值， $X$ 为输入的特征图。

$i$ 对应batch数，其范围为 $[0, N - 1]$ ，其中 $N$ 为输入batch。

$j$ 对应输出通道，其范围为 $[0, C_{o u t} - 1]$ ，其中 $C_{o u t}$ 为输出通道数，该值也等于卷积核的个数。

$k$ 对应输入通道数，其范围为 $[0, C_{i n} - 1]$ ，其中 $C_{i n}$ 为输入通道数，该值也等于卷积核的通道数。

因此，上面的公式中， $b i a s (C_{o u t_{j}})$ 为第 $j$ 个输出通道的偏置， $w e i g h t (C_{o u t_{j}}, k)$ 表示第 $j$ 个卷积核在第 $k$ 个输入通道的卷积核切片， $X (N_{i}, k)$ 为特征图第 $i$ 个batch第 $k$ 个输入通道的切片。卷积核shape为 $(kernel_size[0], kernel_size[1])$ ，其中 $kernel_size[0]$ 和 $kernel_size[1]$ 是卷积核的高度和宽度。若考虑到输入输出通道以及groups，则完整卷积核的shape为 $(C_{o u t}, C_{i n} / groups, kernel_size[0], kernel_size[1])$ ，其中 groups 是分组卷积时在通道上分割输入 x 的组数。

想更深入了解卷积层，请参考论文 Gradient Based Learning Applied to Document Recognition 以及 ConvNets 。

警告

这是一个实验性API，后续可能修改或删除。

参数：

input (Tensor) - shape为 $(N, C_{i n}, H_{i n}, W_{i n})$ 或 $(N, C_{i n}, H_{i n}, W_{i n})$ 的Tensor。
weight (Tensor) - shape为 $(C_{o u t}, C_{i n} / groups, kernel_size[0], kernel_size[1])$ ，则卷积核的大小为 $(kernel_size[0], kernel_size[1])$ 。
bias (Tensor，可选) - 偏置Tensor，shape为 $(C_{o u t})$ 的Tensor。如果 bias 是 None ，将不会添加偏置。默认值： None 。
stride (Union(int, tuple[int])，可选) - 卷积核移动的步长，数据类型为int，或者由2个int组成的tuple。一个int表示在高度和宽度方向的移动步长均为该值。两个int组成的tuple分别表示在高度和宽度方向的移动步长。默认值： 1 。
padding (Union[int, tuple[int], str]，可选) - 输入的高度和宽度方向上填充的数量。数据类型为int或包含2个整数的tuple或string { "valid" ， "same" } 。如果 padding 是一个整数，那么 padding_{H} 和 padding_{W} 都等于 padding 。如果 padding 是一个有2个整数的tuple，那么 padding_{H} 和 padding_{W} 分别等于 padding[0] 和 padding[1] 。值应该要大于等于0。默认值： 0 。
- "same"：在输入的四周填充，使得当 stride 为 1 时，输入和输出的shape一致。待填充的量由算子内部计算，若为偶数，则均匀地填充在四周，若为奇数，多余的填充量将补充在底部/右侧。若设置该模式，stride 的值必须为1。
- "valid"：不对输入进行填充，返回输出可能的最大高度和宽度，不能构成一个完整stride的额外的像素将被丢弃。
dilation (Union(int, tuple[int])，可选) - 卷积核元素间的间隔。数据类型为int或由2个int组成的tuple。若 $k > 1$ ，则卷积核间隔 k 个元素进行采样。垂直和水平方向上的 k ，其取值范围分别为[1, H]和[1, W]。默认值： 1 。
groups (int，可选) - 将过滤器拆分为组。默认值： 1 。
- $(C_{i n} % groups == 0)$ ， $(C_{o u t} % groups == 0)$ ， $(C_{o u t} >= groups)$ ， $(kernel_size[1] = C_{i n} / groups)$ 。

返回：

Tensor，卷积后的值。shape为 $(N, C_{o u t}, H_{o u t}, W_{o u t})$ 。要了解不同的填充模式如何影响输出shape，请参考 mindspore.mint.nn.Conv2d 以获取更多详细信息。

异常：

ValueError - 输入特征图的大小与参数应满足输出公式，以确保输出特征图大小为正，否则会报错。输出公式请参考 mindspore.mint.nn.Conv2d 以获取更多详细信息。
RuntimeError - Ascend上受不同型号NPU芯片上L1缓存大小限制，用例尺寸或Kernel Size不能过大。
TypeError - 如果 in_channels ， out_channels 或者 groups 不是int。
TypeError - 如果 kernel_size ， stride 或 dilation 既不是int也不是tuple。
TypeError - 如果 bias 不是Tensor。
ValueError - 如果 bias 的shape不是 $(C_{o u t})$ 。
ValueError - 如果 stride 或 diation 小于1。
ValueError - 如果 padding 是 "same" ， stride 不等于1。
ValueError - 输入参数不满足卷积输出公式。
ValueError - KernelSize 不能超过输入特征图的大小。
ValueError - padding 值不能导致计算区域超出输入大小。

支持平台：

Ascend

样例：

>>> import mindspore
>>> import numpy as np
>>> from mindspore import Tensor, mint, mint
>>> x = Tensor(np.ones([10, 32, 32, 32]), mindspore.float32)
>>> weight = Tensor(np.ones([32, 32, 3, 3]), mindspore.float32)
>>> output = mint.nn.functional.conv2d(x, weight)
>>> print(output.shape)
(10, 32, 30, 30)