文档反馈

问题文档片段

问题文档片段包含公式时，显示为空格。

提交类型

issue

有点复杂...

找人问问吧。

PR

小问题，全程线上修改...

一键搞定！

请选择提交类型

问题类型

规范和低错类

- 规范和低错类：

- 错别字或拼写错误，标点符号使用错误、公式错误或显示异常。

- 链接错误、空单元格、格式错误。

- 英文中包含中文字符。

- 界面和描述不一致，但不影响操作。

- 表述不通顺，但不影响理解。

- 版本号不匹配：如软件包名称、界面版本号。

易用性

- 易用性：

- 关键步骤错误或缺失，无法指导用户完成任务。

- 缺少主要功能描述、关键词解释、必要前提条件、注意事项等。

- 描述内容存在歧义指代不明、上下文矛盾。

- 逻辑不清晰，该分类、分项、分步骤的没有给出。

正确性

- 正确性：

- 技术原理、功能、支持平台、参数类型、异常报错等描述和软件实现不一致。

- 原理图、架构图等存在错误。

- 命令、命令参数等错误。

- 代码片段错误。

- 命令无法完成对应功能。

- 界面错误，无法指导操作。

- 代码样例运行报错、运行结果不符。

风险提示

- 风险提示：

- 对重要数据或系统存在风险的操作，缺少安全提示。

内容合规

- 内容合规：

- 违反法律法规，涉及政治、领土主权等敏感词。

- 内容侵权。

请选择问题类型

问题描述

点击输入详细问题描述，以帮助我们快速定位问题。

文档反馈

比较与torch.nn.ConvTranspose2d的功能差异

torch.nn.ConvTranspose2d

class torch.nn.ConvTranspose2d(
    in_channels,
    out_channels,
    kernel_size,
    stride=1,
    padding=0,
    output_padding=0,
    groups=1,
    bias=True,
    dilation=1,
    padding_mode='zeros'
)(input) -> Tensor

更多内容详见torch.nn.ConvTranspose2d。

mindspore.nn.Conv2dTranspose

class mindspore.nn.Conv2dTranspose(
    in_channels,
    out_channels,
    kernel_size,
    stride=1,
    pad_mode='same',
    padding=0,
    dilation=1,
    group=1,
    has_bias=False,
    weight_init='normal',
    bias_init='zeros'
)(x) -> Tensor

更多内容详见mindspore.nn.Conv2dTranspose。

差异对比

PyTorch：计算二维转置卷积，可以视为Conv2d对输入求梯度，也称为反卷积（实际不是真正的反卷积）。输入的shape通常是 $(N, C_{i n}, H_{i n}, W_{i n})$ ，其中 $N$ 是batch size， $C$ 是空间维度， $H_{i n}, W_{i n}$ 分别为高度和宽度。输出的shape为 $(N, C_{o u t}, H_{o u t}, W_{o u t})$ ，高度和宽度分别为： $H_{o u t} = (H_{i n} - 1) \times s t r i d e [0] - 2 \times p a d d i n g [0] + d i l a t i o n [0] \times (k e r n e l \underset{―}{} s i z e [0] - 1) + o u t p u t \underset{―}{} p a d d i n g [0] + 1$ $W_{o u t} = (W_{i n} - 1) \times s t r i d e [1] - 2 \times p a d d i n g [1] + d i l a t i o n [1] \times (k e r n e l \underset{―}{} s i z e [1] - 1) + o u t p u t \underset{―}{} p a d d i n g [1] + 1$

MindSpore：MindSpore此API实现功能与PyTorch基本一致，新增了填充模式参数”pad_mode”，当”pad_mode” = “pad”时与PyTorch默认方式相同，利用weight_init和bias_init参数可以配置初始化方式。此外，torch.nn.ConvTranspose2d有一个output_padding参数，其功能是指对反卷积后的特征图进行单侧补零（右侧和下侧），而mindspore.nn.Conv2dTranspose中目前没有该参数，可以对输出结果使用nn.Pad进行补维来代替。

分类	子类	PyTorch	MindSpore	差异
参数	参数1	in_channels	in_channels	-
	参数2	out_channels	out_channels	-
	参数3	kernel_size	kernel_size	-
	参数4	stride	stride	-
	参数5	padding	padding	功能一致，PyTorch中只能在两个维度的两侧分别填充相同的值，可为长度为2的tuple。MindSpore中可以分别设置顶部、底部、左边和右边的填充数量，可为长度为4的tuple
	参数6	output_padding	-	对反卷积后的特征图进行单侧补零（右侧和下侧），通常在stride > 1的前提下使用，用来调整output shapes。例如，通常将padding设置为(kernel_size - 1)/2，此时设置output_padding = (stride - 1)可确保input shapes/output shapes = stride，MindSpore无此参数
	参数7	groups	group	功能一致，参数名不同
	参数8	bias	has_bias	PyTorch默认为True，MindSpore默认为False
	参数9	dilation	dilation	-
	参数10	padding_mode	-	数值填充模式，只支持”zeros”即填充0。MindSpore无此参数，但默认填充0
	参数11	-	pad_mode	指定填充模式。可选值为”same”、”valid”、”pad”，在”same”和”valid”模式下，padding必须设置为0，默认为”same”，PyTorch无此参数
	参数12	-	weight_init	权重参数的初始化方法。可为Tensor、str、Initializer或numbers.Number。当使用str时，可选”TruncatedNormal” 、”Normal” 、”Uniform” 、”HeUniform”和”XavierUniform”分布以及常量”One”和”Zero”分布的值，默认为”normal”，PyTorch无此参数
	参数13	-	bias_init	偏置参数的初始化方法。初始化可选参数与”weight_init”相同，默认为”zeros”，PyTorch无此参数
输入	单输入	input	x	功能一致，参数名不同

代码示例1

两API都是实现二维转置卷积运算，使用时需先进行实例化。PyTorch中高度和宽度的padding值在同一方向上相同，如padding设为(2,4)表示分别在高度和宽度的两侧填充2行和4列0，对应在MindSpore中将pad_mode设为”pad”，padding设置为(2,2,4,4)。PyTorch中利用net.weight.data = torch.ones()的方式将权重初始化为1，shape为 $(i n \underset{―}{} c h a n n e l s, \frac{o u t \underset{―}{} c h a n n e l s}{g r o u p s}, k e r n e l \underset{―}{} s i z e [0], k e r n e l \underset{―}{} s i z e [1])$ ，MindSpore直接设置参数weight_init = “ones”。

# PyTorch
import torch
from torch import tensor
import torch.nn as nn
import numpy as np

k = 4
x_ = np.ones([1, 3, 16, 50])
x = tensor(x_, dtype=torch.float32)
net = nn.ConvTranspose2d(3, 64, kernel_size=k, stride=1, padding=(2, 4), output_padding=0, bias=False)
net.weight.data = torch.ones(3, 64, k, k)
output = net(x).detach().numpy()
print(output.shape)
# (1, 64, 15, 45)

# MindSpore
import mindspore as ms
import mindspore.nn as nn
import numpy as np

k = 4
x_ = np.ones([1, 3, 16, 50])
x = ms.Tensor(x_, ms.float32)
net = nn.Conv2dTranspose(3, 64, kernel_size=k, weight_init='ones', pad_mode='pad', padding=(2, 2, 4, 4))
output = net(x)
print(output.shape)
# (1, 64, 15, 45)

代码示例2

为使输出的宽度与输入整除stride后的值相同，PyTorch中设置output_padding = stride - 1，padding设置为(kernel_size - 1)/2。MindSpore则设置pad_mode = “same”，同时padding = 0。

# PyTorch
import torch
from torch import tensor
import torch.nn as nn
import numpy as np

k = 5
s = 3
x_ = np.ones([1, 3, 16, 50])
x = tensor(x_, dtype=torch.float32)
net = nn.ConvTranspose2d(3, 64, kernel_size=k, stride=s, padding=(k-1)//2, output_padding=s-1, bias=False)
net.weight.data = torch.ones(3, 64, k, k)
output = net(x).detach().numpy()
print(output.shape)
# (1, 64, 48, 150)


# MindSpore
import mindspore as ms
import mindspore.nn as nn
import numpy as np

k = 5
s = 3
x_ = np.ones([1, 3, 16, 50])
x = ms.Tensor(x_, ms.float32)
net = nn.Conv2dTranspose(3, 64, kernel_size=k, stride=s, weight_init='ones', pad_mode='same', padding=0)
output = net(x)
print(output.shape)
# (1, 64, 48, 150)

代码示例3

若不在原有图像上做任何填充，在stride>1的情况下可能舍弃一部分数据，在PyTorch中将padding和output_padding设为0，MindSpore中设置pad_mode = “valid”，同时padding = 0。

# PyTorch
import torch
from torch import tensor
import torch.nn as nn
import numpy as np

k = 5
s = 3
x_ = np.ones([1, 3, 16, 50])
x = tensor(x_, dtype=torch.float32)
net = nn.ConvTranspose2d(3, 64, kernel_size=k, stride=s, padding=0, output_padding=0, bias=False)
net.weight.data = torch.ones(3, 64, k, k)
output = net(x).detach().numpy()
print(output.shape)
# (1, 64, 50, 152)


# MindSpore
import mindspore as ms
import mindspore.nn as nn
import numpy as np

k = 5
s = 3
x_ = np.ones([1, 3, 16, 50])
x = ms.Tensor(x_, ms.float32)
net = nn.Conv2dTranspose(3, 64, kernel_size=k, stride=s, weight_init='ones', pad_mode='valid', padding=0)
output = net(x)
print(output.shape)
# (1, 64, 50, 152)

代码示例4

下面的示例实现了对输入tensor进行反卷积，并且输出反卷积后的特征图尺寸，其中PyTorch可以通过设置output_padding的值来对反卷积后的输出图像进行右侧和下侧补维，用于弥补stride大于1带来的缺失。MindSpore暂时不支持output_padding参数，需要对输出结果再使用nn.Pad进行单侧补维。

# PyTorch
import torch
import torch.nn as nn
import numpy as np

m = nn.ConvTranspose2d(in_channels=3, out_channels=32,
                       kernel_size=3,
                       stride=2,
                       padding=1,
                       output_padding=1,
                       bias=False)
input = torch.tensor(np.ones([1, 3, 48, 48]), dtype=torch.float32)
output = m(input).detach().numpy()
print(output.shape)
#(1, 32, 96, 96)

# MindSpore
import mindspore as ms
import mindspore.nn as nn
import numpy as np
input = ms.Tensor(np.ones([1, 3, 48, 48]), dtype=ms.float32)
m = nn.Conv2dTranspose(in_channels=3,
                       out_channels=32,
                       kernel_size=3,
                       stride=2,
                       padding=1,
                       pad_mode="pad",
                       has_bias=False)
output = m(input)
pad = nn.Pad(paddings=((0, 0), (0, 0), (0, 1), (0, 1)), mode="CONSTANT")
output = pad(output)
print(output.shape)
#(1, 32, 96, 96)