比较与torch.nn.Conv2d的功能差异
torch.nn.Conv2d
class torch.nn.Conv2d(
in_channels,
out_channels,
kernel_size,
stride=1,
padding=0,
dilation=1,
groups=1,
bias=True,
padding_mode='zeros'
)(input) -> Tensor
更多内容详见torch.nn.Conv2d。
mindspore.nn.Conv2d
class mindspore.nn.Conv2d(
in_channels,
out_channels,
kernel_size,
stride=1,
pad_mode='same',
padding=0,
dilation=1,
group=1,
has_bias=False,
weight_init='normal',
bias_init='zeros',
data_format='NCHW'
)(x) -> Tensor
更多内容详见mindspore.nn.Conv2d。
差异对比
PyTorch:对输入Tensor计算二维卷积,通常情况下,输入大小为 \(\left(N, C_{\mathrm{in}}, H, W\right)\) 、输出大小为 \(\left(N, C_{\text {out }}, H_{\text {out }}, W_{\text {out }}\right)\) 的输出值可以描述为: \(\operatorname{out}\left(N_{i}, C_{\text {out }_{j}}\right)=\operatorname{bias}\left(C_{\text {out }_{j}}\right)+\sum_{k=0}^{C_{i n}-1} \text { weight }\left(C_{\text {out }_{j}}, k\right) \star \operatorname{input}\left(N_{i}, k\right)\) 其中,\(\star\) 为2D cross-correlation 算子,\(N\) 是batch size,\(C\) 是通道数量,\(H\) 和 \(W\) 分别是特征层的高度和宽度。
MindSpore:与PyTorch实现的功能基本一致,但存在偏置差异和填充差异。1、偏置差异:MindSpore默认不添加偏置参数,与PyTorch相反。2、填充差异:MindSpore默认对输入进行填充,而PyTorch则默认不填充。MindSpore填充模式可选项与PyTorch不同,PyTorch的参数padding_mode可选项有‘zeros’、’reflect’、’replicate’、’circular’,含义如下:
zero:常量填充(默认零填充)。
reflect:反射填充。
replicate:复制填充。
circular:循环填充。
而MindSpore的参数pad_mode可选项有’same’、’valid’、’pad’,含义如下:
same:使用0填充使得输出的高度和宽度分别与输入整除 stride 后的值相同,使用此模式,padding的值必须为0。
valid:不填充。
pad:零填充,使用此模式,padding必须大于或等于0。
分类 |
子类 |
PyTorch |
MindSpore |
差异 |
---|---|---|---|---|
参数 |
参数1 |
in_channels |
in_channels |
- |
参数2 |
out_channels |
out_channels |
- |
|
参数3 |
kernel_size |
kernel_size |
- |
|
参数4 |
stride |
stride |
- |
|
参数5 |
padding |
padding |
- |
|
参数6 |
dilation |
dilation |
- |
|
参数7 |
groups |
group |
功能一致,参数名不同 |
|
参数8 |
bias |
has_bias |
功能一致,参数名不同,默认值不同 |
|
参数9 |
padding_mode |
pad_mode |
具体差异参考上文 |
|
参数10 |
- |
weight_init |
权重参数的初始化方法,PyTorch可使用init函数进行权重初始化 |
|
参数11 |
- |
bias_init |
偏置参数的初始化方法,PyTorch无此参数 |
|
参数12 |
- |
data_format |
指定输入数据格式,PyTorch无此参数 |
|
输入 |
单输入 |
input |
x |
功能一致,参数名不同 |
代码示例1
PyTorch的参数bias默认值为True,即默认添加偏置参数,而MindSpore的参数has_bias默认值为False,即默认不添加偏置函数,如果需要添加偏置参数,需要将has_bias的值设置为True。
# PyTorch
import torch
from torch import tensor
import numpy as np
x_ = np.ones((1, 120, 1024, 640))
x = tensor(x_, dtype=torch.float32)
net = torch.nn.Conv2d(120, 240, 4)
output = net(x).detach().numpy().shape
print(output)
# (1, 240, 1021, 637)
# MindSpore
import mindspore
from mindspore import Tensor
import mindspore.nn as nn
import numpy as np
x_ = np.ones((1, 120, 1024, 640))
x = Tensor(x_, mindspore.float32)
net = nn.Conv2d(120, 240, 4, has_bias=True, pad_mode='valid')
output = net(x).shape
print(output)
# (1, 240, 1021, 637)
代码示例2
PyTorch的参数padding_mode为’zero’时,表示对输入进行零填充,而MindSpore中实现零填充需设置参数pad_mode为’pad’。
# PyTorch
import torch
from torch import tensor
import numpy as np
x_ = np.ones((1, 120, 1024, 640))
x = tensor(x_, dtype=torch.float32)
net = torch.nn.Conv2d(120, 240, 4, padding=1, padding_mode='zeros')
output = net(x).detach().numpy().shape
print(output)
# (1, 240, 1023, 639)
# MindSpore
import mindspore
from mindspore import Tensor
import mindspore.nn as nn
import numpy as np
x_ = np.ones((1, 120, 1024, 640))
x = Tensor(x_, mindspore.float32)
net = nn.Conv2d(120, 240, 4, padding=1, pad_mode='pad')
output = net(x).shape
print(output)
# (1, 240, 1023, 639)
代码示例3
PyTorch的参数padding_mode为’reflect’时,表示对输入进行反射填充,而MindSpore中实现反射填充需通过API组合实现,首先调用nn.Pad对输入x进行反射填充,再对填充后的结果进行卷积操作。
# PyTorch
import torch
from torch import tensor
import numpy as np
x_ = np.ones((1, 120, 1024, 640))
x = tensor(x_, dtype=torch.float32)
net = torch.nn.Conv2d(120, 240, 4, padding=1, padding_mode='reflect')
output = net(x).detach().numpy().shape
print(output)
# (1, 240, 1023, 639)
# MindSpore
import mindspore
from mindspore import Tensor
import mindspore.nn as nn
import numpy as np
x_ = np.ones((1, 120, 1024, 640))
x = Tensor(x_, mindspore.float32)
pad = nn.Pad(paddings=((0,0),(1,1),(1,1),(1,1)), mode="REFLECT")
x_pad = pad(x)
net = nn.Conv2d(122, 240, 4, padding=0, pad_mode='valid')
output = net(x_pad).shape
print(output)
# (1, 240, 1023, 639)
代码示例4
PyTorch默认情况下不对输入进行填充,而MindSpore默认情况下需要对输入进行填充,如果不对输入进行填充,需要将pad_mode设置为’valid’。
# PyTorch
import torch
from torch import tensor
import numpy as np
x_ = np.ones((1, 120, 1024, 640))
x = tensor(x_, dtype=torch.float32)
net = torch.nn.Conv2d(120, 240, 4)
output = net(x).detach().numpy().shape
print(output)
# (1, 240, 1021, 637)
# MindSpore
import mindspore
from mindspore import Tensor
import mindspore.nn as nn
import numpy as np
x_ = np.ones((1, 120, 1024, 640))
x = Tensor(x_, mindspore.float32)
net = nn.Conv2d(120, 240, 4, pad_mode='valid')
output = net(x).shape
print(output)
# (1, 240, 1021, 637)