比较与torch.nn.TransformerEncoder的差异

torch.nn.TransformerEncoder

class torch.nn.TransformerEncoder(
    encoder_layer,
    num_layers,
    norm=None
)(src, mask=None, src_key_padding_mask=None)

更多内容详见torch.nn.TransformerEncoder。

mindspore.nn.TransformerEncoder

class mindspore.nn.TransformerEncoder(
    encoder_layer,
    num_layers,
    norm=None
)(src, src_mask=None, src_key_padding_mask=None)

更多内容详见mindspore.nn.TransformerEncoder。

差异对比

torch.nn.TransformerEncoder 和 mindspore.nn.TransformerEncoder 用法基本一致。

分类	子类	PyTorch	MindSpore	差异
参数	参数1	encoder_layer	encoder_layer	功能一致
	参数2	num_layers	num_layers	功能一致
	参数3	norm	norm	功能一致
输入	输入1	src	src	功能一致
	输入2	mask	src_mask	功能一致，参数名不同
	输入3	src_key_padding_mask	src_key_padding_mask	MindSpore中dtype可设置为float或bool Tensor，PyTorch中dtype可设置为byte或bool Tensor

代码示例

# PyTorch
import torch
from torch import nn

encoder_layer = nn.TransformerEncoderLayer(d_model=512, nhead=8)
transformer_encoder = nn.TransformerEncoder(encoder_layer, num_layers=6)
src = torch.rand(10, 32, 512)
out = transformer_encoder(src)
print(out.shape)
#torch.Size([10, 32, 512])

# MindSpore
import mindspore
from mindspore import nn

encoder_layer = nn.TransformerEncoderLayer(d_model=512, nhead=8)
transformer_encoder = nn.TransformerEncoder(encoder_layer, num_layers=6)
src = mindspore.numpy.rand(10, 32, 512)
out = transformer_encoder(src)
print(out.shape)
#(10, 32, 512)