算子编译

Linux Windows Ascend GPU CPU 环境准备 初级 中级

查看源文件

Q: TransData算子的功能是什么,能否优化性能?

A: TransData算子出现的场景是: 如果网络中相互连接的算子使用的数据格式不一致(如NC1HWC0),框架就会自动插入transdata算子使其转换成一致的数据格式,然后再进行计算。 华为Ascend支持5D格式运算,通过transdata算子将数据由4D转为5D以提升性能。


Q: 算子Concat拼接包含多个Tensor的元组出错,似乎传入的tensor list元素个数>=192就会报错。如果要Concat包含多个Tensor的元组,有什么较好的解决方案?

A: 这个昇腾算子底层规格限制一次拼接的Tensor个数不能超过192个,可以尝试分开两次进行拼接。


Q: 在使用Conv2D进行卷积定义的时候使用到了group的参数,group的值不是只需要保证可以被输入输出的维度整除即可了吗?group参数的传递方式是怎样的呢?

A: Conv2D算子是有这个约束条件的: 当group大于1 时,其值必须要与输入输出的通道数相等。不要使用ops.Conv2D,这个算子目前不支持group>1。目前MindSpore只有nn.Conv2D接口支持组卷积,但是有group要与输入输出的通道数相等的约束。


Q: MindSpore支持矩阵转置吗?

A: 支持,请参考mindspore.ops.Transpose算子教程


Q: 请问MindSpore能算给定任意一个tensor的方差吗?

A: mindspore目前暂无可以直接求出tensor方差的算子或接口。不过MindSpore有足够多的小算子可以支持用户实现这样的操作,你可以参考class Moments(Cell)来实现。


Q: nn.Embedding层与PyTorch相比缺少了Padding操作,有其余的算子可以实现吗?

A: 在PyTorch中padding_idx的作用是将embedding矩阵中padding_idx位置的词向量置为0,并且反向传播时不会更新padding_idx位置的词向量。在MindSpore中,可以手动将embedding的padding_idx位置对应的权重初始化为0,并且在训练时通过mask的操作,过滤掉padding_idx位置对应的Loss


Q: Operations中Tile算子执行到__infer__value值为None,丢失了数值是怎么回事?

A: Tile算子的multiples input必须是一个常量(该值不能直接或间接来自于图的输入)。否则构图的时候会拿到一个None的数据,因为图的输入是在图执行的时候才传下去的,构图的时候拿不到图的输入数据。 相关的资料可以看静态图语法支持


Q: 使用conv2d算子将卷积核设置为(3,10),Tensor设置为[2,2,10,10],在ModelArts上利用Ascend跑,报错: FM_W+pad_left+pad_right-KW>=strideW,CPU下不报错。

A: TBE(Tensor Boost Engine)算子是华为自研的Ascend算子开发工具,在TVM框架基础上扩展,进行自定义算子开发。上述问题是这个TBE算子的限制,x的width必须大于kernel的width。CPU的这个算子没有这个限制,所以不报错。


Q: 请问MindSpore实现了反池化操作了吗?类似于nn.MaxUnpool2d 这个反池化操作?

A: 目前 MindSpore 还没有反池化相关的接口。用户可以通过自定义算子的方式自行开发算子,详情请见自定义算子


Q: 使用ExpandDims算子报错: Pynative run op ExpandDims failed。具体代码:

context.set_context(mode=context.GRAPH_MODE,device_target='Ascend')
input_tensor=Tensor(np.array([[2,2],[2,2]]),mindspore.float32)
expand_dims=ops.ExpandDims()
output=expand_dims(input_tensor,0)

A: 这边的问题是选择了Graph模式却使用了PyNative的写法,所以导致报错,MindSpore支持两种运行模式,在调试或者运行方面做了不同的优化:

  • PyNative模式: 也称动态图模式,将神经网络中的各个算子逐一下发执行,方便用户编写和调试神经网络模型。

  • Graph模式: 也称静态图模式或者图模式,将神经网络模型编译成一整张图,然后下发执行。该模式利用图优化等技术提高运行性能,同时有助于规模部署和跨平台运行。

用户可以参考官网教程选择合适、统一的模式和写法来完成训练。