mindspore.device_context.gpu.op_tuning.conv_dgrad_algo
- mindspore.device_context.gpu.op_tuning.conv_dgrad_algo(mode)[源代码]
指定cuDNN的卷积输入数据的反向算法。 详细信息请查看 NVIDA cuDNN关于cudnnConvolutionBackwardData的说明。
- 参数:
mode (str) - cuDNN的卷积输入数据的反向算法。如未配置,框架默认为 normal 。 其值范围如下:
normal:使用cuDNN自带的启发式搜索算法,会根据卷积形状和类型快速选择合适的卷积算法。该参数不保证性能最优。
performance: 使用cuDNN自带的试运行搜索算法,会根据卷积形状和类型试运行所有卷积算法,然后选择最优算法。该参数保证性能最优。
algo_0: 该算法将卷积表示为矩阵乘积的和,而没有实际显式地形成保存输入张量数据的矩阵。求和使用原子加法操作完成,因此结果是不确定的。
algo_1: 该算法将卷积表示为矩阵乘积,而没有实际显式地形成保存输入张量数据的矩阵。结果是确定的。
fft: 该算法利用快速傅里叶变换完成卷积计算。需要额外申请较大内存空间,保存中间结果。结果是确定的。
fft_tiling: 该算法利用快速傅里叶变换完成卷积计算,但是需要对输入进行分块。同样需要额外申请内存空间,保存中间结果,但是对大尺寸的输入,所需内存空间小于 fft 算法。结果是确定的。
winograd: 该算法利用Winograd变换完成卷积计算。需要额外申请合理的内存空间,保存中间结果。结果是确定的。
winograd_nonfused: 该算法利用Winograd变形算法完成卷积计算。需要额外申请较大的内存空间,保存中间结果。结果是确定的。
样例:
>>> import mindspore as ms >>> ms.device_context.gpu.op_tuning.conv_dgrad_algo("performance")