mindspore.device_context

device_context中封装了设备数量查询与当前指定后端是否可用的接口。

CPU设备后端管理

mindspore.device_context.cpu.device_count

返回可用的CPU数量。

mindspore.device_context.cpu.is_available

返回CPU设备是否可用的指示。

mindspore.device_context.cpu.op_tuning.threads_num

设置CPU算子使用的线程数。

GPU设备后端管理

mindspore.device_context.gpu.device_count

返回可用的GPU数量。

mindspore.device_context.gpu.is_available

返回GPU设备是否可用的指示。

mindspore.device_context.gpu.op_precision.conv_allow_tf32

是否开启卷积在cuDNN下的TF32张量核计算。

mindspore.device_context.gpu.op_precision.matmul_allow_tf32

是否开启矩阵乘在CUBLAS下的TF32张量核计算。

mindspore.device_context.gpu.op_tuning.conv_dgrad_algo

指定cuDNN的卷积输入数据的反向算法。

mindspore.device_context.gpu.op_tuning.conv_fprop_algo

指定cuDNN的卷积前向算法。

mindspore.device_context.gpu.op_tuning.conv_wgrad_algo

指定cuDNN的卷积输入卷积核的反向算法。

Ascend设备后端管理

mindspore.device_context.ascend.device_count

查询可用的Ascend类型的设备数量。

mindspore.device_context.ascend.is_available

查询Ascend设备是否可用。

mindspore.device_context.ascend.op_precision.conv_allow_hf32

是否为Conv类算子使能FP32转换为HF32。

mindspore.device_context.ascend.op_precision.matmul_allow_hf32

是否为Matmul类算子使能FP32转换为HF32。

mindspore.device_context.ascend.op_precision.precision_mode

配置混合精度模式。

mindspore.device_context.ascend.op_precision.op_precision_mode

配置算子精度模式配置文件的路径。

mindspore.device_context.ascend.op_debug.execute_timeout

设置一个算子的最大执行时间,以秒为单位。

mindspore.device_context.ascend.op_debug.debug_option

使能Ascend算子调试选项,默认不开启。

mindspore.device_context.ascend.op_tuning.op_compile

是否选择在线编译,框架默认设置为静态shape选择在线编译,动态shape选择算子二进制文件,该默认设置将来可能会发生变化。

mindspore.device_context.ascend.op_tuning.aoe_tune_mode

表示启动AOE调优,默认不设置。

mindspore.device_context.ascend.op_tuning.aoe_job_type

设置AOE工具专用的参数,需要和mindspore.device_context.op_tuning.aoe_tune_mode(tune_mode)配合使用,框架默认设置为2。