mindspore.communication

集合通信接口。

注意,集合通信接口需要先配置好通信环境变量。

针对Ascend/GPU/CPU设备,推荐使用msrun启动方式,无第三方以及配置文件依赖。详见 msrun启动

mindspore.communication.GlobalComm

GlobalComm 是一个储存通信信息的全局类。

mindspore.communication.init

初始化通信服务需要的分布式后端,例如 HCCLNCCLMCCL 服务。

mindspore.communication.release

释放分布式资源,例如 HCCLNCCLMCCL 服务。

mindspore.communication.create_group

创建用户自定义的通信组实例。

mindspore.communication.destroy_group

注销用户通信组。

mindspore.communication.get_comm_name

获取指定通讯组的通讯器名称。

mindspore.communication.get_group_size

获取指定通信组实例的rank_size。

mindspore.communication.get_group_rank_from_world_rank

由通信集群中的全局设备序号获取指定用户通信组中的rank ID。

mindspore.communication.get_local_rank

获取指定通信组中当前设备的本地设备序号。

mindspore.communication.get_local_rank_size

获取指定通信组的本地设备总数。

mindspore.communication.get_process_group_ranks

获取指定通信组中的进程,并将通信组中的进程编号以列表方式返回。

mindspore.communication.get_rank

在指定通信组中获取当前的设备序号。

mindspore.communication.get_world_rank_from_group_rank

由指定通信组中的设备序号获取通信集群中的全局设备序号。

mindspore.communication.HCCL_WORLD_COMM_GROUP

"hccl_world_group" 字符串,指的是由HCCL创建的默认通信组。

mindspore.communication.NCCL_WORLD_COMM_GROUP

"nccl_world_group" 字符串,指的是由NCCL创建的默认通信组。

mindspore.communication.MCCL_WORLD_COMM_GROUP

"mccl_world_group" 字符串,指的是由MCCL创建的默认通信组。

mindspore.communication.comm_func

集合通信函数式接口。

mindspore.communication.comm_func.all_gather_into_tensor

汇聚指定的通信组中的Tensor,并返回汇聚后的张量。

mindspore.communication.comm_func.all_reduce

使用指定方式对通信组内的所有设备的Tensor数据进行规约操作,所有设备都得到相同的结果,返回规约操作后的Tensor。

mindspore.communication.comm_func.all_to_all_single_with_output_shape

根据用户输入的切分大小,把输入 tensor 切分后,发送到其他的设备上,并从其他设备接收切分块,然后合并到一个输出Tensor中。

mindspore.communication.comm_func.all_to_all_with_output_shape

根据用户输入的张量列表,将对应的张量发送到远端设备,并从其他设备接收张量,返回一个接收的张量列表。

mindspore.communication.comm_func.barrier

同步通信域内的多个进程。

mindspore.communication.comm_func.batch_isend_irecv

异步地发送和接收张量。

mindspore.communication.comm_func.broadcast

对输入数据整组广播。

mindspore.communication.comm_func.gather_into_tensor

对通信组的输入Tensor进行聚合。

mindspore.communication.comm_func.irecv

异步接收Tensor到指定线程。

mindspore.communication.comm_func.isend

异步发送Tensor到指定线程。

mindspore.communication.comm_func.recv

同步接收Tensor到指定线程。

mindspore.communication.comm_func.send

同步发送Tensor到指定线程。

mindspore.communication.comm_func.P2POp

用于存放关于'isend'、'irecv'相关的信息, 并用于 batch_isend_irecv 接口的入参。

mindspore.communication.comm_func.reduce

规约指定通信组中的Tensor,并将规约结果发送到目标为dst的进程(全局的进程编号)中,返回发送到目标进程的Tensor。

mindspore.communication.comm_func.reduce_scatter_tensor

规约并且分发指定通信组中的Tensor,返回分发后的Tensor。

mindspore.communication.comm_func.scatter_tensor

将输入的Tensor均匀散射到通信域的卡上。