mindspore.ops.NeighborExchangeV2

class mindspore.ops.NeighborExchangeV2(send_rank_ids, recv_rank_ids, send_lens, recv_lens, data_format, group=GlobalComm.WORLD_COMM_GROUP)[源代码]

NeighborExchangeV2是一个集合通讯操作。

将数据从本地rank发送到 send_rank_ids 中指定的rank,同时从 recv_rank_ids 接收数据。请参考 分布式集合通信原语 - NeighborExchangeV2 了解具体的数据是如何在相邻设备间交换的。

说明

在运行以下示例之前,用户需要预置环境变量,请在 NeighborExchangeV2数据交换 的官方网站上查看详细信息。

要求全连接配网,每台设备具有相同的vlan id,ip和mask在同一子网,请查看 分布式集合通信原语注意事项

参数:
  • send_rank_ids (list(int)) - 指定发送数据的rank。8个rank_id分别代表8个方向上的数据要向哪个rank发送,如果某个方向上不发送数据,则设为-1。

  • recv_rank_ids (list(int)) - 指定接收数据的rank。8个rank_id分别代表8个方向上的数据要从哪个rank接收,如果某个方向上不接收数据,则设为-1。

  • send_lens (list(int)) - 指定 send_rank_ids 发送数据的长度,4个数字分别代表[send_top, send_bottom, send_left, send_right]4个方向上的长度。

  • recv_lens (list(int)) - 指定 recv_rank_ids 接收数据的长度,4个数字分别代表[recv_top, recv_bottom, recv_left, recv_right]4个方向上的长度。

  • data_format (str) - 数据格式,现在只支持NCHW。

  • group (str, 可选) - 工作的通信组。默认值:”GlobalComm.WORLD_COMM_GROUP”(即Ascend平台为”hccl_world_group”,GPU平台为”nccl_world_group” )。

输入:
  • input_x (Tensor) - 交换前的输入Tensor,其shape为 \((N, C, H, W)\)

输出:

数据交换后的输出Tensor,如果输入的shape是 \((N, C, H, W)\) ,则输出shape为 \((N, C, H+recv\_top+recv\_bottom, W+recv\_left+recv\_right)\)

异常:
  • TypeError - 如果 group 不是一个string或者 send_rank_idsrecv_rank_idssend_lensrecv_lens 中任意一个不是一个list。

  • ValueError - 如果 send_rank_ids 或者 recv_rank_ids 存在小于-1的值或者存在重复值。

  • ValueError - 如果 send_lens 或者 recv_lens 存在小于零的值。

  • ValueError - 如果 data_format 不是”NCHW”。

支持平台:

Ascend

样例:

说明

运行以下样例之前,需要配置好通信环境变量。

针对Ascend设备,用户需要准备rank表,设置rank_id和device_id,详见 Ascend指导文档

针对GPU设备,用户需要准备host文件和mpi,详见 GPU指导文档

该样例需要在2卡环境下运行。

>>> import os
>>> import mindspore as ms
>>> from mindspore import Tensor
>>> from mindspore.communication import init
>>> import mindspore.nn as nn
>>> import mindspore.ops as ops
>>> import numpy as np
>>> class Net(nn.Cell):
...     def __init__(self):
...         super(Net, self).__init__()
...         self.neighborexchangev2 = ops.NeighborExchangeV2(send_rank_ids=[-1, -1, -1, -1, 1, -1, -1, -1],
...                                                          send_lens=[0, 1, 0, 0],
...                                                          recv_rank_ids=[-1, -1, -1, -1, 1, -1, -1, -1],
...                                                          recv_lens=[0, 1, 0, 0],
...                                                          data_format="NCHW")
...
...     def construct(self, x):
...         out = self.neighborexchangev2(x)
...         return out
...
>>> ms.set_context(mode=ms.GRAPH_MODE, device_target='Ascend')
>>> init()
>>> input_x = Tensor(np.ones([1, 1, 2, 2]), dtype = ms.float32)
>>> net = Net()
>>> output = net(input_x)
>>> print(output)
[[[[1. 1.], [1. 1.], [2. 2.]]]]