MindSpore分布式算子支持
Linux
Ascend
GPU
CPU
模型开发
初级
中级
高级
分布式算子
操作名 |
约束 |
---|---|
None |
|
None |
|
None |
|
None |
|
None |
|
输入(logits)在轴(axis)对应的维度不可切分,切分后,在数学逻辑上和单机不等价 |
|
输入(logits)在轴(axis)对应的维度不可切分,切分后,在数学逻辑上和单机不等价 |
|
None |
|
None |
|
None |
|
None |
|
None |
|
None |
|
None |
|
None |
|
None |
|
None |
|
不支持重复计算 |
|
None |
|
None |
|
None |
|
None |
|
None |
|
None |
|
None |
|
None |
|
None |
|
None |
|
None |
|
None |
|
None |
|
None |
|
None |
|
输入(input_x)在轴(axis)所对应的维度不能切分,切分后,在数学逻辑上和单机不等价 |
|
需和 |
|
需和 |
|
仅支持1维和2维的input_params,并且input_params的最后一维要32字节对齐(出于性能考虑);不支持标量input_indices;参数在轴(axis)所在维度切分时,不支持重复计算;不支持input_indices和input_params同时进行切分 |
|
同GatherV2 |
|
同GatherV2 |
|
输入(input_x)在轴(axis)对应的维度不能切,切分后,在数学逻辑上和单机不等价 |
|
输入(logits、labels)的最后一维不能切分;有两个输出,正向的loss只支持取[0] |
|
不支持 |
|
不支持 |
|
weight的shape在非[1]的情况下,输入(input_x)的Channel维要和weight的切分方式一致 |
|
仅支持输入(indices)是1维的Tensor,切分策略要配置输出的切分策略,以及第1和第2个输入的切分策略 |
|
None |
|
输入在轴(axis)的维度进行切分时,分布式结果可能会和单机不一致 |
|
输入在轴(axis)的维度进行切分时,分布式结果可能会和单机不一致 |
|
输入在轴(axis)的维度进行切分时,分布式结果可能会和单机不一致 |
|
输入在轴(axis)的维度进行切分时,分布式结果可能会和单机不一致 |
|
None |
|
不支持配置切分策略 |
|
仅支持值为全0的mask;需要切分的维度必须全部提取;输入在strides不为1对应的维度不支持切分 |
|
仅支持对multiples配置切分策略 |
|
None |
重复计算是指,机器没有用满,比如:集群有8张卡跑分布式训练,切分策略只对输入切成了4份。这种情况下会发生重复计算。