分布式并行
自定义算子
性能优化
算法优化
高阶函数式编程
数据处理
模型推理
复杂问题调试
半自动并行支持多种并行模式的自动混合使用,包括:
算子级并行:算子级并行是指以算子为单位,把输入张量和模型参数切分到多台设备上进行计算,提升整体速度。
优化器并行:优化器并行可以减少多台设备对于相同权重更新的冗余计算,将计算量分散到多个设备上。
流水线并行:流水线并行是指将模型按层切分,每个设备只处理模型中某一部分。