mindspore.ops.MaxPoolWithArgmax
- class mindspore.ops.MaxPoolWithArgmax(kernel_size=1, strides=1, pad_mode='valid', data_format='NCHW')[源代码]
对输入Tensor执行最大池化运算,并返回最大值和索引。
通常,输入的shape为 \((N_{in}, C_{in}, H_{in}, W_{in})\) ,MaxPool在 \((H_{in}, W_{in})\) 维度输出区域最大值。 给定 kernel_size 为 \((kH, kW)\) 和 stride ,运算如下:
\[\begin{split}\text{output}(N_i, C_j, h, w) = \max_{m=0, \ldots, kH-1} \max_{n=0, \ldots, kW-1}\\ \text{input}(N_i, C_j, stride[0] \times h + m, stride[1] \times w + n)\end{split}\]参数:
kernel_size (Union[int, tuple[int]]) - 指定池化核尺寸大小。由一个整数或者是两个整数组成的tuple,表示高和宽。默认值:1。
strides (Union[int, tuple[int]]) - 池化操作的移动步长,由一个整数或者是两个整数组成的tuple,表示高和宽移动步长。默认值:1。
pad_mode (str) - 指定池化填充模式,可选值是’same’或’valid’,不区分大小写。默认值:’valid’。
same - 输出的高度和宽度分别与输入整除 stride 后的值相同。
valid - 在不填充的前提下返回有效计算所得的输出。不满足计算的多余像素会被丢弃。
data_format (str):输入和输出的数据格式。可选值为’NHWC’或’NCHW’。默认值:’NCHW’。
输入:
x (Tensor) - shape为 \((N, C_{in}, H_{in}, W_{in})\) 的Tensor。数据类型必须为float16或float32。
输出:
两个Tensor组成的tuple,表示最大池化结果和生成最大值的位置。
output (Tensor) - 输出最大池结果,shape为 \((N, C_{out}, H_{out}, W_{out})\) 。其数据类型与 x 的相同。
mask (Tensor) - 输出最大值索引。数据类型为int32。
异常:
TypeError - x 的数据类型既不是float16也不是float32。
TypeError - kernel_size 或 strides 既不是int也不是tuple。
TypeError - x 不是Tensor。
- 支持平台:
Ascend
GPU
样例:
>>> x = Tensor(np.arange(1 * 3 * 3 * 4).reshape((1, 3, 3, 4)), mindspore.float32) >>> maxpool_arg_op = ops.MaxPoolWithArgmax(pad_mode="VALID", kernel_size=2, strides=1) >>> output_tensor, argmax = maxpool_arg_op(x) >>> print(output_tensor) [[[[ 5. 6. 7.] [ 9. 10. 11.]] [[17. 18. 19.] [21. 22. 23.]] [[29. 30. 31.] [33. 34. 35.]]]]