mindspore.ops.fractional_max_pool3d

mindspore.ops.fractional_max_pool3d(input_x, kernel_size, output_size=None, output_ratio=None, return_indices=False, _random_samples=None)[源代码]

对多个输入平面组成的输入上应用3D分数最大池化。在 \((kD_{in}, kH_{in}, kW_{in})\) 区域上应用最大池化操作,由输出shape决定随机步长。输出特征的数量等于输入平面的数量。

分数最大池化的详细描述在 Fractional MaxPooling by Ben Graham

输入输出的数据格式可以是”NCDHW“。其中,N是批次大小,C是通道数,D是特征深度,H是特征高度,W是特征宽度。

参数:
  • input_x (Tensor) - 四维或五维的Tensor,支持的数据类型:float16、float32、double、int32、int64。支持shape为 \((N, C, D_{in}, H_{in}, W_{in})\)

  • kernel_size (Union[int, tuple[int]]) - 指定池化核尺寸大小,如果为int,则代表池化核的深度,高和宽。如果为tuple,其值必须包含三个正int值分别表示池化核的深度,高和宽。取值必须为正int。

  • output_size (Union[int, tuple[int]],可选) - 目标输出大小。如果是int,则表示输出目标的深、高和宽。如果是tuple,其值必须包含三个int值分别表示目标输出的深、高和宽。默认值:None。

  • output_ratio (Union[float, tuple[float]],可选) - 目标输出shape与输入shape的比率。通过输入shape和 output_ratio 确定输出shape。支持数据类型:float16、float32、double,数值范围(0,1)。默认值:None。

  • return_indices (bool,可选) - 如果为 True ,返回分数最大池化的最大值的的索引值。默认值:False。

  • _random_samples (Tensor,可选) - 随机步长。支持的数据类型:float16、float32、double。shape为 \((N, C, 3)\) 的Tensor。数值范围(0,1)。默认值:None。

返回:
  • y (Tensor) - 3D分数最大池化的输出,是一个Tensor。数据类型和输入相同,shape是 \((N, C, D, H, W)\)

  • argmax (Tensor) - 仅当 return_indices 为True时,输出最大池化的索引值。shape和输出 y 一致。

异常:
  • TypeError - input_x 不是四维或五维Tensor。

  • TypeError - random_samples 不是三维Tensor。

  • TypeError - x 数据类型不是float16、float32、double、int32、int64。

  • TypeError - random_samples 数据类型不是float16、float32、double。

  • TypeError - argmax 数据类型不是int32、int64。

  • ValueError - output_shape 不是长度为3的tuple。

  • ValueError - kernal_size 不是长度为3的tuple。

  • ValueError - output_shapekernel_size 不是正数。

  • ValueError - output_sizeoutput_ratio 同时为 None

  • ValueError - input_xrandom_samples 的第一维度大小不相等。

  • ValueError - input_xrandom_samples 第二维度大小不相等。

  • ValueError - random_samples 第三维度大小不是3。

支持平台:

GPU CPU

样例:

>>> x = Tensor(np.array([1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16])
...            .reshape([1, 1, 2, 2, 4]), mstype.float32)
>>> _random_samples = Tensor(np.array([0.7, 0.7, 0.7]).reshape([1, 1, 3]), mstype.float32)
>>> output, argmax = ops.fractional_max_pool3d(x, kernel_size=(1.0, 1.0, 1.0), output_size=(1, 1, 3),
...                                            _random_samples=_random_samples, return_indices=True)
>>> print(output)
[[[[[13. 14. 16.]]]]]
>>> print(argmax)
[[[[[12 13 15]]]]]
>>> output, argmax = ops.fractional_max_pool3d(x, kernel_size=(1.0, 1.0, 1.0), output_ratio=(0.5, 0.5, 0.5),
...                                            _random_samples=_random_samples, return_indices=True)
>>> print(output)
[[[[[13. 16.]]]]]
>>> print(argmax)
[[[[[12 15]]]]]