文档反馈

问题文档片段

问题文档片段包含公式时,显示为空格。

提交类型
issue

有点复杂...

找人问问吧。

请选择提交类型

问题类型
规范和低错类

- 规范和低错类:

- 错别字或拼写错误,标点符号使用错误、公式错误或显示异常。

- 链接错误、空单元格、格式错误。

- 英文中包含中文字符。

- 界面和描述不一致,但不影响操作。

- 表述不通顺,但不影响理解。

- 版本号不匹配:如软件包名称、界面版本号。

易用性

- 易用性:

- 关键步骤错误或缺失,无法指导用户完成任务。

- 缺少主要功能描述、关键词解释、必要前提条件、注意事项等。

- 描述内容存在歧义指代不明、上下文矛盾。

- 逻辑不清晰,该分类、分项、分步骤的没有给出。

正确性

- 正确性:

- 技术原理、功能、支持平台、参数类型、异常报错等描述和软件实现不一致。

- 原理图、架构图等存在错误。

- 命令、命令参数等错误。

- 代码片段错误。

- 命令无法完成对应功能。

- 界面错误,无法指导操作。

- 代码样例运行报错、运行结果不符。

风险提示

- 风险提示:

- 对重要数据或系统存在风险的操作,缺少安全提示。

内容合规

- 内容合规:

- 违反法律法规,涉及政治、领土主权等敏感词。

- 内容侵权。

请选择问题类型

问题描述

点击输入详细问题描述,以帮助我们快速定位问题。

mindspore.nn.MaxPool2d

class mindspore.nn.MaxPool2d(kernel_size=1, stride=1, pad_mode='valid', padding=0, dilation=1, return_indices=False, ceil_mode=False, data_format='NCHW')[源代码]

在一个输入Tensor上应用2D最大池化运算,可被视为组成一个2D平面。

通常,输入的shape为 (Nin,Cin,Hin,Win) ,MaxPool2d输出 (Hin,Win) 维度区域最大值。给定 kernel_size(hker,wker)stride(s0,s1),公式如下。

output(Ni,Cj,h,w)=maxm=0,,hker1maxn=0,,wker1input(Ni,Cj,s0×h+m,s1×w+n)
参数:
  • kernel_size (Union[int, tuple[int]]) - 指定池化核尺寸大小,如果为整数或单元素tuple,则代表池化核的高和宽。如果为tuple且长度不为1,其值必须包含两个整数值分别表示池化核的高和宽。默认值:1。

  • stride (Union[int, tuple[int]]) - 池化操作的移动步长,如果为整数或单元素tuple,则代表池化核的高和宽方向的移动步长。如果为tuple且长度不为1,其值必须包含两个整数值分别表示池化核的高和宽的移动步长。默认值:1。

  • pad_mode (str) - 指定池化填充模式,取值为”same”、”valid”或者”pad”,不区分大小写。默认值:”valid”。

    • same - 输出的shape与输入的shape整除 stride 后的值相同。

    • valid - 在不填充的前提下返回有效计算所得的输出。不满足计算的多余像素会被丢弃。

    • pad - 对输入进行填充。在输入的上下左右分别填充 padding 大小的0。如果设置此模式, padding 必须大于或等于0。

  • padding (Union(int, tuple[int], list[int])) - 池化填充值。默认值:0。 padding 只能是一个整数或者包含一个或两个整数的元组,若 padding 为一个整数或者包含一个整数的tuple/list,则会分别在输入的上下左右四个方向进行 padding 次的填充,若 padding 为一个包含两个整数的tuple/list,则会在输入的上下进行 padding[0] 次的填充,在输入的左右进行 padding[1] 次的填充。

  • dilation (Union(int, tuple[int])) - 卷积核中各个元素之间的间隔大小,用于提升池化操作的感受野。如果为tuple,其值必须包含一个或两个整数。默认值:1。

  • return_indices (bool) - 若为True,将会同时返回最大池化的结果和索引。默认值:False。

  • ceil_mode (bool) - 若为True,使用ceil来计算输出shape。若为False,使用floor来计算输出shape。默认值:False。

  • data_format (str) - 输入数据格式可为’NHWC’或’NCHW’。默认值:’NCHW’。

输入:
  • x (Tensor) - 输入数据的shape为 (N,Cin,Hin,Win)(Cin,Hin,Win) 的Tensor。

输出:

如果 return_indices 为False,则是shape为 (N,C,Hout,Wout) 或者 (Cout,Hout,Wout) 的Tensor。数据类型与 x 一致。 如果 return_indices 为True,则是一个包含了两个Tensor的Tuple,表示maxpool的计算结果以及生成max值的位置。

  • output (Tensor) - 最大池化结果,shape为 (Nout,Cout,Hout,Wout) 或者 (Cout,Hout,Wout) 的Tensor。数据类型与 x 一致。

  • argmax (Tensor) - 最大值对应的索引。数据类型为int64。

其中,如果 pad_modepad 模式时,输出的shape计算公式如下:

Hout=Hin+2padding[0]dilation[0]×(kernel_size[0]1)1stride[0]+1
Wout=Win+2padding[1]dilation[1]×(kernel_size[1]1)1stride[1]+1
异常:
  • TypeError - kernel_sizestrides 既不是整数也不是元组。

  • ValueError - pad_mode 既不是’valid’,也不是’same’ 或者 ‘pad’,不区分大小写。

  • ValueError - data_format 既不是’NCHW’也不是’NHWC’。

  • ValueError - kernel_sizestrides 小于1。

  • ValueError - x 的shape长度不等于3或4。

  • ValueError - 当 pad_mode 不为 ‘pad’ 时,paddingdilationreturn_indicesceil_mode 参数不为默认值。

  • ValueError - padding 参数为tuple/list时长度不为2。

  • ValueError - dilation 参数为tuple时长度不为2。

  • ValueError - dilation 参数不为int也不为tuple。

  • ValueError - pad_mode 为 ‘pad’ 时,data_format 为 ‘NHWC’。

  • ValueError - pad_mode 不为 “pad” 的时候 padding 为非0。

支持平台:

Ascend GPU CPU

样例:

>>> pool = nn.MaxPool2d(kernel_size=3, stride=1)
>>> x = Tensor(np.random.randint(0, 10, [1, 2, 4, 4]), mindspore.float32)
>>> output = pool(x)
>>> print(output.shape)
(1, 2, 2, 2)
>>> np_x = np.random.randint(0, 10, [5, 3, 4, 5])
>>> x = Tensor(np_x, mindspore.float32)
>>> pool2 = nn.MaxPool2d(kernel_size=2, stride=1, pad_mode='pad', padding=1, dilation=1, return_indices=True)
>>> output = pool2(x)
>>> print(output[0].shape)
(5, 3, 5, 6)
>>> print(output[1].shape)
(5, 3, 5, 6)