mindspore.ops.Im2Col
- class mindspore.ops.Im2Col(ksizes, strides=1, dilations=1, pads=0)[源代码]
从一个batch的输入Tensor中提取滑动局部块。
考虑一个batch的输入Tensor,其shape为
,其中 是batch维度, 是channel维度, 表示任意的空间维度。此操作将展平输入 x 空间维度内每个滑动的 ksize 大小的滑块为输出的4-D Tensor中的一列(如,最后一维),输出Tensor的shape为 , 其中 表示每个滑块内的总元素数量(一个滑块有 个空间位置, 每个位置都包含一个 C 通道的向量),共有 个这样的滑块:其中,
由输入 x 的空间维度(上面的 )决定, 遍历所有的空间维度。因此,在最后一个维度(列维度)上 output 包含特定块内的所有值。
pads , strides 和 dilations 决定了滑块如何被取出。
说明
目前,只支持4-D Tensor(一个batch的图像Tensor)。
警告
这是一个实验性API,后续可能修改或删除。
- 参数:
ksizes (Union[int, tuple[int], list[int]]) - 内核的大小。若为两个整数,则分别代表高度和宽度;若只有一个整数,则同时代表高度和宽度。该参数必须被指定。
strides (Union[int, tuple[int], list[int]],可选) - 窗口的滑动步幅。若为两个整数,则分别代表高度和宽度;若只有一个整数,则同时代表高度和宽度。默认值:
1
。dilations (Union[int, tuple[int], list[int]],可选) - 窗口的扩张系数。若为两个整数,则分别代表高度和宽度;若只有一个整数,则同时代表高度和宽度。默认值:
1
。pads (Union[int, tuple[int], list[int]],可选) - 窗口的填充。必须是一个或两个整数来指定高宽和宽度方向的填充。默认值:
0
。如果是1个整数,则
。如果是2个整数,则
, 。
- 输入:
x (Tensor) - 输入Tensor,只支持4-D Tensor(1个batch的图像Tensor)。
- 输出:
Tensor,一个4-D Tensor,与输入 x 的数据类型相同。
- 异常:
TypeError - 如果 ksizes 的类型不在Union[int, tuple[int], list[int]]内。
TypeError - 如果 strides 的类型不在Union[int, tuple[int], list[int]]内。
TypeError - 如果 dilations 的类型不在Union[int, tuple[int], list[int]]内。
TypeError - 如果 pads 类型不在Union[int, tuple[int], list[int]]内。
ValueError - 如果 ksizes 的值不大于0或其元素数量大于2。
ValueError - 如果 strides 的值不大于0或其元素数量大于2。
ValueError - 如果 dilations 的值不大于0或其元素数量大于2。
ValueError - 如果 pads 的值不大于0。
- 支持平台:
Ascend
GPU
CPU
样例:
>>> import numpy as np >>> from mindspore import Tensor, ops >>> from mindspore import dtype as mstype >>> x = Tensor(input_data=np.random.rand(4, 4, 32, 32), dtype=mstype.float64) >>> im2col = ops.Im2Col(ksizes=3, strides=1, dilations=1) >>> y = im2col(x) >>> print(y.shape) (4, 4, 9, 900)