mindspore.ops.Col2Im
- class mindspore.ops.Col2Im(kernel_size, dilation=1, padding=0, stride=1)[源代码]
将一组通过滑窗获得的数组组合成一个大的Tensor。通常用于从一组图像补丁(或滑动局部块)中重建图像。
假设输入为一个包含多个滑窗的Tensor,例如,图像的补丁,其shape为 \((N, C, \prod(\text{kernel_size}), L)\) ,\(N\) 代表Batch数量,\(C\) 代表Channel数量,\(\prod(\text{kernel_size})\) 代表滑窗大小,\(L\) 代表滑窗总数。Col2Im通过对这些滑窗重叠的部分进行加和来将输入组合成shape为 \((N, C, \text{output_size}[0], \text{output_size}[1], \dots)\) 的Tensor作为输出。
输入与输出的shape之间的关系可以表示为:
\[L = \prod_d \left\lfloor\frac{\text{output_size}[d] + 2 \times \text{padding}[d] % - \text{dilation}[d] \times (\text{kernel_size}[d] - 1) - 1}{\text{stride}[d]} + 1\right\rfloor\]式中 \(d\) 代表高度与宽度上两个维度, dilation 、 padding 和 stride 决定了滑窗如何滑动与检索元素。
警告
这是一个实验性API,后续可能修改或删除。
- 参数:
kernel_size (Union[int, tuple[int], list[int]]) - 滑窗大小,由两个正整数组成,分别代表滑窗的高度与宽度。如果数据类型为int,代表不同方向上的填充大小相等。取值必须由用户指定。
dilation (Union[int, tuple[int], list[int]], 可选) - 滑窗之间的间距,由两个正整数组成,分别代表横向与纵向上滑窗移动时与上一个滑窗间的距离。如果数据类型为int,代表不同方向上的填充大小相等。默认值:1。
padding (Union[int, tuple[int], list[int]], 可选) - 滑窗取数前在输入 x 周围隐式填充0(若需)的范围,由两个正整数组成,分别代表横向与纵向上的填充范围。如果数据类型为int,代表不同方向上的填充大小相等。默认值:0。
stride (Union[int, tuple[int], list[int]], 可选) - 滑窗移动的步长,由两个正整数组成,分别代表滑窗在横向与纵向上的移动步长。如果数据类型为int,代表不同方向上的步长相等。默认值:1。
- 输入:
x (Tensor) - 4D Tensor,数据类型为float16或float32。
output_size (Tensor) - 1D Tensor,输出Tensor的后两维的shape,包含2个元素且其数据类型为int32。
- 输出:
4D Tensor,类型与输入 x 一致。
- 异常:
TypeError - 输入 kernel_size 、 dilation 、 padding 、 stride 的数据类型不是int、tuple[int]或list[int]之一。
ValueError - 输入 kernel_size 、 dilation 、 padding 、 stride 的值小于等于0或者其中元素的个数大于2。
ValueError - x.shape[2] != kernel_size[0] * kernel_size[1]。
ValueError - x.shape[3]与计算出的滑动块数量不匹配。
- 支持平台:
Ascend
GPU
CPU
样例:
>>> import numpy as np >>> from mindspore import Tensor, ops >>> from mindspore import dtype as mstype >>> x = Tensor(input_data=np.random.rand(16, 16, 4, 25), dtype=mstype.float32) >>> output_size = Tensor(input_data=[8, 8], dtype=mstype.int32) >>> col2im = ops.Col2Im(kernel_size=[2, 2], dilation=[2, 2], padding=[2, 2], stride=[2, 2]) >>> y = col2im(x, output_size) >>> print(y.shape) (16, 16, 8, 8)