mindspore.dataset.vision.SlicePatches

class mindspore.dataset.vision.SlicePatches(num_height=1, num_width=1, slice_mode=SliceMode.PAD, fill_value=0)[源代码]

在水平和垂直方向上将Tensor切片为多个块。适合于Tensor高宽较大的使用场景。如果将 num_heightnum_width 都设置为 1,则Tensor将保持不变。输出Tensor的数量等于 \(num\_height * num\_width\)

参数:
  • num_height (int, 可选) - 垂直方向的切块数量。默认值: 1

  • num_width (int, 可选) - 水平方向的切块数量。默认值: 1

  • slice_mode (SliceMode, 可选) - 表示填充或丢弃,它可以是 SliceMode.PADSliceMode.DROP 。默认值: SliceMode.PAD

  • fill_value (int, 可选) - 如果 slice_mode 取值为 SliceMode.PAD,该值表示在右侧和底部的边界填充宽度(以像素数计)。 fill_value 取值必须在[0, 255]范围内。默认值: 0

异常:
  • TypeError - 当 num_height 不是int。

  • TypeError - 当 num_width 不是int。

  • TypeError - 当 slice_mode 的类型不为 mindspore.dataset.vision.SliceMode

  • TypeError - 当 fill_value 不是int。

  • ValueError - 当 num_height 不为正数。

  • ValueError - 当 num_width 不为正数。

  • ValueError - 当 fill_value 不在 [0, 255]范围内。

  • RuntimeError - 如果输入的Tensor不是 <H, W> 或<H, W, C> 格式。

支持平台:

CPU

样例:

>>> import numpy as np
>>> import mindspore.dataset as ds
>>> import mindspore.dataset.vision as vision
>>>
>>> # Use the transform in dataset pipeline mode
>>> # default padding mode
>>> num_h, num_w = (1, 4)
>>> slice_patches_op = vision.SlicePatches(num_h, num_w)
>>> transforms_list = [slice_patches_op]
>>> cols = ['img' + str(x) for x in range(num_h*num_w)]
>>>
>>> data = np.random.randint(0, 255, size=(1, 100, 100, 3)).astype(np.uint8)
>>> numpy_slices_dataset = ds.NumpySlicesDataset(data, ["image"])
>>> numpy_slices_dataset = numpy_slices_dataset.map(operations=transforms_list,
...                                                 input_columns=["image"],
...                                                 output_columns=cols)
>>> for item in numpy_slices_dataset.create_dict_iterator(num_epochs=1, output_numpy=True):
...     print(len(item), item["img0"].shape, item["img0"].dtype)
...     break
4 (100, 25, 3) uint8
>>>
>>> # Use the transform in eager mode
>>> data = np.random.randint(0, 255, size=(100, 100, 3)).astype(np.uint8)
>>> output = vision.SlicePatches(1, 2)(data)
>>> print(np.array(output).shape, np.array(output).dtype)
(2, 100, 50, 3) uint8
教程样例: