mindspore.dataset.vision.RandomCrop

class mindspore.dataset.vision.RandomCrop(size, padding=None, pad_if_needed=False, fill_value=0, padding_mode=Border.CONSTANT)[源代码]

对输入图像进行随机区域的裁剪。如果输入图像尺寸小于输出尺寸，输入图像将在裁剪前被填充。

说明

如果在多个数据列上应用此处理，则需要确保每个数据列图像的shape相同。

参数：

size (Union[int, Sequence[int]]) - 裁剪图像的输出尺寸大小。值必须为正。
- 如果 size 是整数，则返回一个裁剪尺寸大小为 (size, size) 的正方形。
- 如果 size 是一个长度为 2 的序列，则以2个元素分别为高和宽放缩至(高度, 宽度)大小。
padding (Union[int, Sequence[int]], 可选) - 图像各边填充的像素数。填充值必须为非负值。默认值： None 。
- 如果 padding 不为 None，则首先使用 padding 填充图像。
- 如果 padding 是一个整数，代表为图像的所有方向填充该值大小的像素。
- 如果 padding 是一个包含2个值的元组或列表，第一个值会用于填充图像的左侧和右侧，第二个值会用于填充图像的上侧和下侧。
- 如果 padding 是一个包含4个值的元组或列表，则分别填充图像的左侧、上侧、右侧和下侧。
pad_if_needed (bool, 可选) - 如果输入图像高度或者宽度小于 size 指定的输出图像尺寸大小，是否进行填充。默认值： False 。
fill_value (Union[int, tuple[int]], 可选) - 边框的像素强度，仅当 padding_mode 为 Border.CONSTANT 时有效。fill_value 值必须在 [0, 255] 范围内。默认值： 0 。
- 如果是3元素元组，则分别用于填充R、G、B通道。
- 如果是整数，则用于所有RGB通道。
padding_mode (Border, 可选) - 边界填充方式。它可以是 Border.CONSTANT 、 Border.EDGE 、 Border.REFLECT 、 Border.SYMMETRIC 。默认值： Border.CONSTANT 。
- Border.CONSTANT - 使用常量值进行填充。
- Border.EDGE - 使用各边的边界像素值进行填充。
- Border.REFLECT - 以各边的边界为轴进行镜像填充，忽略边界像素值。
- Border.SYMMETRIC - 以各边的边界为轴进行对称填充，包括边界像素值。

异常：

TypeError - 如果 size 不是int或Sequence[int]类型。
TypeError - 如果 padding 不是int或Sequence[int]类型。
TypeError - 如果 pad_if_needed 不是bool类型。
TypeError - 如果 fill_value 不是int或tuple[int]类型。
TypeError - 如果 padding_mode 不是 mindspore.dataset.vision.Border 的类型。
ValueError - 如果 size 不是正数。
ValueError - 如果 padding 为负数。
ValueError - 如果 fill_value 不在 [0, 255] 范围内。
RuntimeError - 如果输入图像的shape不是 <H, W> 或 <…, H, W, C>。

支持平台：

CPU

样例：

>>> import numpy as np
>>> import mindspore.dataset as ds
>>> import mindspore.dataset.vision as vision
>>> from mindspore.dataset.vision import Border
>>>
>>> # Use the transform in dataset pipeline mode
>>> random_crop_op = vision.RandomCrop(64, [16, 16, 16, 16], padding_mode=Border.EDGE)
>>> transforms_list = [random_crop_op]
>>> data = np.random.randint(0, 255, size=(1, 100, 100, 3)).astype(np.uint8)
>>> numpy_slices_dataset = ds.NumpySlicesDataset(data, ["image"])
>>> numpy_slices_dataset = numpy_slices_dataset.map(operations=transforms_list, input_columns=["image"])
>>> for item in numpy_slices_dataset.create_dict_iterator(num_epochs=1, output_numpy=True):
...     print(item["image"].shape, item["image"].dtype)
...     break
(64, 64, 3) uint8
>>>
>>> # Use the transform in eager mode
>>> data = np.random.randint(0, 255, size=(100, 100, 3)).astype(np.uint8)
>>> output = vision.RandomCrop(8, [10, 10, 10, 10], padding_mode=Border.EDGE)(data)
>>> print(output.shape, output.dtype)
(8, 8, 3) uint8

教程样例：

视觉变换样例库