mindspore.dataset.vision.RandomCrop

class mindspore.dataset.vision.RandomCrop(size, padding=None, pad_if_needed=False, fill_value=0, padding_mode=Border.CONSTANT)[源代码]

对输入图像进行随机区域的裁剪。如果输入图像尺寸小于输出尺寸,输入图像将在裁剪前被填充。

Note

如果在多个数据列上应用此处理,则需要确保每个数据列图像的shape相同。

参数:

  • size (Union[int, Sequence[int]]) - 裁剪图像的输出尺寸大小。值必须为正。 如果 size 是整数,则返回一个裁剪尺寸大小为 (size, size) 的正方形。 如果 size 是一个长度为 2 的序列,则以2个元素分别为高和宽放缩至(高度, 宽度)大小。

  • padding (Union[int, Sequence[int]], 可选) - 图像各边填充的像素数。填充值必须为非负值,默认值:None。 如果 padding 不为 None,则首先使用 padding 填充图像。 如果 padding 是一个整数,代表为图像的所有方向填充该值大小的像素。 如果 padding 是一个包含2个值的元组或列表,第一个值会用于填充图像的左侧和上侧,第二个值会用于填充图像的右侧和下侧。 如果 padding 是一个包含4个值的元组或列表,则分别填充图像的左侧、上侧、右侧和下侧。

  • pad_if_needed (bool, 可选) - 如果输入图像高度或者宽度小于 size 指定的输出图像尺寸大小,是否进行填充。默认值:False。

  • fill_value (Union[int, tuple[int]], 可选) - 边框的像素强度,仅当 padding_mode 为 Border.CONSTANT 时有效。 如果是3元素元组,则分别用于填充R、G、B通道。 如果是整数,则用于所有RGB通道。 fill_value 值必须在 [0, 255] 范围内,默认值:0。

  • padding_mode (Border, 可选) - 边界填充方式。它可以是 [Border.CONSTANT、Border.EDGE、Border.REFLECT、Border.SYMMETRIC] 中的任何一个,默认值:Border.CONSTANT。

    • Border.CONSTANT - 使用常量值进行填充。

    • Border.EDGE - 使用各边的边界像素值进行填充。

    • Border.REFLECT - 以各边的边界为轴进行镜像填充,忽略边界像素值。

    • Border.SYMMETRIC - 以各边的边界为轴进行对称填充,包括边界像素值。

Note

padding 输入长度为2的序列时的行为未来将从使用第一个值填充左/上边界,使用第二个值填充右/下边界,变为使用第一个值填充左/右边界,使用第二个值填充上/下边界。你也可以直接输入长度为4的序列来分别指定左、上、右和下边界的填充长度。

异常:

  • TypeError - 如果 size 不是int或Sequence[int]类型。

  • TypeError - 如果 padding 不是int或Sequence[int]类型。

  • TypeError - 如果 pad_if_needed 不是bool类型。

  • TypeError - 如果 fill_value 不是int或tuple[int]类型。

  • TypeError - 如果 padding_mode 不是 mindspore.dataset.vision.Border 的类型。

  • ValueError - 如果 size 不是正数。

  • ValueError - 如果 padding 为负数。

  • ValueError - 如果 fill_value 不在 [0, 255] 范围内。

  • RuntimeError - 如果输入图像的shape不是 <H, W> 或 <H, W, C>。

支持平台:

CPU

样例:

>>> from mindspore.dataset.vision import Border
>>> decode_op = vision.Decode()
>>> random_crop_op = vision.RandomCrop(512, [200, 200, 200, 200], padding_mode=Border.EDGE)
>>> transforms_list = [decode_op, random_crop_op]
>>> image_folder_dataset = image_folder_dataset.map(operations=transforms_list,
...                                                 input_columns=["image"])