mindspore.dataset.vision.Crop

class mindspore.dataset.vision.Crop(coordinates, size)[源代码]

在输入图像上裁剪出指定区域。

支持 Ascend 硬件加速，需要通过 .device("Ascend") 方式开启。

参数：

coordinates (sequence) - 裁剪区域的起始左上角坐标。必须是两个值的序列，形式为(上，左)。
size (Union[int, sequence]) - 裁剪区域的尺寸大小。
- 如果 size 是整数，则返回一个裁剪尺寸大小为 (size, size) 的正方形。
- 如果 size 是一个长度为 2 的序列，则返回一个裁剪尺寸大小为 (高度, 宽度) 的长方形。
值必须大于 0。

异常：

TypeError - 如果 coordinates 不是sequence类型。
TypeError - 如果 size 不是int或sequence类型。
ValueError - 如果 coordinates 小于 0。
ValueError - 如果 size 小于或等于 0。
RuntimeError - 如果输入图像的shape不是 <H, W> 或 <H, W, C>。

支持平台：

CPU Ascend

样例：

>>> import numpy as np
>>> import mindspore.dataset as ds
>>> import mindspore.dataset.vision as vision
>>>
>>> # Use the transform in dataset pipeline mode
>>> data = np.random.randint(0, 255, size=(1, 100, 100, 3)).astype(np.uint8)
>>> numpy_slices_dataset = ds.NumpySlicesDataset(data, ["image"])
>>> crop_op = vision.Crop((0, 0), 32)
>>> transforms_list = [crop_op]
>>> numpy_slices_dataset = numpy_slices_dataset.map(operations=transforms_list, input_columns=["image"])
>>> for item in numpy_slices_dataset.create_dict_iterator(num_epochs=1, output_numpy=True):
...     print(item["image"].shape, item["image"].dtype)
...     break
(32, 32, 3) uint8
>>>
>>> # Use the transform in eager mode
>>> data = np.array([[0, 1, 2, 3, 4, 5], [0, 1, 2, 3, 4, 5]], dtype=np.uint8).reshape((2, 2, 3))
>>> output = vision.Crop((0, 0), 1)(data)
>>> print(output.shape, output.dtype)
(1, 1, 3) uint8

教程样例：

视觉变换样例库

device(device_target='CPU')[源代码]

指定该变换执行的设备。

当执行设备是 Ascend 时，输入/输出数据的维度限制在[4, 6]和[32768, 32768]范围内。

参数：

device_target (str, 可选) - 算子将在指定的设备上运行。当前支持 "CPU" 和 "Ascend" 。默认值： "CPU" 。

异常：

TypeError - 当 device_target 的类型不为str。
ValueError - 当 device_target 的取值不为[ "CPU" , "Ascend" ]。

支持平台：

CPU Ascend

样例：

>>> import numpy as np
>>> import mindspore.dataset as ds
>>> import mindspore.dataset.vision as vision
>>>
>>> # Use the transform in dataset pipeline mode
>>> data = np.random.randint(0, 255, size=(1, 100, 100, 3)).astype(np.uint8)
>>> numpy_slices_dataset = ds.NumpySlicesDataset(data, ["image"])
>>> crop_op = vision.Crop((0, 0), (100, 75)).device("Ascend")
>>> transforms_list = [crop_op]
>>> numpy_slices_dataset = numpy_slices_dataset.map(operations=transforms_list, input_columns=["image"])
>>> for item in numpy_slices_dataset.create_dict_iterator(num_epochs=1, output_numpy=True):
...     print(item["image"].shape, item["image"].dtype)
...     break
(100, 75, 3) uint8
>>>
>>> # Use the transform in eager mode
>>> data = np.random.randint(0, 255, size=(100, 100, 3)).astype(np.uint8)
>>> output = vision.Crop((0, 0), 64).device("Ascend")(data)
>>> print(output.shape, output.dtype)
(64, 64, 3) uint8