mindspore.dataset.vision.Perspective

查看源文件
class mindspore.dataset.vision.Perspective(start_points, end_points, interpolation=Inter.BILINEAR)[源代码]

对输入图像进行透视变换。

支持 Ascend 硬件加速,需要通过 .device("Ascend") 方式开启。

参数:
  • start_points (Sequence[Sequence[int, int]]) - 起始点坐标序列,包含四个两元素子序列,分别对应原图中四边形的 [左上、右上、右下、左下]。

  • end_points (Sequence[Sequence[int, int]]) - 目标点坐标序列,包含四个两元素子序列,分别对应目标图中四边形的 [左上、右上、右下、左下]。

  • interpolation (Inter,可选) - 图像插值方法。可选值详见 mindspore.dataset.vision.Inter 。 默认值: Inter.BILINEAR。 - Ascend模式:通过 .device("Ascend") 设定执行设备为 Ascend 时, 只支持 Inter.LINEARInter.NEAREST 差值方法。

异常:
  • TypeError - 如果 start_points 不是Sequence[Sequence[int, int]]类型。

  • TypeError - 如果 end_points 不是Sequence[Sequence[int, int]]类型。

  • TypeError - 当 interpolation 的类型不为 mindspore.dataset.vision.Inter

  • RuntimeError - 如果输入图像的形状不是 <H, W> 或 <H, W, C>。

支持平台:

CPU Ascend

样例:

>>> import numpy as np
>>> import mindspore.dataset as ds
>>> import mindspore.dataset.vision as vision
>>> from mindspore.dataset.vision import Inter
>>>
>>> # Use the transform in dataset pipeline mode
>>> start_points = [[0, 63], [63, 63], [63, 0], [0, 0]]
>>> end_points = [[0, 32], [32, 32], [32, 0], [0, 0]]
>>> transforms_list = [vision.Perspective(start_points, end_points, Inter.BILINEAR)]
>>> # apply the transform to dataset through map function
>>> data = np.random.randint(0, 255, size=(1, 100, 100, 3)).astype(np.uint8)
>>> numpy_slices_dataset = ds.NumpySlicesDataset(data, ["image"])
>>> numpy_slices_dataset = numpy_slices_dataset.map(operations=transforms_list, input_columns="image")
>>> for item in numpy_slices_dataset.create_dict_iterator(num_epochs=1, output_numpy=True):
...     print(item["image"].shape, item["image"].dtype)
...     break
(100, 100, 3) uint8
>>>
>>> # Use the transform in eager mode
>>> start_points = [[0, 63], [63, 63], [63, 0], [0, 0]]
>>> end_points = [[0, 32], [32, 32], [32, 0], [0, 0]]
>>> data = np.random.randint(0, 255, size=(100, 100, 3)).astype(np.uint8)
>>> output = vision.Perspective(start_points, end_points, Inter.BILINEAR)(data)
>>> print(output.shape, output.dtype)
(100, 100, 3) uint8
教程样例:
device(device_target='CPU')[源代码]

指定该变换执行的设备。

  • 当执行设备是 Ascend 时,输入数据的维度限制为[6, 10]和[8192, 4096]之间。

  • 当执行设备是 CPU 时,输入数据支持 uint8float32 或者 float64 类型。

  • 当执行设备是 Ascend 时,输入数据支持 uint8float32 类型,输入数据的通道仅支持 1/3。输入数据的高度限制范围为[6, 8192]、宽度限制范围为[10, 4096]。

参数:
  • device_target (str, 可选) - 算子将在指定的设备上运行。当前支持 CPUAscend 。默认值: CPU

异常:
  • TypeError - 当 device_target 的类型不为str。

  • ValueError - 当 device_target 的取值不为 CPU / Ascend

支持平台:

CPU Ascend

样例:

>>> import numpy as np
>>> import mindspore.dataset as ds
>>> import mindspore.dataset.vision as vision
>>> from mindspore.dataset.vision import Inter
>>>
>>> # Use the transform in dataset pipeline mode
>>> data = np.random.randint(0, 255, size=(1, 100, 100, 3)).astype(np.uint8)
>>> numpy_slices_dataset = ds.NumpySlicesDataset(data, ["image"])
>>> start_points = [[0, 63], [63, 63], [63, 0], [0, 0]]
>>> end_points = [[0, 32], [32, 32], [32, 0], [0, 0]]
>>> perspective_op = vision.Perspective(start_points, end_points).device("Ascend")
>>> transforms_list = [perspective_op]
>>> numpy_slices_dataset = numpy_slices_dataset.map(operations=transforms_list, input_columns=["image"])
>>> for item in numpy_slices_dataset.create_dict_iterator(num_epochs=1, output_numpy=True):
...     print(item["image"].shape, item["image"].dtype)
...     break
(100, 100, 3) uint8
>>>
>>> # Use the transform in eager mode
>>> start_points = [[0, 63], [63, 63], [63, 0], [0, 0]]
>>> end_points = [[0, 32], [32, 32], [32, 0], [0, 0]]
>>> data = np.random.randint(0, 255, size=(100, 100, 3)).astype(np.uint8)
>>> output = vision.Perspective(start_points, end_points, Inter.BILINEAR).device("Ascend")(data)
>>> print(output.shape, output.dtype)
(100, 100, 3) uint8