mindspore.dataset.vision.BoundingBoxAugment

class mindspore.dataset.vision.BoundingBoxAugment(transform, ratio=0.3)[源代码]

对图像的随机标注边界框区域,应用给定的图像变换处理。

参数:
  • transform (TensorOperation) - 对图像的随机标注边界框区域应用的变换处理。

  • ratio (float, 可选) - 要应用变换的边界框的比例。范围:[0.0, 1.0]。默认值: 0.3

异常:
  • TypeError - 如果 transform 不是 mindspore.dataset.vision 模块中的图像变换处理。

  • TypeError - 如果 ratio 不是float类型。

  • ValueError - 如果 ratio 不在 [0.0, 1.0] 范围内。

  • RuntimeError - 如果给定的边界框无效。

支持平台:

CPU

样例:

>>> import numpy as np
>>> import mindspore.dataset as ds
>>> import mindspore.dataset.vision as vision
>>>
>>> # Use the transform in dataset pipeline mode
>>> data = np.random.randint(0, 255, size=(100, 100, 3)).astype(np.float32)
>>> numpy_slices_dataset = ds.NumpySlicesDataset(data, ["image"])
>>> func = lambda img: (data, np.array([[0, 0, data.shape[1], data.shape[0]]]).astype(np.float32))
>>> numpy_slices_dataset = numpy_slices_dataset.map(operations=[func],
...                                                 input_columns=["image"],
...                                                 output_columns=["image", "bbox"])
>>> # set bounding box operation with ratio of 1 to apply rotation on all bounding boxes
>>> bbox_aug_op = vision.BoundingBoxAugment(vision.RandomRotation(90), 1)
>>> # map to apply ops
>>> numpy_slices_dataset = numpy_slices_dataset.map(operations=[bbox_aug_op],
...                                                 input_columns=["image", "bbox"],
...                                                 output_columns=["image", "bbox"])
>>> for item in numpy_slices_dataset.create_dict_iterator(num_epochs=1, output_numpy=True):
...     print(item["image"].shape, item["image"].dtype)
...     print(item["bbox"].shape, item["bbox"].dtype)
...     break
(100, 100, 3) float32
(1, 4) float32
>>>
>>> # Use the transform in eager mode
>>> data = np.array([[0, 1, 2, 3, 4, 5], [0, 1, 2, 3, 4, 5]], dtype=np.uint8).reshape((3, 4))
>>> data = data.astype(np.float32)
>>> func = lambda img, bboxes: (data, np.array([[0, 0, data.shape[1], data.shape[0]]]).astype(bboxes.dtype))
>>> func_data, func_bboxes = func(data, data)
>>> output = vision.BoundingBoxAugment(transforms.Fill(100), 1.0)(func_data, func_bboxes)
>>> print(output[0].shape, output[0].dtype)
(3, 4) float32
>>> print(output[1].shape, output[1].dtype)
(1, 4) float32
教程样例: