mindspore.dataset.vision.RandAugment

查看源文件
class mindspore.dataset.vision.RandAugment(num_ops=2, magnitude=9, num_magnitude_bins=31, interpolation=Inter.NEAREST, fill_value=0)[源代码]

对输入图像应用RandAugment数据增强方法。

参考论文 RandAugment: Learning Augmentation Strategies from Data

只支持3通道RGB图像。

参数:
  • num_ops (int, 可选) - 顺序执行的数据增强变换个数。默认值: 2

  • magnitude (int, 可选) - 所有变换的幅值,需小于 num_magnitude_bins 。默认值: 9

  • num_magnitude_bins (int, 可选) - 不同变换幅值的个数,需不小于2 。默认值: 31

  • interpolation (Inter, 可选) - 图像插值方法。可选值详见 mindspore.dataset.vision.Inter 。 默认值: Inter.NEAREST

  • fill_value (Union[int, tuple[int, int, int]], 可选) - 变换后超出原图外区域的像素填充值,取值需在 [0, 255] 范围内。默认值: 0 。 如果输入int,将用于填充所有 RGB 通道。 如果输入tuple[int, int, int],则分别用于填充R、G、B通道。

异常:
  • TypeError - 如果 num_ops 不是int类型。

  • ValueError - 如果 num_ops 为负数。

  • TypeError - 如果 magnitude 不是int类型。

  • ValueError - 如果 magnitude 非正数。

  • TypeError - 如果 num_magnitude_bins 不是int类型。

  • ValueError - 如果 num_magnitude_bins 小于2。

  • TypeError - 如果 interpolation 不是 mindspore.dataset.vision.Inter 类型。

  • TypeError - 如果 fill_value 不是int或tuple[int, int, int]类型。

  • ValueError - 如果 fill_value 取值不在[0, 255]范围。

  • RuntimeError - 如果输入图像的形状不是 <H, W, C>。

支持平台:

CPU

样例:

>>> import numpy as np
>>> import mindspore.dataset as ds
>>> import mindspore.dataset.vision as vision
>>> from mindspore.dataset.vision import Inter
>>>
>>> # Use the transform in dataset pipeline mode
>>> data = np.random.randint(0, 255, size=(1, 100, 100, 3)).astype(np.uint8)
>>> numpy_slices_dataset = ds.NumpySlicesDataset(data, ["image"])
>>> transforms_list = [vision.RandAugment()]
>>> numpy_slices_dataset = numpy_slices_dataset.map(operations=transforms_list, input_columns=["image"])
>>> for item in numpy_slices_dataset.create_dict_iterator(num_epochs=1, output_numpy=True):
...     print(item["image"].shape, item["image"].dtype)
...     break
(100, 100, 3) uint8
>>>
>>> # Use the transform in eager mode
>>> data = np.random.randint(0, 255, size=(100, 100, 3)).astype(np.uint8)
>>> output = vision.RandAugment(interpolation=Inter.BILINEAR, fill_value=255)(data)
>>> print(output.shape, output.dtype)
(100, 100, 3) uint8
教程样例: