mindspore.dataset.vision.MixUp

class mindspore.dataset.vision.MixUp(batch_size, alpha, is_single=True)[源代码]

随机混合一批输入的numpy.ndarray图像及其标签。

首先将每个图像乘以一个从Beta分布随机生成的权重 \(lambda\) ,然后加上另一个图像与 \(1 - lambda\) 之积,最后使用同样的 \(lambda\) 值将图像对应的标签进行混合,请确保标签预先进行了one-hot编码。

参数:

  • batch_size (int) - 批处理大小,即图片的数量。

  • alpha (float) - Beta分布的α参数值,β参数也将使用该值。

  • is_single (bool,可选) - 若为True,将在批内随机混合图像[img0, …, img(n-1), img(n)]与[img1, …, img(n), img0]及对应标签;否则,将每批图像与前一批图像的处理结果混合。默认值:True。

异常:

  • TypeError - 当 batch_size 的类型不为int。

  • TypeError - 当 alpha 的类型不为float。

  • TypeError - 当 is_single 的类型不为bool。

  • ValueError - 当 batch_size 不为正数。

  • ValueError - 当 alpha 不为正数。

支持平台:

CPU

样例:

>>> # first decode the image
>>> image_folder_dataset = image_folder_dataset.map(operations=vision.Decode(),
...                                                 input_columns="image")
>>> # then ont hot decode the label
>>> image_folder_dataset = image_folder_dataset.map(operations=transforms.OneHot(10),
...                                                 input_columns="label")
>>> # batch the samples
>>> batch_size = 4
>>> image_folder_dataset = image_folder_dataset.batch(batch_size=batch_size)
>>> # finally mix up the images and labels
>>> image_folder_dataset = image_folder_dataset.map(
...     operations=py_vision.MixUp(batch_size=batch_size, alpha=0.2),
...     input_columns=["image", "label"])