mindspore.dataset.vision.MixUp

查看源文件
class mindspore.dataset.vision.MixUp(batch_size, alpha, is_single=True)[源代码]

随机混合一批输入的numpy.ndarray图像及其标签。

首先将每个图像乘以一个从Beta分布随机生成的权重 \(lambda\) ,然后加上另一个图像与 \(1 - lambda\) 之积。使用同样的 \(lambda\) 值将图像对应的标签进行混合。请确保标签预先进行了one-hot编码。

参数:
  • batch_size (int) - 批处理大小,即图片的数量。

  • alpha (float) - Beta分布的α参数值,β参数也将使用该值。

  • is_single (bool,可选) - 若为 True ,将在批内随机混合图像[img0, …, img(n-1), img(n)]与[img1, …, img(n), img0]及对应标签;否则,将每批图像与前一批图像的处理结果混合。默认值: True

异常:
  • TypeError - 当 batch_size 的类型不为int。

  • TypeError - 当 alpha 的类型不为float。

  • TypeError - 当 is_single 的类型不为bool。

  • ValueError - 当 batch_size 不为正数。

  • ValueError - 当 alpha 不为正数。

支持平台:

CPU

样例:

>>> import numpy as np
>>> import mindspore.dataset as ds
>>> import mindspore.dataset.vision as vision
>>> import mindspore.dataset.transforms as transforms
>>>
>>> # Use the transform in dataset pipeline mode
>>> data = np.random.randint(0, 255, size=(64, 64, 3)).astype(np.uint8)
>>> numpy_slices_dataset = ds.NumpySlicesDataset(data, ["image"])
>>> numpy_slices_dataset = numpy_slices_dataset.map(
...     operations=lambda img: (data, np.random.randint(0, 5, (3, 1))),
...     input_columns=["image"],
...     output_columns=["image", "label"])
>>> # ont hot decode the label
>>> numpy_slices_dataset = numpy_slices_dataset.map(operations=transforms.OneHot(10), input_columns="label")
>>> # batch the samples
>>> numpy_slices_dataset = numpy_slices_dataset.batch(batch_size=4)
>>> # finally mix up the images and labels
>>> numpy_slices_dataset = numpy_slices_dataset.map(
...     operations=vision.MixUp(batch_size=1, alpha=0.2),
...     input_columns=["image", "label"])
>>> for item in numpy_slices_dataset.create_dict_iterator(num_epochs=1, output_numpy=True):
...     print(item["image"].shape, item["image"].dtype)
...     print(item["label"].shape, item["label"].dtype)
...     break
(4, 64, 64, 3) float64
(4, 3, 10) float64
>>>
>>> # Use the transform in eager mode
>>> data = np.random.randint(0, 255, size=(100, 100, 3)).astype(np.uint8)
>>> label = np.array([[0, 1]])
>>> output = vision.MixUp(batch_size=2, alpha=0.2, is_single=False)(data, label)
>>> print(output[0].shape, output[0].dtype)
(2, 100, 100, 3) float64
>>> print(output[1].shape, output[1].dtype)
(2, 2) float64
教程样例: