mindspore.dataset.vision.CutMixBatch
- class mindspore.dataset.vision.CutMixBatch(image_batch_format, alpha=1.0, prob=1.0)[源代码]
对输入批次的图像和标注应用剪切混合转换。 请注意,在调用此操作符之前,您需要将标注制作为 one-hot 格式并进行批处理。
- 参数:
image_batch_format (
ImageBatchFormat
) - 图像批处理输出格式。可以是ImageBatchFormat.NHWC
或ImageBatchFormat.NCHW
。alpha (float, 可选) - β分布的超参数,必须大于0。默认值:
1.0
。prob (float, 可选) - 对每个图像应用剪切混合处理的概率,取值范围:[0.0, 1.0]。默认值:
1.0
。
- 异常:
TypeError - 如果 image_batch_format 不是
mindspore.dataset.vision.ImageBatchFormat
的类型。TypeError - 如果 alpha 不是float类型。
TypeError - 如果 prob 不是 float 类型。
ValueError - 如果 alpha 小于或等于 0。
ValueError - 如果 prob 不在 [0.0, 1.0] 范围内。
RuntimeError - 如果输入图像的shape不是 <H, W, C>。
- 支持平台:
CPU
样例:
>>> import numpy as np >>> import mindspore.dataset as ds >>> import mindspore.dataset.transforms as transforms >>> import mindspore.dataset.vision as vision >>> from mindspore.dataset.vision import ImageBatchFormat >>> >>> # Use the transform in dataset pipeline mode >>> data = np.random.randint(0, 255, size=(28, 28, 3)).astype(np.uint8) >>> numpy_slices_dataset = ds.NumpySlicesDataset(data, ["image"]) >>> numpy_slices_dataset = numpy_slices_dataset.map( ... operations=lambda img: (data, np.random.randint(0, 5, (3, 1))), ... input_columns=["image"], ... output_columns=["image", "label"]) >>> onehot_op = transforms.OneHot(num_classes=10) >>> numpy_slices_dataset= numpy_slices_dataset.map(operations=onehot_op, input_columns=["label"]) >>> cutmix_batch_op = vision.CutMixBatch(ImageBatchFormat.NHWC, 1.0, 0.5) >>> numpy_slices_dataset = numpy_slices_dataset.batch(5) >>> numpy_slices_dataset = numpy_slices_dataset.map(operations=cutmix_batch_op, ... input_columns=["image", "label"]) >>> for item in numpy_slices_dataset.create_dict_iterator(num_epochs=1, output_numpy=True): ... print(item["image"].shape, item["image"].dtype) ... print(item["label"].shape, item["label"].dtype) ... break (5, 28, 28, 3) uint8 (5, 3, 10) float32 >>> >>> # Use the transform in eager mode >>> data = np.random.randint(0, 255, (3, 3, 10, 10)).astype(np.uint8) >>> label = np.array([[0, 1], [1, 0], [1, 0]]) >>> output = vision.CutMixBatch(vision.ImageBatchFormat.NCHW, 1.0, 1.0)(data, label) >>> print(output[0].shape, output[0].dtype) (3, 3, 10, 10) uint8 >>> print(output[1].shape, output[1].dtype) (3, 2) float32
- 教程样例: