mindspore.dataset.vision

此模块用于图像数据增强,包括 c_transformspy_transforms 两个子模块。 c_transforms 是使用 C++ OpenCv 开发的高性能图像增强模块。 py_transforms 是使用 Python Pillow 开发的图像增强模块。

API样例中常用的导入模块如下:

import mindspore.dataset.vision.c_transforms as c_vision
import mindspore.dataset.vision.py_transforms as py_vision
from mindspore.dataset.transforms import c_transforms

常用数据处理术语说明如下:

  • TensorOperation,所有C++实现的数据处理操作的基类。

  • PyTensorOperation,所有Python实现的数据处理操作的基类。

  • ImageTensorOperation,所有图像数据处理操作的基类,派生自TensorOperation。

mindspore.dataset.vision.c_transforms

mindspore.dataset.vision.c_transforms.AutoContrast

在输入图像上应用自动对比度。

mindspore.dataset.vision.c_transforms.BoundingBoxAugment

对图像的随机标注边界框区域,应用给定的图像变换处理。

mindspore.dataset.vision.c_transforms.CenterCrop

对输入图像应用中心区域裁剪。

mindspore.dataset.vision.c_transforms.ConvertColor

更改图像的色彩空间。

mindspore.dataset.vision.c_transforms.Crop

在输入图像上裁剪出指定区域。

mindspore.dataset.vision.c_transforms.CutMixBatch

对输入批次的图像和标注应用剪切混合转换。

mindspore.dataset.vision.c_transforms.CutOut

从输入图像数组中随机裁剪出给定数量的正方形区域。

mindspore.dataset.vision.c_transforms.Decode

对输入图像进行解码。

mindspore.dataset.vision.c_transforms.Equalize

对输入图像进行直方图均衡化。

mindspore.dataset.vision.c_transforms.GaussianBlur

使用指定的高斯核对输入图像进行模糊处理。

mindspore.dataset.vision.c_transforms.HorizontalFlip

水平翻转输入图像。

mindspore.dataset.vision.c_transforms.HWC2CHW

将输入图像的shape从 <H, W, C> 转换为 <C, H, W>。

mindspore.dataset.vision.c_transforms.Invert

在 RGB 模式下对输入图像应用像素反转,计算方式为(255 - pixel)。

mindspore.dataset.vision.c_transforms.MixUpBatch

对输入批次的图像和标注应用混合转换。

mindspore.dataset.vision.c_transforms.Normalize

根据均值和标准差对输入图像进行归一化。

mindspore.dataset.vision.c_transforms.NormalizePad

根据均值和标准差对输入图像进行归一化,然后填充一个全零的额外通道。

mindspore.dataset.vision.c_transforms.Pad

填充图像。

mindspore.dataset.vision.c_transforms.RandomAffine

对输入图像应用随机仿射变换。

mindspore.dataset.vision.c_transforms.RandomColor

随机调整输入图像的颜色。

mindspore.dataset.vision.c_transforms.RandomColorAdjust

随机调整输入图像的亮度、对比度、饱和度和色调。

mindspore.dataset.vision.c_transforms.RandomCrop

对输入图像进行随机区域的裁剪。

mindspore.dataset.vision.c_transforms.RandomCropDecodeResize

"裁剪"、"解码"和"调整尺寸大小"的组合处理。

mindspore.dataset.vision.c_transforms.RandomCropWithBBox

在输入图像的随机位置进行裁剪并相应地调整边界框。

mindspore.dataset.vision.c_transforms.RandomHorizontalFlip

对输入图像按给定的概率进行水平随机翻转。

mindspore.dataset.vision.c_transforms.RandomHorizontalFlipWithBBox

对输入图像按给定的概率进行水平随机翻转并相应地调整边界框。

mindspore.dataset.vision.c_transforms.RandomPosterize

随机减少输入图像每个颜色通道的位数。

mindspore.dataset.vision.c_transforms.RandomResize

对输入图像使用随机选择的 mindspore.dataset.vision.Inter 插值方式去调整它的尺寸大小。

mindspore.dataset.vision.c_transforms.RandomResizedCrop

对输入图像进行随机裁剪,并使用指定的 mindspore.dataset.vision.Inter 插值方式去调整为指定的尺寸大小。

mindspore.dataset.vision.c_transforms.RandomResizedCropWithBBox

对输入图像进行随机裁剪且随机调整纵横比,并将处理后的图像调整为指定的尺寸大小,并相应地调整边界框。

mindspore.dataset.vision.c_transforms.RandomResizeWithBBox

对输入图像使用随机选择的 mindspore.dataset.vision.Inter 插值方式去调整它的尺寸大小,并相应地调整边界框的尺寸大小。

mindspore.dataset.vision.c_transforms.RandomRotation

在指定的角度范围内,随机旋转输入图像。

mindspore.dataset.vision.c_transforms.RandomSelectSubpolicy

从策略列表中随机选择一个子策略以应用于输入图像。

mindspore.dataset.vision.c_transforms.RandomSharpness

在固定或随机的范围调整输入图像的锐度。

mindspore.dataset.vision.c_transforms.RandomSolarize

从给定阈值范围内随机选择一个子范围,对位于给定子范围内的像素,将其像素值设置为(255 - 原本像素值)。

mindspore.dataset.vision.c_transforms.RandomVerticalFlip

以给定的概率对输入图像在垂直方向进行随机翻转。

mindspore.dataset.vision.c_transforms.RandomVerticalFlipWithBBox

以给定的概率对输入图像和边界框在垂直方向进行随机翻转。

mindspore.dataset.vision.c_transforms.Rescale

基于给定的缩放和平移因子调整图像的尺寸大小。

mindspore.dataset.vision.c_transforms.Resize

对输入图像使用给定的 mindspore.dataset.vision.Inter 插值方式去调整为给定的尺寸大小。

mindspore.dataset.vision.c_transforms.ResizeWithBBox

将输入图像调整为给定的尺寸大小并相应地调整边界框的大小。

mindspore.dataset.vision.c_transforms.Rotate

将输入图像旋转指定的度数。

mindspore.dataset.vision.c_transforms.SlicePatches

在水平和垂直方向上将Tensor切片为多个块。

mindspore.dataset.vision.c_transforms.SoftDvppDecodeRandomCropResizeJpeg

使用Ascend系列芯片DVPP模块的模拟算法对JPEG图像进行裁剪、解码和缩放。

mindspore.dataset.vision.c_transforms.SoftDvppDecodeResizeJpeg

使用Ascend系列芯片DVPP模块的模拟算法对JPEG图像进行解码和缩放。

mindspore.dataset.vision.c_transforms.UniformAugment

对输入图像执行随机选取的数据增强操作。

mindspore.dataset.vision.c_transforms.VerticalFlip

对输入图像进行垂直翻转。

mindspore.dataset.vision.py_transforms

mindspore.dataset.vision.py_transforms.AutoContrast

最大化(标准化)输入PIL图像的对比度。

mindspore.dataset.vision.py_transforms.CenterCrop

以输入PIL图像的中心为裁剪中心,裁剪指定尺寸大小的子图。

mindspore.dataset.vision.py_transforms.Cutout

随机去除输入numpy.ndarray图像上一定数量的正方形区域,将区域内像素值置为0。

mindspore.dataset.vision.py_transforms.Decode

将输入原始图像字节解码为RGB格式PIL图像。

mindspore.dataset.vision.py_transforms.Equalize

对输入PIL图像进行直方图均衡。

mindspore.dataset.vision.py_transforms.FiveCrop

在输入PIL图像的中心与四个角处分别裁剪指定尺寸大小的子图。

mindspore.dataset.vision.py_transforms.Grayscale

将输入PIL图像转换为灰度图。

mindspore.dataset.vision.py_transforms.HsvToRgb

将输入的HSV格式numpy.ndarray图像转换为RGB格式。

mindspore.dataset.vision.py_transforms.HWC2CHW

将输入的numpy.ndarray图像的shape从(H, W, C)转换为(C, H, W)。

mindspore.dataset.vision.py_transforms.Invert

反转输入PIL图像的颜色。

mindspore.dataset.vision.py_transforms.LinearTransformation

使用指定的变换方阵和均值向量对输入numpy.ndarray图像进行线性变换。

mindspore.dataset.vision.py_transforms.MixUp

随机混合一批输入的numpy.ndarray图像及其标签。

mindspore.dataset.vision.py_transforms.Normalize

使用指定的均值和标准差,标准化shape为(C, H, W)的输入numpy.ndarray图像。

mindspore.dataset.vision.py_transforms.NormalizePad

使用指定的均值和标准差,标准化shape为(C, H, W)的输入numpy.ndarray图像,并填充一个全零的额外通道。

mindspore.dataset.vision.py_transforms.Pad

对输入PIL图像的各边进行填充。

mindspore.dataset.vision.py_transforms.RandomAffine

对输入PIL图像进行随机仿射变换。

mindspore.dataset.vision.py_transforms.RandomColor

随机调整输入PIL图像的色彩平衡。

mindspore.dataset.vision.py_transforms.RandomColorAdjust

随机调整输入PIL图像的亮度、对比度、饱和度和色调。

mindspore.dataset.vision.py_transforms.RandomCrop

在输入PIL图像上的随机位置,裁剪指定尺寸大小的子图。

mindspore.dataset.vision.py_transforms.RandomErasing

按照指定的概率擦除输入numpy.ndarray图像上随机矩形区域内的像素。

mindspore.dataset.vision.py_transforms.RandomGrayscale

按照指定的概率将输入PIL图像转换为灰度图。

mindspore.dataset.vision.py_transforms.RandomHorizontalFlip

按照指定的概率随机水平翻转输入的PIL图像。

mindspore.dataset.vision.py_transforms.RandomPerspective

按照指定的概率对输入PIL图像进行透视变换。

mindspore.dataset.vision.py_transforms.RandomResizedCrop

在输入PIL图像上的随机位置裁剪子图,并放缩到指定尺寸大小。

mindspore.dataset.vision.py_transforms.RandomRotation

将输入PIL图像旋转随机角度。

mindspore.dataset.vision.py_transforms.RandomSharpness

随机调整输入PIL图像的锐度。

mindspore.dataset.vision.py_transforms.RandomVerticalFlip

按照指定的概率随机垂直翻转输入的PIL图像。

mindspore.dataset.vision.py_transforms.Resize

将输入PIL图像放缩为指定尺寸大小。

mindspore.dataset.vision.py_transforms.RgbToHsv

将输入的RGB格式numpy.ndarray图像转换为HSV格式。

mindspore.dataset.vision.py_transforms.TenCrop

在输入PIL图像的中心与四个角处分别裁剪指定尺寸大小的子图,并将其翻转图一并返回。

mindspore.dataset.vision.py_transforms.ToPIL

将已解码的numpy.ndarray图像转换为PIL图像。

mindspore.dataset.vision.py_transforms.ToTensor

将输入的PIL或numpy.ndarray图像转换为指定数据类型的numpy.ndarray图像,此时像素值取值将由[0, 255]变为[0.0, 1.0],图像的shape将由(H, W, C)变为(C, H, W)。

mindspore.dataset.vision.py_transforms.ToType

将输入的numpy.ndarray图像转换为指定数据类型。

mindspore.dataset.vision.py_transforms.UniformAugment

从指定序列中均匀采样一批数据处理操作,并按顺序随机执行,即采样出的操作也可能不被执行。

mindspore.dataset.vision.utils

mindspore.dataset.vision.Border

边界填充方式枚举类。

mindspore.dataset.vision.ConvertMode

图像色彩空间转换模式枚举类。

mindspore.dataset.vision.ImageBatchFormat

图像批处理输出格式枚举类。

mindspore.dataset.vision.Inter

图像插值方式枚举类。

mindspore.dataset.vision.SliceMode

Tensor切片方式枚举类。