mindspore.dataset.vision
此模块用于图像数据增强,包括 c_transforms 和 py_transforms 两个子模块。 c_transforms 是使用 C++ OpenCv 开发的高性能图像增强模块。 py_transforms 是使用 Python Pillow 开发的图像增强模块。
API样例中常用的导入模块如下:
import mindspore.dataset.vision.c_transforms as c_vision
import mindspore.dataset.vision.py_transforms as py_vision
from mindspore.dataset.transforms import c_transforms
常用数据处理术语说明如下:
TensorOperation,所有C++实现的数据处理操作的基类。
PyTensorOperation,所有Python实现的数据处理操作的基类。
ImageTensorOperation,所有图像数据处理操作的基类,派生自TensorOperation。
mindspore.dataset.vision.c_transforms
在输入图像上应用自动对比度。 |
|
对图像的随机标注边界框区域,应用给定的图像变换处理。 |
|
对输入图像应用中心区域裁剪。 |
|
更改图像的色彩空间。 |
|
在输入图像上裁剪出指定区域。 |
|
对输入批次的图像和标注应用剪切混合转换。 |
|
从输入图像数组中随机裁剪出给定数量的正方形区域。 |
|
对输入图像进行解码。 |
|
对输入图像进行直方图均衡化。 |
|
使用指定的高斯核对输入图像进行模糊处理。 |
|
水平翻转输入图像。 |
|
将输入图像的shape从 <H, W, C> 转换为 <C, H, W>。 |
|
在 RGB 模式下对输入图像应用像素反转,计算方式为(255 - pixel)。 |
|
对输入批次的图像和标注应用混合转换。 |
|
根据均值和标准差对输入图像进行归一化。 |
|
根据均值和标准差对输入图像进行归一化,然后填充一个全零的额外通道。 |
|
填充图像。 |
|
对输入图像应用随机仿射变换。 |
|
随机调整输入图像的颜色。 |
|
随机调整输入图像的亮度、对比度、饱和度和色调。 |
|
对输入图像进行随机区域的裁剪。 |
|
|
"裁剪"、"解码"和"调整尺寸大小"的组合处理。 |
在输入图像的随机位置进行裁剪并相应地调整边界框。 |
|
对输入图像按给定的概率进行水平随机翻转。 |
|
|
对输入图像按给定的概率进行水平随机翻转并相应地调整边界框。 |
随机减少输入图像每个颜色通道的位数。 |
|
对输入图像使用随机选择的 |
|
对输入图像进行随机裁剪,并使用指定的 |
|
|
对输入图像进行随机裁剪且随机调整纵横比,并将处理后的图像调整为指定的尺寸大小,并相应地调整边界框。 |
对输入图像使用随机选择的 |
|
在指定的角度范围内,随机旋转输入图像。 |
|
从策略列表中随机选择一个子策略以应用于输入图像。 |
|
在固定或随机的范围调整输入图像的锐度。 |
|
从给定阈值范围内随机选择一个子范围,对位于给定子范围内的像素,将其像素值设置为(255 - 原本像素值)。 |
|
以给定的概率对输入图像在垂直方向进行随机翻转。 |
|
|
以给定的概率对输入图像和边界框在垂直方向进行随机翻转。 |
基于给定的缩放和平移因子调整图像的尺寸大小。 |
|
对输入图像使用给定的 |
|
将输入图像调整为给定的尺寸大小并相应地调整边界框的大小。 |
|
将输入图像旋转指定的度数。 |
|
在水平和垂直方向上将Tensor切片为多个块。 |
|
|
使用Ascend系列芯片DVPP模块的模拟算法对JPEG图像进行裁剪、解码和缩放。 |
|
使用Ascend系列芯片DVPP模块的模拟算法对JPEG图像进行解码和缩放。 |
对输入图像执行随机选取的数据增强操作。 |
|
对输入图像进行垂直翻转。 |
mindspore.dataset.vision.py_transforms
最大化(标准化)输入PIL图像的对比度。 |
|
以输入PIL图像的中心为裁剪中心,裁剪指定尺寸大小的子图。 |
|
随机去除输入numpy.ndarray图像上一定数量的正方形区域,将区域内像素值置为0。 |
|
将输入原始图像字节解码为RGB格式PIL图像。 |
|
对输入PIL图像进行直方图均衡。 |
|
在输入PIL图像的中心与四个角处分别裁剪指定尺寸大小的子图。 |
|
将输入PIL图像转换为灰度图。 |
|
将输入的HSV格式numpy.ndarray图像转换为RGB格式。 |
|
将输入的numpy.ndarray图像的shape从(H, W, C)转换为(C, H, W)。 |
|
反转输入PIL图像的颜色。 |
|
使用指定的变换方阵和均值向量对输入numpy.ndarray图像进行线性变换。 |
|
随机混合一批输入的numpy.ndarray图像及其标签。 |
|
使用指定的均值和标准差,标准化shape为(C, H, W)的输入numpy.ndarray图像。 |
|
使用指定的均值和标准差,标准化shape为(C, H, W)的输入numpy.ndarray图像,并填充一个全零的额外通道。 |
|
对输入PIL图像的各边进行填充。 |
|
对输入PIL图像进行随机仿射变换。 |
|
随机调整输入PIL图像的色彩平衡。 |
|
随机调整输入PIL图像的亮度、对比度、饱和度和色调。 |
|
在输入PIL图像上的随机位置,裁剪指定尺寸大小的子图。 |
|
按照指定的概率擦除输入numpy.ndarray图像上随机矩形区域内的像素。 |
|
按照指定的概率将输入PIL图像转换为灰度图。 |
|
按照指定的概率随机水平翻转输入的PIL图像。 |
|
按照指定的概率对输入PIL图像进行透视变换。 |
|
在输入PIL图像上的随机位置裁剪子图,并放缩到指定尺寸大小。 |
|
将输入PIL图像旋转随机角度。 |
|
随机调整输入PIL图像的锐度。 |
|
按照指定的概率随机垂直翻转输入的PIL图像。 |
|
将输入PIL图像放缩为指定尺寸大小。 |
|
将输入的RGB格式numpy.ndarray图像转换为HSV格式。 |
|
在输入PIL图像的中心与四个角处分别裁剪指定尺寸大小的子图,并将其翻转图一并返回。 |
|
将已解码的numpy.ndarray图像转换为PIL图像。 |
|
将输入的PIL或numpy.ndarray图像转换为指定数据类型的numpy.ndarray图像,此时像素值取值将由[0, 255]变为[0.0, 1.0],图像的shape将由(H, W, C)变为(C, H, W)。 |
|
将输入的numpy.ndarray图像转换为指定数据类型。 |
|
从指定序列中均匀采样一批数据处理操作,并按顺序随机执行,即采样出的操作也可能不被执行。 |
mindspore.dataset.vision.utils
边界填充方式枚举类。 |
|
图像色彩空间转换模式枚举类。 |
|
图像批处理输出格式枚举类。 |
|
图像插值方式枚举类。 |
|
Tensor切片方式枚举类。 |