mindspore.dataset.audio

此模块用于音频数据增强,包括 transformsutils 两个子模块。 transforms 是一个高性能音频数据增强模块,支持常见的音频数据增强操作。 utils 提供了一些音频处理的工具方法。

API样例中常用的导入模块如下:

import mindspore.dataset as ds
import mindspore.dataset.audio.transforms as audio

常用数据处理术语说明如下:

  • TensorOperation,所有C++实现的数据处理操作的基类。

  • AudioTensorOperation,所有音频数据处理操作的基类,派生自TensorOperation。

mindspore.dataset.audio.transforms

mindspore.dataset.audio.transforms.AllpassBiquad

给音频波形施加双极点全通滤波器,其中心频率和带宽由入参指定。

mindspore.dataset.audio.transforms.AmplitudeToDB

将输入音频从振幅/功率标度转换为分贝标度。

mindspore.dataset.audio.transforms.Angle

计算复数序列的角度。

mindspore.dataset.audio.transforms.BandBiquad

给音频波形施加双极点带通滤波器。

mindspore.dataset.audio.transforms.BandpassBiquad

给音频波形施加双极点巴特沃斯(Butterworth)带通滤波器。

mindspore.dataset.audio.transforms.BandrejectBiquad

给音频波形施加双极点巴特沃斯(Butterworth)带阻滤波器。

mindspore.dataset.audio.transforms.BassBiquad

给音频波形施加低音控制效果,即双极点低频搁架滤波器。

mindspore.dataset.audio.transforms.ComplexNorm

计算复数序列的范数。

mindspore.dataset.audio.transforms.Contrast

给音频波形施加对比度增强效果。

mindspore.dataset.audio.transforms.FrequencyMasking

给音频波形施加频域掩码。

mindspore.dataset.audio.transforms.LowpassBiquad

给音频波形施加双极点低通滤波器。

mindspore.dataset.audio.transforms.TimeMasking

给音频波形施加时域掩码。

mindspore.dataset.audio.transforms.TimeStretch

以给定的比例拉伸音频短时傅里叶(Short Time Fourier Transform, STFT)频谱的时域,但不改变音频的音高。

mindspore.dataset.audio.utils

mindspore.dataset.audio.utils.ScaleType

音频标度枚举类。