mindspore.dataset.audio
此模块用于音频数据增强,包括 transforms 和 utils 两个子模块。 transforms 是一个高性能音频数据增强模块,支持常见的音频数据增强操作。 utils 提供了一些音频处理的工具方法。
API样例中常用的导入模块如下:
import mindspore.dataset as ds
import mindspore.dataset.audio.transforms as audio
常用数据处理术语说明如下:
TensorOperation,所有C++实现的数据处理操作的基类。
AudioTensorOperation,所有音频数据处理操作的基类,派生自TensorOperation。
mindspore.dataset.audio.transforms
给音频波形施加双极点全通滤波器,其中心频率和带宽由入参指定。 |
|
将输入音频从振幅/功率标度转换为分贝标度。 |
|
计算复数序列的角度。 |
|
给音频波形施加双极点带通滤波器。 |
|
给音频波形施加双极点巴特沃斯(Butterworth)带通滤波器。 |
|
给音频波形施加双极点巴特沃斯(Butterworth)带阻滤波器。 |
|
给音频波形施加低音控制效果,即双极点低频搁架滤波器。 |
|
计算复数序列的范数。 |
|
给音频波形施加对比度增强效果。 |
|
给音频波形施加频域掩码。 |
|
给音频波形施加双极点低通滤波器。 |
|
给音频波形施加时域掩码。 |
|
以给定的比例拉伸音频短时傅里叶(Short Time Fourier Transform, STFT)频谱的时域,但不改变音频的音高。 |
mindspore.dataset.audio.utils
音频标度枚举类。 |