mindspore.dataset.audio.MaskAlongAxis
- class mindspore.dataset.audio.MaskAlongAxis(mask_start, mask_width, mask_value, axis)[源代码]
对音频波形应用掩码。掩码的起始和长度由 [mask_start, mask_start + mask_width) 决定。
- 参数:
mask_start (int) - 掩码的起始位置,必须是非负的。
mask_width (int) - 掩码的宽度,必须是大于0。
mask_value (float) - 填充到掩码区间的值。
axis (int) - 要应用掩码的轴(
1
表示频率,2
表示时间)。
- 异常:
ValueError - mask_start 参数值错误(小于0)。
ValueError - mask_width 参数值错误(小于1)。
ValueError - axis 参数类型错误或者值错误,不属于 [1, 2]。
- 支持平台:
CPU
样例:
>>> import numpy as np >>> import mindspore.dataset as ds >>> import mindspore.dataset.audio as audio >>> >>> # Use the transform in dataset pipeline mode >>> waveform = np.random.random([5, 20, 20]) # 5 samples >>> numpy_slices_dataset = ds.NumpySlicesDataset(data=waveform, column_names=["audio"]) >>> transforms = [audio.MaskAlongAxis(0, 10, 0.5, 1)] >>> numpy_slices_dataset = numpy_slices_dataset.map(operations=transforms, input_columns=["audio"]) >>> for item in numpy_slices_dataset.create_dict_iterator(num_epochs=1, output_numpy=True): ... print(item["audio"].shape, item["audio"].dtype) ... break (20, 20) float64 >>> >>> # Use the transform in eager mode >>> waveform = np.random.random([20, 20]) # 1 sample >>> output = audio.MaskAlongAxis(0, 10, 0.5, 1)(waveform) >>> print(output.shape, output.dtype) (20, 20) float64
- 教程样例: