mindspore.dataset.audio.Vol
- class mindspore.dataset.audio.Vol(gain, gain_type=GainType.AMPLITUDE)[源代码]
调整波形的音量。
- 参数:
gain (float) - 提升(或衰减)的增益。 如果 gain_type 为
GainType.AMPLITUDE
,应为一个非负的幅度比。 如果 gain_type 为GainType.POWER
,应为一个功率(电压的平方)。 如果 gain_type 为GainType.DB
,应以分贝为单位。gain_type (
GainType
, 可选) - 增益的类型,可为GainType.AMPLITUDE
、GainType.POWER
或GainType.DB
。默认值:GainType.AMPLITUDE
。
- 异常:
TypeError - 当 gain 的类型不为float。
TypeError - 当 gain_type 的类型不为
mindspore.dataset.audio.GainType
。ValueError - 当 gain_type 为
GainType.AMPLITUDE
时,gain 为负数。ValueError - 当 gain_type 为
GainType.POWER
时,gain 不为正数。RuntimeError - 当输入音频的shape不为<…, time>。
- 支持平台:
CPU
样例:
>>> import numpy as np >>> import mindspore.dataset as ds >>> import mindspore.dataset.audio as audio >>> >>> # Use the transform in dataset pipeline mode >>> waveform = np.random.random([5, 30]) # 5 sample >>> numpy_slices_dataset = ds.NumpySlicesDataset(data=waveform, column_names=["audio"]) >>> transforms = [audio.Vol(gain=10, gain_type=audio.GainType.DB)] >>> numpy_slices_dataset = numpy_slices_dataset.map(operations=transforms, input_columns=["audio"]) >>> for item in numpy_slices_dataset.create_dict_iterator(num_epochs=1, output_numpy=True): ... print(item["audio"].shape, item["audio"].dtype) ... break (30,) float64 >>> >>> # Use the transform in eager mode >>> waveform = np.random.random([30]) # 1 sample >>> output = audio.Vol(gain=10, gain_type=audio.GainType.DB)(waveform) >>> print(output.shape, output.dtype) (30,) float64
- 教程样例: