mindspore.dataset.audio.melscale_fbanks
- mindspore.dataset.audio.melscale_fbanks(n_freqs, f_min, f_max, n_mels, sample_rate, norm=NormType.NONE, mel_type=MelType.HTK)[源代码]
创建频率变换矩阵。
- 参数:
n_freqs (int) - 要加强或应用的频率数。
f_min (float) - 最小频率,单位为Hz。
f_max (float) - 最大频率,单位为Hz。
n_mels (int) - 梅尔滤波器组数。
sample_rate (int) - 音频波形的采样频率。
norm (NormType, 可选) - 标准化方法,可以是NormType.NONE或NormType.SLANEY。默认值:NormType.NONE。
mel_type (MelType, 可选) - 使用的标度,可以是MelType.HTK或MelType.SLANEY。默认值:MelType.HTK。
- 返回:
numpy.ndarray,频率变换矩阵,shape为( n_freqs , n_mels )。
样例:
>>> from mindspore.dataset.audio import melscale_fbanks >>> >>> fbanks = melscale_fbanks(n_freqs=4096, f_min=0, f_max=8000, n_mels=40, sample_rate=16000)