mindspore.dataset.audio.melscale_fbanks

mindspore.dataset.audio.melscale_fbanks(n_freqs, f_min, f_max, n_mels, sample_rate, norm=NormType.NONE, mel_type=MelType.HTK)[源代码]

创建频率变换矩阵。

参数:
  • n_freqs (int) - 要加强或应用的频率数。

  • f_min (float) - 最小频率,单位为Hz。

  • f_max (float) - 最大频率,单位为Hz。

  • n_mels (int) - 梅尔滤波器组数。

  • sample_rate (int) - 音频波形的采样频率。

  • norm (NormType, 可选) - 标准化方法,可以是NormType.NONE或NormType.SLANEY。默认值:NormType.NONE。

  • mel_type (MelType, 可选) - 使用的标度,可以是MelType.HTK或MelType.SLANEY。默认值:MelType.HTK。

返回:

numpy.ndarray,频率变换矩阵,shape为( n_freqs , n_mels )。

样例:

>>> from mindspore.dataset.audio import melscale_fbanks
>>>
>>> fbanks = melscale_fbanks(n_freqs=4096, f_min=0, f_max=8000, n_mels=40, sample_rate=16000)