mindspore.dataset.text.FastText

class mindspore.dataset.text.FastText[源代码]

用于将tokens映射到向量的FastText对象。

from_file(file_path, max_vectors=None)[源代码]

从文件构建FastText向量。

参数：

file_path (str) - 包含向量的文件路径。预训练向量集的文件后缀必须是 *.vec 。
max_vectors (int，可选) - 用于限制加载的预训练向量的数量。大多数预训练的向量集是按词频降序排序的。因此，如果内存不能存放整个向量集，或者由于其他原因不需要，可以传递 max_vectors 限制加载数量。默认值：None，无限制。

返回：

FastText，根据文件构建的FastText向量。

异常：

样例：

>>> import mindspore.dataset.text as text
>>> fast_text = text.FastText.from_file("/path/to/fast_text/file", max_vectors=None)