mindspore.dataset.text.GloVe

查看源文件
class mindspore.dataset.text.GloVe[源代码]

Global Vectors(GloVe)预训练词向量。

GloVe 是一种无监督学习算法,用于获取词的向量表示。

classmethod from_file(file_path, max_vectors=None)[源代码]

加载 GloVe 预训练向量集文件。

参数:
  • file_path (str) - GloVe 预训练向量集文件路径。文件名类似 glove.*.txt

  • max_vectors (int,可选) - 加载预训练向量的数量上限。 大多数预训练向量集是按词频降序排列的。因此,如果内存不足以存放整个向量集,或者出于其他原因, 可以通过该值限制加载的向量数量。默认值: None ,没有上限。

返回:

GloVe,GloVe 预训练词向量。

异常:
  • TypeError - 当 file_path 不为str类型。

  • RuntimeError - 当 file_path 文件路径不存在或没有访问权限。

  • TypeError - 当 max_vectors 不为int类型。

  • ValueError - 当 max_vectors 为负数。

样例:

>>> import mindspore.dataset.text as text
>>> glove = text.GloVe.from_file("/path/to/glove/file", max_vectors=None)
>>> to_vectors = text.ToVectors(glove)
>>> # Look up a token into vectors according GloVe model.
>>> word_vector = to_vectors(["word1", "word2"])