mindspore.dataset.text.to_str

mindspore.dataset.text.to_str(array, encoding='utf8')[源代码]

基于 encoding 字符集对每个元素进行解码,借此将 bytes 的NumPy数组转换为 string 的数组。

参数:

  • array (numpy.ndarray) - 表示 bytes 类型的数组,代表字符串。

  • encoding (str) - 表示用于解码的字符集,默认值:’utf8’。

返回:

numpy.ndarray,表示 str 的NumPy数组。

样例:

>>> text_file_dataset_dir = ["/path/to/text_file_dataset_file"]
>>> dataset = ds.TextFileDataset(dataset_files=text_file_dataset_dir, shuffle=False)
>>> for item in dataset.create_dict_iterator(num_epochs=1, output_numpy=True):
...     data = text.to_str(item["text"])