mindspore.dataset.text.to_bytes
- mindspore.dataset.text.to_bytes(array, encoding='utf8')[源代码]
基于 encoding 字符集对每个元素进行编码,将 string 的NumPy数组转换为 bytes 的数组。
参数:
array (numpy.ndarray) - 表示 string 类型的数组,代表字符串。
encoding (str) - 表示用于编码的字符集,默认值:’utf8’。
返回:
numpy.ndarray,表示 bytes 的NumPy数组。
样例:
>>> text_file_dataset_dir = ["/path/to/text_file_dataset_file"] >>> dataset = ds.TextFileDataset(dataset_files=text_file_dataset_dir, shuffle=False) >>> for item in dataset.create_dict_iterator(num_epochs=1, output_numpy=True): ... data = text.to_str(item["text"]) ... byte_encoded_data = text.to_bytes(data)