mindspore.dataset.text.CaseFold

class mindspore.dataset.text.CaseFold[源代码]

将UTF-8编码字符串中的字符规范化为小写,相比 str.lower 支持更多字符。

支持的输入规范化形式详见 ICU_Normalizer2

说明

Windows平台尚不支持 CaseFold

支持平台:

CPU

样例:

>>> import mindspore.dataset as ds
>>> import mindspore.dataset.text as text
>>> case_op = text.CaseFold()
>>> text_file_list = ["/path/to/text_file_dataset_file"]
>>> text_file_dataset = ds.TextFileDataset(dataset_files=text_file_list)
>>> text_file_dataset = text_file_dataset.map(operations=case_op)
教程样例: