mindspore.dataset.text.Truncate
- class mindspore.dataset.text.Truncate(max_seq_len)[源代码]
截断输入序列,使其不超过最大长度。
- 参数:
max_seq_len (int) - 最大截断长度。
- 异常:
TypeError - 如果 max_seq_len 的类型不是int。
ValueError - 如果 max_seq_len 的值小于或等于0。
RuntimeError - 如果输入张量的数据类型不是bool、int、float、double或者str。
- 支持平台:
CPU
样例:
>>> dataset = ds.NumpySlicesDataset(data=[['a', 'b', 'c', 'd', 'e']], column_names=["text"], shuffle=False) >>> # Data before >>> # | col1 | >>> # +---------------------------+ >>> # | ['a', 'b', 'c', 'd', 'e'] | >>> # +---------------------------+ >>> truncate = text.Truncate(4) >>> dataset = dataset.map(operations=truncate, input_columns=["text"]) >>> # Data after >>> # | col1 | >>> # +------------------------+ >>> # | ['a', 'b', 'c', 'd'] | >>> # +------------------------+