mindspore.dataset.text.Truncate

class mindspore.dataset.text.Truncate(max_seq_len)[源代码]

截断输入序列,使其不超过最大长度。

参数:
  • max_seq_len (int) - 最大截断长度。

异常:
  • TypeError - 如果 max_seq_len 的类型不是int。

  • ValueError - 如果 max_seq_len 的值小于或等于0。

  • RuntimeError - 如果输入张量的数据类型不是bool、int、float、double或者str。

支持平台:

CPU

样例:

>>> dataset = ds.NumpySlicesDataset(data=[['a', 'b', 'c', 'd', 'e']], column_names=["text"], shuffle=False)
>>> # Data before
>>> # |           col1            |
>>> # +---------------------------+
>>> # | ['a', 'b', 'c', 'd', 'e'] |
>>> # +---------------------------+
>>> truncate = text.Truncate(4)
>>> dataset = dataset.map(operations=truncate, input_columns=["text"])
>>> # Data after
>>> # |          col1          |
>>> # +------------------------+
>>> # |  ['a', 'b', 'c', 'd']  |
>>> # +------------------------+