mindspore.dataset.text.TruncateSequencePair

class mindspore.dataset.text.TruncateSequencePair(max_length)[源代码]

截断一对 1-D 字符串的内容,使其总长度小于给定长度。

TruncateSequencePair接收两个Tensor作为输入并返回两个Tensor作为输出。

参数:

  • max_length (int) - 最大截断长度。

异常:

  • TypeError - 参数 max_length 的类型不是int。

支持平台:

CPU

样例:

>>> dataset = ds.NumpySlicesDataset(data={"col1": [[1, 2, 3]], "col2": [[4, 5]]})
>>> # Data before
>>> # |   col1    |   col2    |
>>> # +-----------+-----------|
>>> # | [1, 2, 3] |  [4, 5]   |
>>> # +-----------+-----------+
>>> truncate_sequence_pair_op = text.TruncateSequencePair(max_length=4)
>>> dataset = dataset.map(operations=truncate_sequence_pair_op)
>>> # Data after
>>> # |   col1    |   col2    |
>>> # +-----------+-----------+
>>> # |  [1, 2]   |  [4, 5]   |
>>> # +-----------+-----------+