mindspore.dataset.text.AddToken

class mindspore.dataset.text.AddToken(token, begin=True)[源代码]

将分词(token)添加到序列的开头或结尾处。

参数：

token (str) - 待添加的分词(token)。
begin (bool, 可选) - 选择分词(token)插入的位置，若为 True 则在序列开头插入，否则在序列结尾插入。默认值： True 。

异常：

TypeError - 如果 token 的类型不为str。
TypeError - 如果 begin 的类型不为bool。

支持平台：

CPU

样例：

>>> dataset = ds.NumpySlicesDataset(data={"text": [['a', 'b', 'c', 'd', 'e']]})
>>> # Data before
>>> # |           text            |
>>> # +---------------------------+
>>> # | ['a', 'b', 'c', 'd', 'e'] |
>>> # +---------------------------+
>>> add_token_op = text.AddToken(token='TOKEN', begin=True)
>>> dataset = dataset.map(operations=add_token_op)
>>> # Data after
>>> # |           text            |
>>> # +---------------------------+
>>> # | ['TOKEN', 'a', 'b', 'c', 'd', 'e'] |
>>> # +---------------------------+