mindformers.models.ChatGLM2ForConditionalGeneration

查看源文件
class mindformers.models.ChatGLM2ForConditionalGeneration(config: ChatGLM2Config, **kwargs)[源代码]

在线计算并提供执行ChatGLM2训练时的损失值和逻辑值。

参数:
  • config (ChatGLM2Config) - ChatGLM2模型的配置。

  • kwargs (dict, 可选) - 一个可变数量的关键字参数,为待扩展的关键字参数预留。

输入:
  • input_ids (Tensor, 可选) - 一个分词后的输入数据张量,它是32位整数类型,shape为: (batch, seq_length) 。默认值: None

  • labels (Tensor, 可选) - 一个分词后的标签数据张量,它是32位整数类型,shape为: (batch, seq_length) 。默认值: None

  • input_position (Tensor, 可选) - 当前位置,在推理使使用。默认值: None

  • position_ids (Tensor, 可选) - 保留参数,不使用。默认值: None

  • attention_mask (Tensor, 可选) - 保留参数,不使用。默认值: None

  • input_embeds (Tensor, 可选) - 保留参数,不使用。默认值: None

  • init_reset (bool, 可选) - shape为[1]的bool张量,用于清除增量推理中之前的键参数和值参数。默认值: None

  • batch_valid_length (Tensor, 可选) - 在增量推理中,用于上一步计算索引的张量。它是32位整数类型,shape为 [batch_size] 。默认值: None

  • prefix_key_values (Tensor, 可选) - 在正常的键值对之前添加的一组额外的键值对。这些前缀键值对可以用来捕获长期依赖关系或提供先验知识,从而帮助模型更好地理解和生成序列。默认值: None

  • block_tables (Tensor[int64], 可选) - 存储每个序列的映射表。默认值: None

  • slot_mapping (Tensor[int32], 可选) - 存储序列缓存的物理槽索引。默认值: None

  • batch_index (Tensor, 可选) - 保留参数,不使用。默认值: None

  • zactivate_len (Tensor, 可选) - 保留参数,不使用。默认值: None

  • input_mask (Tensor, 可选) - input_ids中输入部分的掩码。默认值: None

输出:

outputs(Tensor),包括在线损失值或者逻辑值、预测文本序列、输入掩码。

样例:

>>> from mindformers.models.glm2 import ChatGLM2Config, ChatGLM2ForConditionalGeneration
>>> config = ChatGLM2Config(batch_size=2)
>>> network = ChatGLM2ForConditionalGeneration(config=config)
>>> type(network)
<class 'mindformers.models.glm2.glm2.ChatGLM2ForConditionalGeneration'>
>>> from mindformers import ChatGLM2ForConditionalGeneration
>>> network = ChatGLM2ForConditionalGeneration.from_pretrained('glm3_6b')
>>> type(network)
<class 'mindformers.models.glm2.glm2.ChatGLM2ForConditionalGeneration'>