mindformers.models.ChatGLM2ForConditionalGeneration
- class mindformers.models.ChatGLM2ForConditionalGeneration(config: ChatGLM2Config, **kwargs)[源代码]
在线计算并提供执行ChatGLM2训练时的损失值和逻辑值。
- 参数:
config (ChatGLM2Config) - ChatGLM2模型的配置。
kwargs (dict, 可选) - 一个可变数量的关键字参数,为待扩展的关键字参数预留。
- 输入:
input_ids (Tensor, 可选) - 一个分词后的输入数据张量,它是32位整数类型,shape为: (batch, seq_length) 。默认值:
None
。labels (Tensor, 可选) - 一个分词后的标签数据张量,它是32位整数类型,shape为: (batch, seq_length) 。默认值:
None
。input_position (Tensor, 可选) - 当前位置,在推理使使用。默认值:
None
。position_ids (Tensor, 可选) - 保留参数,不使用。默认值:
None
。attention_mask (Tensor, 可选) - 保留参数,不使用。默认值:
None
。input_embeds (Tensor, 可选) - 保留参数,不使用。默认值:
None
。init_reset (bool, 可选) - shape为[1]的bool张量,用于清除增量推理中之前的键参数和值参数。默认值:
None
。batch_valid_length (Tensor, 可选) - 在增量推理中,用于上一步计算索引的张量。它是32位整数类型,shape为 [batch_size] 。默认值:
None
。prefix_key_values (Tensor, 可选) - 在正常的键值对之前添加的一组额外的键值对。这些前缀键值对可以用来捕获长期依赖关系或提供先验知识,从而帮助模型更好地理解和生成序列。默认值:
None
。block_tables (Tensor[int64], 可选) - 存储每个序列的映射表。默认值:
None
。slot_mapping (Tensor[int32], 可选) - 存储序列缓存的物理槽索引。默认值:
None
。batch_index (Tensor, 可选) - 保留参数,不使用。默认值:
None
。zactivate_len (Tensor, 可选) - 保留参数,不使用。默认值:
None
。input_mask (Tensor, 可选) - input_ids中输入部分的掩码。默认值:
None
。
- 输出:
outputs(Tensor),包括在线损失值或者逻辑值、预测文本序列、输入掩码。
样例:
>>> from mindformers.models.glm2 import ChatGLM2Config, ChatGLM2ForConditionalGeneration >>> config = ChatGLM2Config(batch_size=2) >>> network = ChatGLM2ForConditionalGeneration(config=config) >>> type(network) <class 'mindformers.models.glm2.glm2.ChatGLM2ForConditionalGeneration'> >>> from mindformers import ChatGLM2ForConditionalGeneration >>> network = ChatGLM2ForConditionalGeneration.from_pretrained('glm3_6b') >>> type(network) <class 'mindformers.models.glm2.glm2.ChatGLM2ForConditionalGeneration'>