mindformers.pipeline.MultiModalToTextPipeline
- class mindformers.pipeline.MultiModalToTextPipeline(model: Union[PreTrainedModel, Model], processor: Optional[BaseXModalToTextProcessor] = None, **kwargs)
多模态文本生成的推理流程。
- 参数:
model (Union[PretrainedModel, Model]) - 执行任务的模型。必须是继承自 PretrainedModel 类的模型实例。
processor (BaseXModalToTextProcessor, 可选) - 模型的图片处理器。默认值:
None
。
- 返回:
一个 MultiModalToTextPipeline 实例。
- 异常:
TypeError - 如果输入模型和图片处理流程的类型设置错误。
ValueError - 如果输入模型不在支持列表中。