mindspore_lite
Python接口仅支持云侧推理。
运行环境
Context 类用于在执行期间传递环境变量。 |
转换
当Converter时, FmkType 定义输入模型的框架类型。 |
|
构造 Converter 的类。 |
模型
Model 类定义MindSpore Lite模型,便于计算图管理。 |
|
ModelGroup 类定义MindSpore Lite模型分组信息,用于共享工作空间(Workspace)内存或者权重(包括常量和变量)内存以及二者同时共享。 |
|
ModelGroupFlag 类用于构造 ModelGroup 的标签。 |
|
ModelParallelRunner 类定义了MindSpore Lite的Runner,它支持模型并行。 |
|
ModelType 类定义MindSpore Lite中导出或导入的模型类型。 |
张量
DataType 类定义MindSpore Lite中Tensor的数据类型。 |
|
Format 类定义MindSpore Lite中Tensor的格式。 |
|
Tensor 类,在Mindspore Lite中定义一个张量。 |
|
TensorMeta 类,定义一个MindSpore Lite张量的属性信息。 |
大语言模型引擎
LLMEngine的请求类,用于表示多轮推理任务。 |
|
LLMEngine的状态类,用于表示推理任务状态。 |
|
LLMEngine的角色。 |
|
LLMEngine 类定义了一个MindSpore Lite的LLMEngine,用于加载和管理大语言模型,以及响应调度和推理请求。 |
|
LLMEngine的错误码。 |
|
LLMEngine的错误类型基类。 |
Lite推理
LiteInfer 类接受训练模型作为输入直接执行推理。 |