MindSpore Serving 文档 ========================= MindSpore Serving是一个轻量级、高性能的服务模块,旨在帮助昇思MindSpore开发者在生产环境中高效部署在线推理服务。当用户使用昇思MindSpore完成模型训练后,导出MindSpore模型,即可使用MindSpore Serving创建该模型的推理服务。 MindSpore Serving包含以下功能: - 支持自定义关于模型的预处理和后处理,简化模型的发布和部署。 - 支持batch功能,包含多个实例的请求会被拆分组合以满足模型batch size的需要。 - 支持分布式模型推理功能。 - 支持客户端gRPC接口,提供简单易用的客户端Python封装接口。 - 支持客户端RESTful接口。 .. raw:: html 使用MindSpore Serving的典型场景 -------------------------------- 1. `快速入门 `_ 以一个简单的Add网络为例,演示如何使用MindSpore Serving部署推理服务。 2. `使用gRPC接口访问服务 `_ 高性能、简单方便地访问服务。 3. `使用RESTful接口访问服务 `_ 基于HTTP协议访问服务。 .. toctree:: :glob: :maxdepth: 1 :caption: 安装部署 serving_install .. toctree:: :glob: :maxdepth: 1 :caption: 使用指南 serving_example serving_distributed_example serving_grpc serving_restful serving_model serving_multi_subgraphs .. toctree:: :maxdepth: 1 :caption: API参考 server client .. toctree:: :maxdepth: 1 :caption: 参考文档 faq .. toctree:: :glob: :maxdepth: 1 :caption: RELEASE NOTES RELEASE