实现一个图像分类应用

查看源文件

概述

我们推荐你从端侧Android图像分类demo入手,了解MindSpore Lite应用工程的构建、依赖项配置以及相关API的使用。

本教程基于MindSpore团队提供的Android“端侧图像分类”示例程序,演示了端侧部署的流程。

  1. 选择图像分类模型。

  2. 将模型转换成MindSpore Lite模型格式。

  3. 在端侧使用MindSpore Lite推理模型。详细说明如何在端侧利用MindSpore Lite C++ API(Android JNI)和MindSpore Lite图像分类模型完成端侧推理,实现对设备摄像头捕获的内容进行分类,并在APP图像预览界面中,显示出最可能的分类结果。

你可以在这里找到Android图像分类模型示例代码

选择模型

MindSpore团队提供了一系列预置终端模型,你可以在应用程序中使用这些预置的终端模型。
MindSpore Model Zoo中图像分类模型可在此下载。 同时,你也可以使用预置模型做迁移学习,以实现自己的图像分类任务。

转换模型

如果预置模型已经满足你要求,请跳过本章节。 如果你需要对MindSpore提供的模型进行重训,重训完成后,需要将模型导出为.mindir格式。然后使用MindSpore Lite模型转换工具将.mindir模型转换成.ms格式。

以mobilenetv2模型为例,如下脚本将其转换为MindSpore Lite模型用于端侧推理。

./converter_lite --fmk=MINDIR --modelFile=mobilenetv2.mindir --outputFile=mobilenetv2.ms

部署应用

接下来介绍如何构建和执行mindspore Lite端侧图像分类任务。

运行依赖

  • Android Studio >= 3.2 (推荐4.0以上版本)

  • NDK 21.3

  • CMake 3.10.2

  • Android SDK >= 26

  • JDK >= 1.8

构建与运行

  1. 在Android Studio中加载本示例源码,并安装相应的SDK(指定SDK版本后,由Android Studio自动安装)。

    start_home

    启动Android Studio后,点击File->Settings->System Settings->Android SDK,勾选相应的SDK。如下图所示,勾选后,点击OK,Android Studio即可自动安装SDK。

    start_sdk

    (可选)若安装时出现NDK版本问题,可手动下载相应的NDK版本(本示例代码使用的NDK版本为21.3),并在Project StructureAndroid NDK location设置中指定NDK的位置。

    project_structure

  2. 连接Android设备,运行图像分类应用程序。

    通过USB连接Android设备调试,点击Run 'app'即可在你的设备上运行本示例项目。

    run_app

    Android Studio连接设备调试操作,可参考https://developer.android.com/studio/run/device?hl=zh-cn

    手机需开启“USB调试模式”,Android Studio才能识别到手机。 华为手机一般在设置->系统和更新->开发人员选项->USB调试中打开“USB调试模式”。

  3. 在Android设备上,点击“继续安装”,安装完即可查看到设备摄像头捕获的内容和推理结果。

    install

    识别结果如下图所示。

    result

示例程序详细说明

本端侧图像分类Android示例程序分为JAVA层和JNI层,其中,JAVA层主要通过Android Camera 2 API实现摄像头获取图像帧,以及相应的图像处理等功能;JNI层在Runtime中完成模型推理的过程。

此处详细说明示例程序的JNI层实现,JAVA层运用Android Camera 2 API实现开启设备摄像头以及图像帧处理等功能,需读者具备一定的Android开发基础知识。

示例程序结构

app
├── src/main
│   ├── assets # 资源文件
|   |   └── mobilenetv2.ms # 存放模型文件
│   |
│   ├── cpp # 模型加载和预测主要逻辑封装类
|   |   ├── ..
|   |   ├── mindspore-lite-1.0.0-minddata-arm64-cpu # MindSpore Lite版本
|   |   ├── MindSporeNetnative.cpp # MindSpore调用相关的JNI方法
│   |   └── MindSporeNetnative.h # 头文件
|   |   └── MsNetWork.cpp # MindSpore接口封装
│   |
│   ├── java # java层应用代码
│   │   └── com.mindspore.himindsporedemo
│   │       ├── gallery.classify # 图像处理及MindSpore JNI调用相关实现
│   │       │   └── ...
│   │       └── widget # 开启摄像头及绘制相关实现
│   │           └── ...
│   │   
│   ├── res # 存放Android相关的资源文件
│   └── AndroidManifest.xml # Android配置文件
│
├── CMakeList.txt # cmake编译入口文件
│
├── build.gradle # 其他Android配置文件
├── download.gradle # 工程依赖文件下载
└── ...

配置MindSpore Lite依赖项

Android JNI层调用MindSpore C++ API时,需要相关库文件支持。可通过MindSpore Lite源码编译生成mindspore-lite-{version}-minddata-{os}-{device}.tar.gz库文件包并解压缩(包含libmindspore-lite.so库文件和相关头文件),在本例中需使用生成带图像预处理模块的编译命令。

version:输出件版本号,与所编译的分支代码对应的版本一致。

device:当前分为cpu(内置CPU算子)和gpu(内置CPU和GPU算子)。

os:输出件应部署的操作系统。

本示例中,build过程由app/download.gradle文件自动下载MindSpore Lite版本文件,并放置在app/src/main/cpp/目录下。

注: 若自动下载失败,请手动下载相关库文件,解压后将其放在对应位置:

mindspore-lite-1.0.0-minddata-arm64-cpu.tar.gz 下载链接

android{
    defaultConfig{
        externalNativeBuild{
            cmake{
                arguments "-DANDROID_STL=c++_shared"
            }
        }

        ndk{ 
            abiFilters'armeabi-v7a', 'arm64-v8a'  
        }
    }
}

app/CMakeLists.txt文件中建立.so库文件链接,如下所示。

# ============== Set MindSpore Dependencies. =============
include_directories(${CMAKE_SOURCE_DIR}/src/main/cpp)
include_directories(${CMAKE_SOURCE_DIR}/src/main/cpp/${MINDSPORELITE_VERSION}/third_party/flatbuffers/include)
include_directories(${CMAKE_SOURCE_DIR}/src/main/cpp/${MINDSPORELITE_VERSION})
include_directories(${CMAKE_SOURCE_DIR}/src/main/cpp/${MINDSPORELITE_VERSION}/include)
include_directories(${CMAKE_SOURCE_DIR}/src/main/cpp/${MINDSPORELITE_VERSION}/include/ir/dtype)
include_directories(${CMAKE_SOURCE_DIR}/src/main/cpp/${MINDSPORELITE_VERSION}/include/schema)

add_library(mindspore-lite SHARED IMPORTED )
add_library(minddata-lite SHARED IMPORTED )

set_target_properties(mindspore-lite PROPERTIES IMPORTED_LOCATION
        ${CMAKE_SOURCE_DIR}/src/main/cpp/${MINDSPORELITE_VERSION}/lib/libmindspore-lite.so)
set_target_properties(minddata-lite PROPERTIES IMPORTED_LOCATION
        ${CMAKE_SOURCE_DIR}/src/main/cpp/${MINDSPORELITE_VERSION}/lib/libminddata-lite.so)
# --------------- MindSpore Lite set End. --------------------

# Link target library.       
target_link_libraries(
    ...
     # --- mindspore ---
        minddata-lite
        mindspore-lite
    ...
)

下载及部署模型文件

从MindSpore Model Hub中下载模型文件,本示例程序中使用的终端图像分类模型文件为mobilenetv2.ms,同样通过app/download.gradle脚本在APP构建时自动下载,并放置在app/src/main/assets工程目录下。

注:若下载失败请手工下载模型文件,mobilenetv2.ms 下载链接

编写端侧推理代码

在JNI层调用MindSpore Lite C++ API实现端测推理。

推理代码流程如下,完整代码请参见src/cpp/MindSporeNetnative.cpp

  1. 加载MindSpore Lite模型文件,构建上下文、会话以及用于推理的计算图。

    • 加载模型文件:创建并配置用于模型推理的上下文

      // Buffer is the model data passed in by the Java layer
      jlong bufferLen = env->GetDirectBufferCapacity(buffer);
      char *modelBuffer = CreateLocalModelBuffer(env, buffer);  
      
    • 创建会话

      void **labelEnv = new void *;
      MSNetWork *labelNet = new MSNetWork;
      *labelEnv = labelNet;
      
      // Create context.
      mindspore::lite::Context *context = new mindspore::lite::Context;
      context->thread_num_ = num_thread;
      
      // Create the mindspore session.
      labelNet->CreateSessionMS(modelBuffer, bufferLen, context);
      delete (context);
      
    • 加载模型文件并构建用于推理的计算图

      void MSNetWork::CreateSessionMS(char* modelBuffer, size_t bufferLen, std::string name, mindspore::lite::Context* ctx)
      {
          CreateSession(modelBuffer, bufferLen, ctx);  
          session = mindspore::session::LiteSession::CreateSession(ctx);
          auto model = mindspore::lite::Model::Import(modelBuffer, bufferLen);
          int ret = session->CompileGraph(model);
      }
      
  2. 将输入图片转换为传入MindSpore模型的Tensor格式。

    将待检测图片数据转换为输入MindSpore模型的Tensor。

    // Convert the Bitmap image passed in from the JAVA layer to Mat for OpenCV processing
     BitmapToMat(env, srcBitmap, matImageSrc);
    // Processing such as zooming the picture size.
    matImgPreprocessed = PreProcessImageData(matImageSrc);  
    
    ImgDims inputDims; 
    inputDims.channel = matImgPreprocessed.channels();
    inputDims.width = matImgPreprocessed.cols;
    inputDims.height = matImgPreprocessed.rows;
    float *dataHWC = new float[inputDims.channel * inputDims.width * inputDims.height]
    
    // Copy the image data to be detected to the dataHWC array.
    // The dataHWC[image_size] array here is the intermediate variable of the input MindSpore model tensor.
    float *ptrTmp = reinterpret_cast<float *>(matImgPreprocessed.data);
    for(int i = 0; i < inputDims.channel * inputDims.width * inputDims.height; i++){
       dataHWC[i] = ptrTmp[i];
    }
    
    // Assign dataHWC[image_size] to the input tensor variable.
    auto msInputs = mSession->GetInputs();
    auto inTensor = msInputs.front();
    memcpy(inTensor->MutableData(), dataHWC,
        inputDims.channel * inputDims.width * inputDims.height * sizeof(float));
    delete[] (dataHWC);
    
  3. 对输入数据进行处理。

    bool PreProcessImageData(const LiteMat &lite_mat_bgr, LiteMat *lite_norm_mat_ptr) {
      bool ret = false;
      LiteMat lite_mat_resize;
      LiteMat &lite_norm_mat_cut = *lite_norm_mat_ptr;
      ret = ResizeBilinear(lite_mat_bgr, lite_mat_resize, 256, 256);
      if (!ret) {
        MS_PRINT("ResizeBilinear error");
        return false;
      }
      LiteMat lite_mat_convert_float;
      ret = ConvertTo(lite_mat_resize, lite_mat_convert_float, 1.0 / 255.0);
      if (!ret) {
        MS_PRINT("ConvertTo error");
        return false;
      }
      LiteMat lite_mat_cut;
      ret = Crop(lite_mat_convert_float, lite_mat_cut, 16, 16, 224, 224);
      if (!ret) {
        MS_PRINT("Crop error");
        return false;
      }
      float means[3] = {0.485, 0.456, 0.406};
      float vars[3] = {1.0 / 0.229, 1.0 / 0.224, 1.0 / 0.225};
      SubStractMeanNormalize(lite_mat_cut, lite_norm_mat_cut, means, vars);
      return true;
    }
    
  4. 对输入Tensor按照模型进行推理,获取输出Tensor,并进行后处理。

    • 图执行,端测推理。

      // After the model and image tensor data is loaded, run inference.
      auto status = mSession->RunGraph();
      
    • 获取输出数据。

      auto names = mSession->GetOutputTensorNames();
      std::unordered_map<std::string, mindspore::tensor::MSTensor *> msOutputs;
      for (const auto &name : names) {
          auto temp_dat =mSession->GetOutputByTensorName(name);
          msOutputs.insert(std::pair<std::string, mindspore::tensor::MSTensor *> {name, temp_dat});
        }
      std::string retStr = ProcessRunnetResult(msOutputs, ret);
      
    • 输出数据的后续处理。

      std::string ProcessRunnetResult(std::unordered_map<std::string,
              mindspore::tensor::MSTensor *> msOutputs, int runnetRet) {
      
        std::unordered_map<std::string, mindspore::tensor::MSTensor *>::iterator iter;
        iter = msOutputs.begin();
      
        // The mobilenetv2.ms model output just one branch.
        auto outputTensor = iter->second;
        int tensorNum = outputTensor->ElementsNum();
      
        // Get a pointer to the first score.
        float *temp_scores = static_cast<float *>(outputTensor->MutableData());
      
        float scores[RET_CATEGORY_SUM];
        for (int i = 0; i < RET_CATEGORY_SUM; ++i) {
           if (temp_scores[i] > 0.5) {
            MS_PRINT("MindSpore scores[%d] : [%f]", i, temp_scores[i]);
           }
          scores[i] = temp_scores[i];
        }
      
        // Score for each category.
        // Converted to text information that needs to be displayed in the APP.
        std::string categoryScore = "";
        for (int i = 0; i < RET_CATEGORY_SUM; ++i) {
          categoryScore += labels_name_map[i];
          categoryScore += ":";
          std::string score_str = std::to_string(scores[i]);
          categoryScore += score_str;
          categoryScore += ";";
        }
        return categoryScore;
      }