实现一个图像分割应用(Java)

Android Java 全流程 模型转换 模型加载 推理应用 数据准备 初级 中级 高级

概述

我们推荐你从端侧Android图像分割demo入手,了解MindSpore Lite应用工程的构建、依赖项配置以及相关Java API的使用。

本教程基于MindSpore团队提供的Android“端侧图像分割”示例程序,演示了端侧部署的流程。

选择模型

选择图像分割模型。

你可以在这里找到Android图像分割模型

本示例中讲述了Java API的应用方法。

我们提供了本示例对应的APK文件,你可扫描下方的二维码或直接下载APK文件,并部署到Android设备后使用。

apk

部署应用

接下来介绍如何构建和执行MindSpore Lite端侧图像分割任务。

运行依赖

  • Android Studio >= 3.2 (推荐4.0以上版本)

  • Android SDK >= 26 (Android Studio默认安装)

  • JDK >= 1.8 (Android Studio默认安装)

构建与运行

  1. 在Android Studio中加载本示例源码,并安装相应的SDK(指定SDK版本后,由Android Studio自动安装)。

    start_home

  2. 连接Android设备,运行图像分割应用程序。

    通过USB连接Android设备调试,点击Run 'app'即可在你的设备上运行本示例项目。

    run_app

    Android Studio连接设备调试操作,可参考https://developer.android.com/studio/run/device?hl=zh-cn

    手机需开启“USB调试模式”,Android Studio才能识别到手机。 华为手机一般在设置->系统和更新->开发人员选项->USB调试中打开“USB调试模式”。

  3. 在Android设备上,点击“继续安装”,安装完即可查看到本地相册以及设备摄像头拍照的头像图片进行分割推理的结果。

    install

    运行结果如下图所示(以选取相册某张头像图片为例)。

    result1

    选取相册带有头像图片。

    result2

    选择九宫格中不同的背景图片,即可对人像的背景就行替换分割。


    图1 白色背景

    图2 蓝色背景

    图3 油画背景

示例程序详细说明

本端侧图像分割Android示例程序使用Java层,需读者具备一定的Android开发基础知识。

示例程序结构

app
├── src/main
│   ├── assets # 资源文件
|   |   └── model # 模型文件
|   |       └── segment_model.ms # 存放的模型文件
│   |
│   ├── libs # Android库项目的二进制归档文件
|   |   └── mindspore-lite-version.aar #  MindSpore Lite针对Android版本的归档文件
│   |
│   ├── java # java层应用代码
│   │   └── com.mindspore.imagesegmentation
│   │       ├── help # 图像处理
│   │       │   └── ...
│   │       └── ... Android页面展示以及逻辑处理
│   │
│   ├── res # 存放Android相关的资源文件
│   └── AndroidManifest.xml # Android配置文件
│
│
├── build.gradle # 其他Android配置文件
├── download.gradle # 工程依赖文件下载
└── ...

配置MindSpore Lite依赖项

Android调用MindSpore Android AAR时,需要相关库文件支持。可通过MindSpore Lite源码编译生成mindspore-lite-{version}-inference-android.tar.gz库文件包并解压缩(包含mindspore-lite-{version}.aar库文件)。

version:输出件版本号,与所编译的分支代码对应的版本一致。

本示例中,build过程由app/download.gradle文件自动下载MindSpore Lite版本文件,并放置在app/libs目录下。

注: 若自动下载失败,请手动下载相关库文件mindspore-lite-{version}-inference-android.tar.gz,解压后将其放在对应位置。

下载及部署模型文件

从MindSpore Model Hub中下载模型文件,本示例程序中使用的终端图像分割模型文件为segment_model.ms,同样通过app/download.gradle脚本在APP构建时自动下载,并放置在app/src/main/assets工程目录下。

注:若下载失败请手工下载模型文件segment_model.ms

编写端侧推理代码

推理代码流程如下,完整代码请参见 src/java/com/mindspore/imagesegmentation/TrackingMobile

  1. 加载MindSpore Lite模型文件,构建上下文、会话以及用于推理的计算图。

    • 加载模型文件:创建并配置用于模型推理的上下文。

      // Load the .ms model.
      Model model = new Model();
      if (!model.loadModel(Context, "segment_model.ms")) {
        Log.e(TAG, "Load Model failed");
         return;
      }
      
    • 创建会话。

      // Create and init config.
      MSConfig msConfig = new MSConfig();
      if (!msConfig.init(DeviceType.DT_CPU, threadNum, CpuBindMode.MID_CPU)) {
        Log.e(TAG, "Init context failed");
        return;
      }
      
      // Create the MindSpore lite session.
      LiteSession session = new LiteSession();
      if (!session.init(msConfig)) {
        Log.e(TAG, "Create session failed");
        msConfig.free();
        return;
      }
      msConfig.free();
      
    • 加载模型文件并构建用于推理的计算图。

      // Compile graph.
      if (!session.compileGraph(model)) {
        Log.e(TAG, "Compile graph failed");
        model.freeBuffer();
        return;
      }
      
      // Note: when use model.freeBuffer(), the model can not be compile graph again.
      model.freeBuffer();
      
  2. 将输入图片转换为传入MindSpore模型的Tensor格式。

    将待检测图片数据转换为输入MindSpore模型的Tensor。

    List<MSTensor> inputs = session.getInputs();
    if (inputs.size() != 1) {
      Log.e(TAG, "inputs.size() != 1");
      return null;
    }
    
    float resource_height = bitmap.getHeight();
    float resource_weight = bitmap.getWidth();
    
    ByteBuffer contentArray = BitmapUtils.bitmapToByteBuffer(bitmap, imageSize, imageSize, IMAGE_MEAN, IMAGE_STD);
    
    MSTensor inTensor = inputs.get(0);
    inTensor.setData(contentArray);
    
  3. 运行会话,执行计算图。

    // Run graph to infer results.
    if (!session.runGraph()) {
        Log.e(TAG, "Run graph failed");
        return null;
    }
    
  4. 对输出数据进行处理。

    • 通过Tensor获取的输出数据得到其维度,批处理数,通道数等信息。

      // Get output tensor values.
      List<String> tensorNames = session.getOutputTensorNames();
      Map<String, MSTensor> outputs = session.getOutputMapByTensor();
      for (String tensorName : tensorNames) {
        MSTensor output = outputs.get(tensorName);
        if (output == null) {
            Log.e(TAG, "Can not find output " + tensorName);
            return null;
        }
      float[] results = output.getFloatData();
      float[] result = new float[output.elementsNum()];
      
      int batch = output.getShape()[0];
      int channel = output.getShape()[1];
      int weight = output.getShape()[2];
      int height = output.getShape()[3];
      int plane = weight * height;
      
    • 将NCHW格式转为NHWC格式,放入到float[] result

      for (int n = 0; n < batch; n++) {
        for (int c = 0; c < channel; c++) {
          for (int hw = 0; hw < plane; hw++) {
                 result[n * channel * plane + hw * channel + c] = results[n * channel * plane + c * plane + hw];
              }
           }
        }
      
  5. 对输入Tensor按照模型进行推理,进行后处理。

    • float[] result数据转换成ByteBuffer数据格式。

      ByteBuffer buffer = ByteBuffer.allocate(4 * result.length);
      FloatBuffer floatBuffer = buffer.asFloatBuffer();
      floatBuffer.put(result);
      return buffer;
      
    • 将ByteBuffer数据格式转成Bitmap。

      通过推理出来的数据在Bitmap每个像素坐标进行比对。如果坐标数据等于PERSON,坐标点颜色不变。反之,则改成透明色(如下图所示)。

      Bitmap.Config conf = Bitmap.Config.ARGB_8888;
      Bitmap maskBitmap = Bitmap.createBitmap(imageWidth, imageHeight, conf);
      Bitmap scaledBackgroundImage =
              BitmapUtils.scaleBitmapAndKeepRatio(backgroundImage, imageWidth, imageHeight);
      int[][] mSegmentBits = new int[imageWidth][imageHeight];
      inputBuffer.rewind();
      for (int y = 0; y < imageHeight; y++) {
          for (int x = 0; x < imageWidth; x++) {
              float maxVal = 0f;
              mSegmentBits[x][y] = 0;
                  for (int i = 0; i < NUM_CLASSES; i++) {
                      float value = inputBuffer.getFloat((y * imageWidth * NUM_CLASSES + x * NUM_CLASSES + i) * 4);
                      if (i == 0 || value > maxVal) {
                          maxVal = value;
                      if (i == PERSON) {
                          mSegmentBits[x][y] = i;
                      } else {
                          mSegmentBits[x][y] = 0;
                      }
                  }
              }
              maskBitmap.setPixel(x, y, mSegmentBits[x][y] == 0 ? colors[0] : scaledBackgroundImage.getPixel(x, y));
          }
      }
      

      图1 推理前

      图2 推理后
  6. 将推理后的图片与选择的背景图片相结合。

    MainActivity.this.imgPreview.setDrawingCacheEnabled(true);
    MainActivity.this.imgPreview.setBackground(isDemo ? getDrawable(IMAGES[selectedPosition]) : customBack);
    MainActivity.this.imgPreview.setImageBitmap(foreground);
    MainActivity.this.imgPreview.setDrawingCacheEnabled(false);