文档反馈

问题文档片段

问题文档片段包含公式时,显示为空格。

提交类型
issue

有点复杂...

找人问问吧。

请选择提交类型

问题类型
规范和低错类

- 规范和低错类:

- 错别字或拼写错误,标点符号使用错误、公式错误或显示异常。

- 链接错误、空单元格、格式错误。

- 英文中包含中文字符。

- 界面和描述不一致,但不影响操作。

- 表述不通顺,但不影响理解。

- 版本号不匹配:如软件包名称、界面版本号。

易用性

- 易用性:

- 关键步骤错误或缺失,无法指导用户完成任务。

- 缺少主要功能描述、关键词解释、必要前提条件、注意事项等。

- 描述内容存在歧义指代不明、上下文矛盾。

- 逻辑不清晰,该分类、分项、分步骤的没有给出。

正确性

- 正确性:

- 技术原理、功能、支持平台、参数类型、异常报错等描述和软件实现不一致。

- 原理图、架构图等存在错误。

- 命令、命令参数等错误。

- 代码片段错误。

- 命令无法完成对应功能。

- 界面错误,无法指导操作。

- 代码样例运行报错、运行结果不符。

风险提示

- 风险提示:

- 对重要数据或系统存在风险的操作,缺少安全提示。

内容合规

- 内容合规:

- 违反法律法规,涉及政治、领土主权等敏感词。

- 内容侵权。

请选择问题类型

问题描述

点击输入详细问题描述,以帮助我们快速定位问题。

mindspore.ops.ROIAlign

class mindspore.ops.ROIAlign(pooled_height, pooled_width, spatial_scale, sample_num=2, roi_end_mode=1)[源代码]

感兴趣区域对齐(RoI Align)运算。

RoI Align通过在特征图上对附近网格点进行双线性插值计算每个采样点。RoI Align不对RoI、其子区域或采样点的中任何坐标执行量化。参阅论文 Mask R-CNN

参数:
  • pooled_height (int) - 输出特征高度。

  • pooled_width (int) - 输出特征宽度。

  • spatial_scale (float) - 缩放系数,将原始图像坐标映射到输入特征图坐标。 设RoI的高度在原始图像中为 ori_h ,在输入特征图中为 fea_h ,则 spatial_scale 应为 fea_h / ori_h

  • sample_num (int) - 采样数。默认值: 2

  • roi_end_mode (int) - 值必须为0或1。 如果值为0,则使用该算子的历史实现。 如果值为1,则对RoI末尾的像素进行偏移,偏移量为 +1*spatial_scale 。 默认值: 1

输入:
  • features (Tensor) - 输入特征,shape: (N,C,H,W)

  • rois (Tensor) - shape: (rois_n,5) 。数据类型支持float16和float32。 rois_n 为RoI的数量。第二个维度的大小必须为 5 ,分别代表 (image_index,top_left_x,top_left_y,bottom_right_x,bottom_right_y)image_index 表示图像的索引; top_left_xtop_left_y 分别对应RoI左上角坐标的 xy 值; bottom_right_xbottom_right_y 分别对应RoI右下角坐标的 xy 值。

输出:

Tensor,shape: (rois_n,C,pooled_height,pooled_width)

异常:
  • TypeError - pooled_heightpooled_widthsample_numroi_end_mode 不是int类型。

  • TypeError - spatial_scale 不是float类型。

  • TypeError - featuresrois 不是Tensor。

支持平台:

Ascend GPU CPU

样例:

>>> import mindspore
>>> import numpy as np
>>> from mindspore import Tensor, ops
>>> features = Tensor(np.array([[[[1., 2.], [3., 4.]]]]), mindspore.float32)
>>> rois = Tensor(np.array([[0, 0.2, 0.3, 0.2, 0.3]]), mindspore.float32)
>>> roi_align = ops.ROIAlign(2, 2, 0.5, 2)
>>> output = roi_align(features, rois)
>>> print(output)
[[[[1.775 2.025]
   [2.275 2.525]]]]