mindspore.ops.NMSWithMask
- class mindspore.ops.NMSWithMask(iou_threshold=0.5)[源代码]
非极大值抑制算法(NMS, Non-maximum Suppression)。当在计算机视觉领域中进行目标检测时,目标检测算法将生成多个边界框,并计算分数最高的边界框与其他边界框的交并比(IOU),然后根据设定的阈值删除框。 在Ascend平台上,边界框的分数将被忽略,仅根据框之间的IOU来选择框。这意味着如果要删除分数较低的框,则需要提前按分数对输入框进行降序排序。 IOU的计算如下:
\[\text{IOU} = \frac{\text{Area of Overlap}}{\text{Area of Union}}\]Warning
一次最多支持2864个输入框。
参数:
iou_threshold (float) - 指定删除框的IOU的阈值。默认值:0.5。
输入:
bboxes (Tensor) - 边界框,shape: \((N, 5)\) , N 为边界框的数量。每个边界框包含5个值,前4个值为边界框的坐标(x0、y0、x1、y1),代表左上角和右下角的点。最后一个值为边界框的分数。数据类型支持float16或float32。
输出:
tuple[Tensor],包含三个Tensor:output_boxes、output_idx和selected_mask。
output_boxes (Tensor) - shape: \((N, 5)\) 。在GPU和CPU平台上,它是一个边界框的排序列表,按分数对输入 bboxes 进行降序排序。在Ascend平台上,它与输入 bboxes 相同。
output_idx (Tensor) - shape: \((N,)\) 。 output_boxes 的索引列表。
selected_mask (Tensor) - shape: \((N,)\) 。输出边界框的掩码列表。在 output_boxes 上应用此掩码以获取非极大值抑制算法(NMS)计算后的边界框,或在 output_idx 上应用此掩码以获取边界框索引。
异常:
ValueError - iou_threshold 不是float。
ValueError - 输入Tensor的第一个维度小于或等于0。
TypeError - bboxes 的数据类型非float16或float32。
- 支持平台:
Ascend
GPU
CPU
样例:
>>> bbox = np.array([[100.0, 100.0, 50.0, 68.0, 0.63], [150.0, 75.0, 165.0, 115.0, 0.55], ... [12.0, 190.0, 288.0, 200.0, 0.9], [28.0, 130.0, 106.0, 172.0, 0.3]]) >>> bbox[:, 2] += bbox[:, 0] >>> bbox[:, 3] += bbox[:, 1] >>> inputs = Tensor(bbox, mindspore.float32) >>> nms = ops.NMSWithMask(0.1) >>> output_boxes, indices, mask = nms(inputs) >>> indices_np = indices.asnumpy() >>> print(indices_np[mask.asnumpy()]) [0 1 2]