文档反馈

问题文档片段

问题文档片段包含公式时，显示为空格。

提交类型

issue

有点复杂...

找人问问吧。

请选择提交类型

问题类型

规范和低错类

- 规范和低错类：

- 错别字或拼写错误，标点符号使用错误、公式错误或显示异常。

- 链接错误、空单元格、格式错误。

- 英文中包含中文字符。

- 界面和描述不一致，但不影响操作。

- 表述不通顺，但不影响理解。

- 版本号不匹配：如软件包名称、界面版本号。

易用性

- 易用性：

- 关键步骤错误或缺失，无法指导用户完成任务。

- 缺少主要功能描述、关键词解释、必要前提条件、注意事项等。

- 描述内容存在歧义指代不明、上下文矛盾。

- 逻辑不清晰，该分类、分项、分步骤的没有给出。

正确性

- 正确性：

- 技术原理、功能、支持平台、参数类型、异常报错等描述和软件实现不一致。

- 原理图、架构图等存在错误。

- 命令、命令参数等错误。

- 代码片段错误。

- 命令无法完成对应功能。

- 界面错误，无法指导操作。

- 代码样例运行报错、运行结果不符。

风险提示

- 风险提示：

- 对重要数据或系统存在风险的操作，缺少安全提示。

内容合规

- 内容合规：

- 违反法律法规，涉及政治、领土主权等敏感词。

- 内容侵权。

请选择问题类型

问题描述

点击输入详细问题描述，以帮助我们快速定位问题。

文档反馈

mindspore.dataset.utils.imshow_det_bbox

mindspore.dataset.utils.imshow_det_bbox(image, bboxes, labels, segm=None, class_names=None, score_threshold=0, bbox_color=(0, 255, 0), text_color=(203, 192, 255), mask_color=(128, 0, 128), thickness=2, font_size=0.8, show=True, win_name='win', wait_time=2000, out_file=None)[源代码]

使用给定的边界框和类别置信度绘制图像。

参数：

image (numpy.ndarray) - 待绘制的图像，shape为 $< C, H, W >$ 或 $< H, W, C >$ ，通道顺序为RGB。
bboxes (numpy.ndarray) - 边界框（包含类别置信度），shape为 $< N, 4 >$ 或 $< N, 5 >$ ，格式为<N,X,Y,W,H>。
labels (numpy.ndarray) - 边界框的类别，shape为 $< N, 1 >$ 。
segm (numpy.ndarray) - 图像分割掩码，shape为 $< M, H, W >$ ，M表示类别总数。默认值： None ，不绘制掩码。
class_names (list[str], tuple[str], dict) - 类别索引到类别名的映射表。默认值： None ，仅显示类别索引。
score_threshold (float) - 绘制边界框的类别置信度阈值。默认值： 0 ，绘制所有边界框。
bbox_color (tuple(int)) - 指定绘制边界框时线条的颜色，顺序为BGR。默认值： (0, 255, 0) ，表示绿色。
text_color (tuple(int)) - 指定类别文本的显示颜色，顺序为BGR。默认值： (203, 192, 255) ，表示粉色。
mask_color (tuple(int)) - 指定掩码的显示颜色，顺序为BGR。默认值： (128, 0, 128) ，表示紫色。
thickness (int) - 指定边界框和类别文本的线条粗细。默认值： 2 。
font_size (int, float) - 指定类别文本字体大小。默认值： 0.8 。
show (bool) - 是否显示图像。默认值： True 。
win_name (str) - 指定窗口名称。默认值： "win" 。
wait_time (int) - 等待按键输入的时延，单位为ms。在图像显示过程中，若无按键输入，则等待该时延后跳转到下一图像；若输入ESC，则立刻结束显示；若输入其他按键，则停止等待直接跳转下一图像。默认值： 2000 ，等待2000ms跳转下一图像。
out_file (str, 可选) - 输出图像的文件路径，用于在绘制后将结果存储到本地。默认值： None ，不保存。

返回：

numpy.ndarray，带边界框和类别置信度的图像。

说明

该接口依赖 opencv-python 库。

异常：

ImportError - 当未安装 opencv-python 库。
AssertionError - 当 image 的格式不为<H, W, C>或<C, H, W>。
AssertionError - 当 bboxes 的格式不为<N, 4>或<N, 5>。
AssertionError - 当 labels 的格式不为<N, 1>。
AssertionError - 当 segm 的格式不为<M, H, W>。
AssertionError - 当 class_names 的类型不为list、tuple或dict。
AssertionError - 当 bbox_color 不为(B, G, R)格式的tuple。
AssertionError - 当 text_color 不为(B, G, R)格式的tuple。
AssertionError - 当 mask_color 不为(B, G, R)格式的tuple。

imshow_det_bbox在VOC2012数据集的使用图示：

样例：

>>> import numpy as np
>>> import mindspore.dataset as ds
>>> from mindspore.dataset.utils import imshow_det_bbox
>>>
>>> # Read Detection dataset, such as VOC2012.
>>> voc_dataset_dir = "/path/to/voc_dataset_directory"
>>> dataset = ds.VOCDataset(voc_dataset_dir, task="Detection", shuffle=False, decode=True, num_samples=5)
>>> dataset_iter = dataset.create_dict_iterator(output_numpy=True, num_epochs=1)
>>>
>>> # draw dataset
>>> for index, data in enumerate(dataset_iter):
...     image = data["image"]
...     bbox = data["bbox"]
...     label = data["label"]
...     # draw image with bboxes
...     imshow_det_bbox(image, bbox, label,
...                     class_names=['aeroplane', 'bicycle', 'bird', 'boat', 'bottle', 'bus', 'car', 'cat',
...                                  'chair', 'cow', 'diningtable', 'dog', 'horse', 'motorbike', 'person',
...                                  'pottedplant', 'sheep', 'sofa', 'train', 'tvmonitor'],
...                     win_name="my_window",
...                     wait_time=5000,
...                     show=True,
...                     out_file="voc_dataset_{}.jpg".format(str(index)))