文档反馈

问题文档片段

问题文档片段包含公式时，显示为空格。

提交类型

issue

有点复杂...

找人问问吧。

请选择提交类型

问题类型

规范和低错类

- 规范和低错类：

- 错别字或拼写错误，标点符号使用错误、公式错误或显示异常。

- 链接错误、空单元格、格式错误。

- 英文中包含中文字符。

- 界面和描述不一致，但不影响操作。

- 表述不通顺，但不影响理解。

- 版本号不匹配：如软件包名称、界面版本号。

易用性

- 易用性：

- 关键步骤错误或缺失，无法指导用户完成任务。

- 缺少主要功能描述、关键词解释、必要前提条件、注意事项等。

- 描述内容存在歧义指代不明、上下文矛盾。

- 逻辑不清晰，该分类、分项、分步骤的没有给出。

正确性

- 正确性：

- 技术原理、功能、支持平台、参数类型、异常报错等描述和软件实现不一致。

- 原理图、架构图等存在错误。

- 命令、命令参数等错误。

- 代码片段错误。

- 命令无法完成对应功能。

- 界面错误，无法指导操作。

- 代码样例运行报错、运行结果不符。

风险提示

- 风险提示：

- 对重要数据或系统存在风险的操作，缺少安全提示。

内容合规

- 内容合规：

- 违反法律法规，涉及政治、领土主权等敏感词。

- 内容侵权。

请选择问题类型

问题描述

点击输入详细问题描述，以帮助我们快速定位问题。

文档反馈

mindspore.ops.SampleDistortedBoundingBoxV2

class mindspore.ops.SampleDistortedBoundingBoxV2(seed=0, seed2=0, aspect_ratio_range=(0.75, 1.33), area_range=(0.05, 1.0), max_attempts=100, use_image_if_no_bounding_boxes=False)[源代码]

为图像生成单个随机扭曲的边界框。

在图像识别或物品定位中，除了提供真实标签之外，通常还提供边界框注释。用于训练这种系统的常用技术是在保持图像内容的同时随机扭曲图像，即数据增强。此算子根据给定的 image_size 、 bounding_boxes 和一系列约束输出对象的随机扭曲定位，即边界框。输出以3个Tensor的形式返回，分别是： begin 、 size 和 bboxes 。前2个Tensor可以直接输入到mindspore.ops.Slice中，以裁剪图像。第三个Tensor即为生成的扭曲边界框。

参数：

seed (int，可选) - 如果 seed 或 seed2 设置为非零，则随机数生成器将使用这两个给定的的种子。否则，将使用随机数作为种子。默认值：0。
seed2 (int，可选) - 避免种子冲突的第二个种子。默认值：0。
aspect_ratio_range (Union[list(float), tuple(float)]，可选) - 指定图像的裁剪区域必须具有宽高比范围。区域宽高比 = area_width / area_height。这个属性应为正。默认值：(0.75, 1.33)。
area_range (Union[list(float), tuple(float)]，可选) - 图像的裁剪区域必须包含在此范围内提供的图像。此属性的值应该在范围(0.0, 1.0]内。默认值：(0.05, 1.0)。
max_attempts (int，可选) - 尝试生成指定约束的图像的裁剪区域的次数。 max_attemps 次失败后，返回整个图像。此属性的值应为正。默认值：100。
use_image_if_no_bounding_boxes (bool，可选) - 如果没有提供边界框，则此参数控制算子行为。如果没有边界框提供（ bounding_boxes 的shape为 $(0, N, 4)$ 或者 $(b a t c h, 0, 4)$ ），并且此属性设置为True，然后假定一个隐式边界框涵盖整个输入，但如果此属性设置为False，则引发报错。默认值：False。

输入：

image_size (Tensor) - 包含[height, width, channels]三个元素的一维Tensor，其中每个值都应大于零。
bounding_boxes (Tensor) - shape 为 $(b a t c h, N, 4)$ 的三维Tensor，用于描述于输入image相关联的N个边框。该输入的值应该在[0.0, 1.0]的范围内。数据类型支持float32。
min_object_covered (Tensor) - 图像的裁剪区域必须至少包含此比例的任何提供的边界框。此参数的值应该在范围[0.0, 1.0]内。在为0的情况下，裁剪区域不需要重叠任何提供的边界框。数据类型支持float32。

输出：

begin (Tensor) - 包含[offset_height, offset_width, 0]的一维Tensor，数据类型与 image_size 一致。
size (Tensor) - 包含[target_height, target_width, -1]的一维Tensor，数据类型与 image_size 一致。当 image_size 数据类型为uint8的时候， size 的最后一个值将由原来的-1强制转变为255。
bboxes (Tensor) - 三维Tensor，shape为 $(1, 1, 4)$ 。包含随机扭曲后的边框。数据类型支持float32。

异常：

TypeError - image_size 不是Tensor。
TypeError - bounding_boxes 不是Tensor。
TypeError - min_object_covered 不是Tensor。
TypeError - seed 、 seed2 或者 max_attempts 不是int类型。
TypeError - aspect_ratio_range 不是float类型的list或者tuple。
TypeError - area_range 不是float类型的list或者tuple。
TypeError - use_image_if_no_bounding_boxes 不是bool类型。
ValueError - image_size 、 min_object_covered 维度不为1。
ValueError - image_size 含有的元素个数不是3。
ValueError - bounding_boxes 维度不是3。
ValueError - 每个 bounding_boxes 含有的元素个数不是4。
ValueError - min_object_covered 含有的元素个数不是1。
ValueError - aspect_ratio_range 为list或者tuple并且含有的元素个数不是2。
ValueError - aspect_ratio_range 的值不全是正数。
ValueError - aspect_ratio_range 第二个值小于等于第一个值。
ValueError - area_range 为list或者tuple并且含有的元素个数不是2。
ValueError - area_range 不在范围(0.0, 1.0]内。
ValueError - area_range 第二个值小于等于第一个值。
ValueError - max_attempts 不是正整数。
ValueError - use_image_if_no_bounding_boxes 为False并且没有提供任何的边框。
RuntimeError - image_size 的值包含非正数。
RuntimeError - bounding_boxes 不在[0.0, 1.0]范围内。
RuntimeError - bounding_boxes 不能组成一个有效边框。
RuntimeError - min_object_covered 不在[0.0, 1.0]范围内。

支持平台：

CPU

样例：

>>> image_size = Tensor([640, 480, 3], mindspore.int32)
>>> bounding_boxes = Tensor([[[0.38, 0.17, 0.95, 0.40]]], mindspore.float32)
>>> min_object_covered = Tensor([0.8], mindspore.float32)
>>> sample_distorted_bounding_box_v2 = \
...   ops.SampleDistortedBoundingBoxV2(seed=1, seed2=1, aspect_ratio_range=(0.9, 1.1),
...                                    area_range=(0.1,1.0), max_attempts=100,
...                                    use_image_if_no_bounding_boxes=False)
>>> output = sample_distorted_bounding_box_v2(image_size, bounding_boxes, min_object_covered)
>>> begin, size, bboxes = output[0], output[1], output[2]
>>> print(begin)
[133   1   0]
>>> print(size)
[502 457  -1]
>>> print(bboxes)
[[[0.2078125  0.00208333 0.9921875  0.95416665]]]