文档反馈

问题文档片段

问题文档片段包含公式时，显示为空格。

提交类型

issue

有点复杂...

找人问问吧。

PR

小问题，全程线上修改...

一键搞定！

请选择提交类型

问题类型

规范和低错类

- 规范和低错类：

- 错别字或拼写错误，标点符号使用错误、公式错误或显示异常。

- 链接错误、空单元格、格式错误。

- 英文中包含中文字符。

- 界面和描述不一致，但不影响操作。

- 表述不通顺，但不影响理解。

- 版本号不匹配：如软件包名称、界面版本号。

易用性

- 易用性：

- 关键步骤错误或缺失，无法指导用户完成任务。

- 缺少主要功能描述、关键词解释、必要前提条件、注意事项等。

- 描述内容存在歧义指代不明、上下文矛盾。

- 逻辑不清晰，该分类、分项、分步骤的没有给出。

正确性

- 正确性：

- 技术原理、功能、支持平台、参数类型、异常报错等描述和软件实现不一致。

- 原理图、架构图等存在错误。

- 命令、命令参数等错误。

- 代码片段错误。

- 命令无法完成对应功能。

- 界面错误，无法指导操作。

- 代码样例运行报错、运行结果不符。

风险提示

- 风险提示：

- 对重要数据或系统存在风险的操作，缺少安全提示。

内容合规

- 内容合规：

- 违反法律法规，涉及政治、领土主权等敏感词。

- 内容侵权。

请选择问题类型

问题描述

点击输入详细问题描述，以帮助我们快速定位问题。

文档反馈

mindspore.ops.CropAndResize

class mindspore.ops.CropAndResize(method='bilinear', extrapolation_value=0.0)[源代码]

从输入图像Tensor中提取切片并调整其大小。

说明

如果输出shape依赖于 crop_size 的值，则 crop_size 必须为常量。目前该算子仅在 method 为”bilinear”支持反向，其他方法将直接返回0。

参数：

method (str, 可选) - 指定调整大小的采样方法，为可选字符串。提供的方法有： "bilinear" 、 "nearest" 或 "bilinear_v2" 。默认值： "bilinear" 。
- "nearest"：最近邻插值。每个输出像素的值为最近的输入像素的值。这种方法简单快速，但可能导致块状或像素化的输出。
- "bilinear"：双线性插值。每个输出像素是最接近的四个输入像素的加权平均值，使用双线性插值计算。与最近邻插值相比，此方法产生更平滑的结果。
- "bilinear_v2"：优化后的双线性插值算法，在某些情况下可能会产生更好的结果（更高的精度和速度）。
extrapolation_value (float, 可选) - 外插值，数据类型为float。默认值： 0.0 。

输入：

x (Tensor) - 输入为四维的Tensor，其shape必须是 $(b a t c h, i m a g e_h e i g h t, i m a g e_w i d t h, d e p t h)$ 。支持的数据类型：int8、int16、int32、int64、float16、float32、float64、uint8、uint16。
boxes (Tensor) - 二维Tensor，其shape为 $(n u m_b o x e s, 4)$ 。第i行表示 box_index[i] 图像区域的坐标，并且坐标[y1, x1, y2, x2]是归一化后的值。归一化后的坐标值y，映射到图像y * (image_height - 1)处，因此归一化后的图像高度范围为[0, 1]，映射到实际图像高度范围为[0, image_height - 1]。我们允许y1 > y2，在这种情况下，视为原始图像的上下翻转变换。宽度尺寸的处理类似。坐标取值允许在[0, 1]范围之外，在这种情况下，我们使用 extrapolation_value 外插值进行补齐。支持的数据类型：float32。
box_index (Tensor) - boxes 的索引，其shape为 $(n u m_b o x e s)$ 的一维Tensor，数据类型为int32，取值范围为[0, batch)。box_index[i]的值表示第i个框的图像的值。
crop_size (Tuple[int]) - 两个int32元素元素组成的tuple：（crop_height, crop_width）。只能是常量。所有裁剪后的图像大小都将调整为此大小，且不保留图像内容的宽高比，裁剪高度和裁剪宽度都需要为正。

输出：

四维Tensor，其shape为 $(n u m_b o x e s, c r o p_h e i g h t, c r o p_w i d t h, d e p t h)$ ，数据类型类型为float32。

异常：

TypeError - x、 boxes 或 box_index 不是Tensor。
TypeError - crop_size 不是int32类型的tuple，或 crop_size 的长度不是2。
TypeError - boxes 的数据类型不是float，或者，box_index 的数据类型不是int32。
TypeError - method 不是字符串。
TypeError - extrapolation_value 不是浮点值。
ValueError - x 的维度不是四维。
ValueError - boxes 的纬度不是二维。
ValueError - boxes 的第二维不是4。
ValueError - box_index 的维度不是一维。
ValueError - box_index 的第一维与 boxes 的第一维不相等。
ValueError - box_index 存在元素不在 [0, batch) 的范围内.
ValueError - crop_size 的数据不是正整数.
ValueError - method 不是 “bilinear”、”nearest”、”bilinear_v2”之一。

支持平台：

Ascend GPU CPU

样例：

>>> import numpy as np
>>> from mindspore import nn, ops, Tensor
>>> class CropAndResizeNet(nn.Cell):
...     def __init__(self, crop_size):
...         super(CropAndResizeNet, self).__init__()
...         self.crop_and_resize = ops.CropAndResize()
...         self.crop_size = crop_size
...
...     def construct(self, x, boxes, box_index):
...         return self.crop_and_resize(x, boxes, box_index, self.crop_size)
...
>>> BATCH_SIZE = 1
>>> NUM_BOXES = 5
>>> IMAGE_HEIGHT = 256
>>> IMAGE_WIDTH = 256
>>> CHANNELS = 3
>>> image = np.random.normal(size=[BATCH_SIZE, IMAGE_HEIGHT, IMAGE_WIDTH, CHANNELS]).astype(np.float32)
>>> boxes = np.random.uniform(size=[NUM_BOXES, 4]).astype(np.float32)
>>> box_index = np.random.uniform(size=[NUM_BOXES], low=0, high=BATCH_SIZE).astype(np.int32)
>>> crop_size = (24, 24)
>>> crop_and_resize = CropAndResizeNet(crop_size=crop_size)
>>> output = crop_and_resize(Tensor(image), Tensor(boxes), Tensor(box_index))
>>> print(output.shape)
(5, 24, 24, 3)