mindspore.data_sink =================== .. py:function:: mindspore.data_sink(fn, dataset, sink_size=1, jit_config=None, input_signature=None) 对输入的函数封装生成一个新的函数。 .. note:: 使用数据下沉时,数据集将自动循环,此时仅需考虑训练总步数(total_step)以及每次下沉的步数(sink_size),下面为按轮次(epochs)训练切换为数据下沉的计算公式: total_step = epochs * dataset_size train_sink_step = total_step / sink_size 在使用 `mindspore.data_sink` 进行函数变换后,需执行 `train_sink_step` 步进行训练。 参数: - **fn** (Function) - 将与数据集一起运行的函数。 - **dataset** (Dataset) - 训练数据集迭代器。数据集可以由数据集生成器API在 `mindspore.dataset` 中生成,例如 :class:`mindspore.dataset.ImageFolderDataset` 。 - **sink_size** (int) - 控制每次下沉执行的数据量。 `sink_size` 必须为正整数。默认值:1。 - **jit_config** (JitConfig) - 编译时所使用的JitConfig配置项,详细可参考 :class:`mindspore.JitConfig` 。默认值:None,表示以PyNative模式运行。 - **input_signature** (Union[Tensor, List or Tuple of Tensors]) - 用于表示输入参数的Tensor。Tensor的shape和dtype将作为函数的输入shape和dtype。默认值:None。 返回: 函数,该生成的函数会以数据下沉模式执行。 异常: - **ValueError** - 如果 `sink_size` 不是正整数。