mindspore.dataset.serialize

mindspore.dataset.serialize(dataset, json_filepath='')[源代码]

将数据处理管道序列化成JSON文件。

Note

目前不支持某些Python对象序列化。对于map算子的自定义Python函数序列化, mindspore.dataset.serialize 仅返回其函数名称。

参数:

  • dataset (Dataset): 数据处理管道对象。

  • json_filepath (str): 生成序列化JSON文件的路径。

返回:

Dict,包含序列化数据集图的字典。

异常:

OSError - 无法打开文件。

样例:

>>> dataset = ds.MnistDataset(mnist_dataset_dir, num_samples=100)
>>> one_hot_encode = transforms.OneHot(10)  # num_classes is input argument
>>> dataset = dataset.map(operations=one_hot_encode, input_columns="label")
>>> dataset = dataset.batch(batch_size=10, drop_remainder=True)
>>> # serialize it to JSON file
>>> serialized_data = ds.serialize(dataset, json_filepath="/path/to/mnist_dataset_pipeline.json")