mindspore.dataset.Schema ========================= .. py:class:: mindspore.dataset.Schema(schema_file=None) 用于解析和存储数据列属性的类。 **参数:** - **schema_file** (str): schema文件的路径,默认值:None。 **返回:** schema对象,关于数据集的行列配置的策略信息。 **异常:** **RuntimeError**: 模式文件加载失败。 .. py:method:: add_column(name, de_type, shape=None) 向schema中添加新列。 **参数:** - **name** (str): 列的新名称。 - **de_type** (str): 列的数据类型。 - **shape** (list[int], 可选): 列shape,默认值:None,-1表示该维度的shape是未知的。 **异常:** **ValueError** 列类型未知。 .. py:method:: from_json(json_obj) 从JSON对象获取schema文件。 **参数:** - **json_obj** (dictionary): 解析的JSON对象。 **异常:** - **RuntimeError** 对象中存在未知的项。 - **RuntimeError** 对象中缺少数据集类型。 - **RuntimeError** 对象中缺少列。 .. py:method:: parse_columns(columns) 解析传入的数据列的属性并将其添加到自身的schema中。 **参数:** - **columns** (Union[dict, list[dict], tuple[dict]]): 数据集属性信息,从schema文件解码。 - **list** [dict]:'name'和'type'必须为key值,'shape'可选。 - **dict** :columns.keys()作为名称,columns.values()是dict,其中包含'type','shape'可选。 **异常:** - **RuntimeError** - 解析列失败。 - **RuntimeError** - 列name字段缺失。 - **RuntimeError** - 列type字段缺失。 .. py:method:: to_json() 获取schema的JSON字符串。 **返回:** str,模式的JSON字符串。