mindelec.data.ExistedDataset
- class mindelec.data.ExistedDataset(name=None, data_dir=None, columns_list=None, data_format='npy', constraint_type='Label', random_merge=True, data_config=None)[源代码]
使用给定的数据路径创建数据集。
说明
目前支持 npy 数据格式。
- 参数:
name (str, 可选) - 指定数据集的名称(默认值=None)。如果 data_config 为None,则 name 应不是None。
data_dir (Union[str, list, tuple], 可选) - 已存在数据文件的路径(默认值=None)。如果 data_config 为None, data_dir 不应为None。
columns_list (Union[str, list, tuple], 可选) - 数据集的列名列表(默认值=None)。如果 data_config 为None, columns_list 不应为None。
data_format (str, 可选) - 现有数据文件的格式(默认值=’npy’)。
constraint_type (str, 可选) - 指定创建的数据集的约束类型(默认值=”Label”)。
random_merge (bool, 可选) - 指定是否随机合并给定的数据集(默认值=True)。
data_config (ExistedDataConfig, 可选) - ExistedDataConfig实例,收集上述的信息(默认值=None)。如果非None,则将通过使用它来简化创建数据集类。如果为None,则(name, data_dir, columns_list, data_format, constraint_type, random_merge)的信息用于替换。
- 异常:
ValueError - 当 data_config 为None时,参数 name / data_dir / columns_list 为None。
TypeError - 如果 data_config 不是ExistedDataConfig的实例。
ValueError - 如果 data_format 不是’npy’。
- 支持平台:
Ascend
样例:
>>> from mindelec.data import ExistedDataConfig, ExistedDataset >>> data_config = ExistedDataConfig(name='exist', ... data_dir=['./data.npy'], ... columns_list=['input_data'], data_format="npy", constraint_type="Equation") >>> dataset = ExistedDataset(data_config=data_config)