mindspore.dataset.Dataset.project
- mindspore.dataset.Dataset.project(columns)[源代码]
从数据集对象中选择需要的列,并按给定的列名的顺序进行排序。 未指定的数据列将被丢弃。
- 参数:
columns (Union[str, list[str]]) - 要选择的数据列的列名列表。
- 返回:
Dataset,应用了上述操作的新数据集对象。
样例:
>>> import mindspore.dataset as ds >>> # Create a dataset with 3 columns >>> input_columns = ["column1", "column2", "column3"] >>> dataset = ds.GeneratorDataset([(1, 2, 3), (3, 4, 5), (5, 6, 7)], column_names=input_columns) >>> >>> columns_to_project = ["column3", "column1", "column2"] >>> # in that order, regardless of the original order of columns. >>> dataset = dataset.project(columns=columns_to_project)