mindspore.dataset.Dataset.project

mindspore.dataset.Dataset.project(columns)[源代码]

从数据集对象中选择需要的列,并按给定的列名的顺序进行排序。 未指定的数据列将被丢弃。

参数:
  • columns (Union[str, list[str]]) - 要选择的数据列的列名列表。

返回:

Dataset,应用了上述操作的新数据集对象。

样例:

>>> import mindspore.dataset as ds
>>> # Create a dataset with 3 columns
>>> input_columns = ["column1", "column2", "column3"]
>>> dataset = ds.GeneratorDataset([(1, 2, 3), (3, 4, 5), (5, 6, 7)], column_names=input_columns)
>>>
>>> columns_to_project = ["column3", "column1", "column2"]
>>> # in that order, regardless of the original order of columns.
>>> dataset = dataset.project(columns=columns_to_project)