mindspore_gl.dataset.PPI

class mindspore_gl.dataset.PPI(root)[源代码]

PPI数据集,用于读取和解析PPI数据集的源数据集。

有关PPI数据集:

蛋白质在各种蛋白质-蛋白质相互作用(PPI)图中的作用——就其细胞功能而言——在各种蛋白质-蛋白质相互作用(PPI)图中,每个图对应于不同的人类组织。使用位置基因集,基序基因集和免疫学特征作为特征,基因本体集作为标签(总共121个),从分子特征数据库收集。平均图包含2373个节点,平均度为28.8。

数据:

  • 图: 24

  • 节点: ~2245.3

  • Edges: ~61,318.4

  • 类的数量: 121

  • 标签分类:

    • Train examples: 20

    • Valid examples: 2

    • Test examples: 2

下载地址:PPI 。 您可以将数据集文件组织到以下目录结构中,并通过 preprocess API读取。

.
└── ppi
    ├── valid_feats.npy
    ├── valid_labels.npy
    ├── valid_graph_id.npy
    ├── valid_graph.json
    ├── train_feats.npy
    ├── train_labels.npy
    ├── train_graph_id.npy
    ├── train_graph.json
    ├── test_feats.npy
    ├── test_labels.npy
    ├── test_graph_id.npy
    └── test_graph.json
参数:
  • root (str) - 包含pi_with_mask.npz的根目录路径。

异常:
  • TypeError - 如果 root 不是str。

  • RuntimeError - 如果 root 不包含数据文件。

样例:

>>> from mindspore_gl.dataset.ppi import PPI
>>> root = "path/to/ppi"
>>> dataset = PPI(root)
property graph_count

图的总数。

返回:

int,图的数量。

样例:

>>> #dataset is an instance object of Dataset
>>> graph_count = dataset.graph_count
property graph_edges

累计图边数。

返回:

numpy.ndarray,累积边数组。

样例:

>>> #dataset is an instance object of Dataset
>>> val_mask = dataset.graph_edges
graph_feat(graph_idx)[源代码]

图上每个节点的特征。

参数:
  • graph_idx (int) - 图索引。

返回:

numpy.ndarray,图的节点特征。

样例:

>>> #dataset is an instance object of Dataset
>>> graph_feat = dataset.graph_feat(graph_idx)
graph_label(graph_idx)[源代码]

图上每个节点的真实标签。

参数:
  • graph_idx (int) - 图索引。

返回:

numpy.ndarray,图的节点标签。

样例:

>>> #dataset is an instance object of Dataset
>>> graph_label = dataset.graph_label(graph_idx)
property graph_nodes

累计图节点数。

返回:

numpy.ndarray,累计节点数组。

样例:

>>> #dataset is an instance object of Dataset
>>> val_mask = dataset.graph_nodes
property node_feat

节点特性。

返回:

numpy.ndarray,节点特征数组。

样例:

>>> #dataset is an instance object of Dataset
>>> node_feat = dataset.node_feat
property node_label

每个节点的真实标签。

返回:

numpy.ndarray,节点标签数组。

样例:

>>> #dataset is an instance object of Dataset
>>> node_label = dataset.node_label
property num_classes

标签类数量。

返回:

int,类的数量。

样例:

>>> #dataset is an instance object of Dataset
>>> num_classes = dataset.num_classes
property num_features

每个节点的特征大小。

返回:

int,特征大小的数量。

样例:

>>> #dataset is an instance object of Dataset
>>> num_features = dataset.num_features
property test_graphs

测试图ID。

返回:

numpy.ndarray,测试图ID数组。

样例:

>>> #dataset is an instance object of Dataset
>>> test_graphs = dataset.test_graphs
property test_mask

测试节点掩码。

返回:

numpy.ndarray,掩码数组。

样例:

>>> #dataset is an instance object of Dataset
>>> test_mask = dataset.test_mask
property train_graphs

训练图ID。

返回:

numpy.ndarray,训练ID数组。

样例:

>>> #dataset is an instance object of Dataset
>>> train_graphs = dataset.train_graphs
property train_mask

训练节点掩码。

返回:

numpy.ndarray,掩码数组。

样例:

>>> #dataset is an instance object of Dataset
>>> train_mask = dataset.train_mask
property val_graphs

校验图ID。

返回:

numpy.ndarray,校验图ID数组。

样例:

>>> #dataset is an instance object of Dataset
>>> val_graphs = dataset.val_graphs
property val_mask

校验节点掩码。

返回:

numpy.ndarray,掩码数组。

样例:

>>> #dataset is an instance object of Dataset
>>> val_mask = dataset.val_mask