mindspore_gl.dataset.PPI
- class mindspore_gl.dataset.PPI(root)[源代码]
PPI数据集,用于读取和解析PPI数据集的源数据集。
有关PPI数据集:
蛋白质在各种蛋白质-蛋白质相互作用(PPI)图中的作用——就其细胞功能而言——在各种蛋白质-蛋白质相互作用(PPI)图中,每个图对应于不同的人类组织。使用位置基因集,基序基因集和免疫学特征作为特征,基因本体集作为标签(总共121个),从分子特征数据库收集。平均图包含2373个节点,平均度为28.8。
数据:
图: 24
节点: ~2245.3
Edges: ~61,318.4
类的数量: 121
标签分类:
Train examples: 20
Valid examples: 2
Test examples: 2
下载地址:PPI 。 您可以将数据集文件组织到以下目录结构中,并通过 preprocess API读取。
. └── ppi ├── valid_feats.npy ├── valid_labels.npy ├── valid_graph_id.npy ├── valid_graph.json ├── train_feats.npy ├── train_labels.npy ├── train_graph_id.npy ├── train_graph.json ├── test_feats.npy ├── test_labels.npy ├── test_graph_id.npy └── test_graph.json
- 参数:
root (str) - 包含pi_with_mask.npz的根目录路径。
- 异常:
TypeError - 如果 root 不是str。
RuntimeError - 如果 root 不包含数据文件。
样例:
>>> from mindspore_gl.dataset.ppi import PPI >>> root = "path/to/ppi" >>> dataset = PPI(root)
- property graph_count
图的总数。
- 返回:
int,图的数量。
样例:
>>> #dataset is an instance object of Dataset >>> graph_count = dataset.graph_count
- property graph_edges
累计图边数。
- 返回:
numpy.ndarray,累积边数组。
样例:
>>> #dataset is an instance object of Dataset >>> val_mask = dataset.graph_edges
- graph_feat(graph_idx)[源代码]
图上每个节点的特征。
- 参数:
graph_idx (int) - 图索引。
- 返回:
numpy.ndarray,图的节点特征。
样例:
>>> #dataset is an instance object of Dataset >>> graph_feat = dataset.graph_feat(graph_idx)
- graph_label(graph_idx)[源代码]
图上每个节点的真实标签。
- 参数:
graph_idx (int) - 图索引。
- 返回:
numpy.ndarray,图的节点标签。
样例:
>>> #dataset is an instance object of Dataset >>> graph_label = dataset.graph_label(graph_idx)
- property graph_nodes
累计图节点数。
- 返回:
numpy.ndarray,累计节点数组。
样例:
>>> #dataset is an instance object of Dataset >>> val_mask = dataset.graph_nodes
- property node_feat
节点特性。
- 返回:
numpy.ndarray,节点特征数组。
样例:
>>> #dataset is an instance object of Dataset >>> node_feat = dataset.node_feat
- property node_label
每个节点的真实标签。
- 返回:
numpy.ndarray,节点标签数组。
样例:
>>> #dataset is an instance object of Dataset >>> node_label = dataset.node_label
- property num_classes
标签类数量。
- 返回:
int,类的数量。
样例:
>>> #dataset is an instance object of Dataset >>> num_classes = dataset.num_classes
- property num_features
每个节点的特征大小。
- 返回:
int,特征大小的数量。
样例:
>>> #dataset is an instance object of Dataset >>> num_features = dataset.num_features
- property test_graphs
测试图ID。
- 返回:
numpy.ndarray,测试图ID数组。
样例:
>>> #dataset is an instance object of Dataset >>> test_graphs = dataset.test_graphs
- property test_mask
测试节点掩码。
- 返回:
numpy.ndarray,掩码数组。
样例:
>>> #dataset is an instance object of Dataset >>> test_mask = dataset.test_mask
- property train_graphs
训练图ID。
- 返回:
numpy.ndarray,训练ID数组。
样例:
>>> #dataset is an instance object of Dataset >>> train_graphs = dataset.train_graphs
- property train_mask
训练节点掩码。
- 返回:
numpy.ndarray,掩码数组。
样例:
>>> #dataset is an instance object of Dataset >>> train_mask = dataset.train_mask
- property val_graphs
校验图ID。
- 返回:
numpy.ndarray,校验图ID数组。
样例:
>>> #dataset is an instance object of Dataset >>> val_graphs = dataset.val_graphs
- property val_mask
校验节点掩码。
- 返回:
numpy.ndarray,掩码数组。
样例:
>>> #dataset is an instance object of Dataset >>> val_mask = dataset.val_mask