mindspore_gl.dataset.Enzymes

class mindspore_gl.dataset.Enzymes(root)[源代码]

ENZYMES数据集,用于读取和解析ENZYMES数据集的源数据集。

有关ENZYMES数据集:

ENZYMES是蛋白质三级结构数据集(Borgwardt等人,2005年),由来自布伦达酶数据库(Schomburg等人,2004年)的600个酶组成。任务是将每个酶正确地分配给6个EC顶级类中的一个。

数据:

  • 图: 600

  • 节点: 32.63

  • 边: 62.14

  • 分类数量: 6

下载地址: ENZYMES

您可以将数据集文件组织到以下目录结构中进行读取。

.
├── ENZYMES_A.txt
├── ENZYMES_graph_indicator.txt
├── ENZYMES_graph_labels.txt
├── ENZYMES_node_attributes.txt
├── ENZYMES_node_labels.txt
└── README.txt
参数:
  • root (str) - 包含enzymes_with_mask.npz的根目录的路径。

异常:
  • TypeError - 如果 root 不是str。

  • RuntimeError - 如果 root 不包含数据文件。

样例:

>>> from mindspore_gl.dataset import Enzymes
>>> root = "path/to/enzymes"
>>> dataset = Enzymes(root)
property graph_count

图的总数量。

返回:

int,图的数量。

样例:

>>> #dataset is an instance object of Dataset
>>> graph_count = dataset.graph_count
property graph_edges

累计图边数。

返回:

numpy.ndarray,累积边数组。

样例:

>>> #dataset is an instance object of Dataset
>>> val_mask = dataset.graph_edges
property graph_label

图标签。

返回:

numpy.ndarray,图标签数组。

样例:

>>> #dataset is an instance object of Dataset
>>> node_feat = dataset.graph_label
graph_node_feat(graph_idx)[源代码]

图上每个节点的特征。

参数:
  • graph_idx (int) - 图索引。

返回:

numpy.ndarray,图的节点特征。

样例:

>>> #dataset is an instance object of Dataset
>>> graph_node_feat = dataset.graph_node_feat(graph_idx)
property graph_nodes

累计图节点数。

返回:

numpy.ndarray,累计节点数组。

样例:

>>> #dataset is an instance object of Dataset
>>> val_mask = dataset.graph_nodes
property label_dim

标签种类。

返回:

int,标签种类。

样例:

>>> #dataset is an instance object of Dataset
>>> label_dim = dataset.label_dim
property max_num_node

单张图中最大的节点数量。

返回:

int,节点数中的最大数。

样例:

>>> #dataset is an instance object of Dataset
>>> max_num_node = dataset.max_num_node
property node_feat

节点特征。

返回:

numpy.ndarray,节点特征数组。

样例:

>>> #dataset is an instance object of Dataset
>>> node_feat = dataset.node_feat
property node_feat_size

每个节点的特征数量。

返回:

int,特征大小的数量。

样例:

>>> #dataset is an instance object of Dataset
>>> node_feat_size = dataset.node_feat_size
property test_graphs

测试图ID。

返回:

numpy.ndarray,测试图ID数组。

样例:

>>> #dataset is an instance object of Dataset
>>> test_graphs = dataset.test_graphs
property test_mask

测试节点掩码。

返回:

numpy.ndarray,掩码数组。

样例:

>>> #dataset is an instance object of Dataset
>>> test_mask = dataset.test_mask
property train_graphs

训练图ID。

返回:

numpy.ndarray,训练图ID数组。

样例:

>>> #dataset is an instance object of Dataset
>>> train_graphs = dataset.train_graphs
property train_mask

训练节点掩码。

返回:

numpy.ndarray,掩码数组。

样例:

>>> #dataset is an instance object of Dataset
>>> train_mask = dataset.train_mask
property val_graphs

有效的图表ID。

返回:

numpy.ndarray,校验图ID数组。

样例:

>>> #dataset is an instance object of Dataset
>>> val_graphs = dataset.val_graphs
property val_mask

校验节点掩码。

返回:

numpy.ndarray,掩码数组。

样例:

>>> #dataset is an instance object of Dataset
>>> val_mask = dataset.val_mask