Constants
HHBLITS映射至氨基酸类型
变量名 |
类型 |
说明 |
值 |
---|---|---|---|
HHBLITS_AA_TO_ID |
dict |
使用hhblits约定,将氨基酸映射到对应编号,其中 B映射到D,J和O映射到X,U映射到C,Z映射到E。除此之外,其余氨基酸按字母顺序排序。 |
|
ID_TO_HHBLITS_AA |
dict |
HHBLITS_AA_TO_ID的逆映射,将编号映射为氨基酸种类 |
|
MAP_HHBLITS_AATYPE_TO_OUR_AATYPE |
tuple |
氨基酸按照hhblits约定编号到氨基酸标准编号映射表 ,其中标准编号即按照字母顺序对三字符的氨基酸进行排序。 |
(0, 4, 3, 6, 13, 7, 8, 9, 11, 10, 12, 2, 14, 5, 1, 15, 16, 19, 17, 18, 20, 21) |
其中检索得到的MSA先经过HHBLITS_AA_TO_ID从字母转换为编号,送进网络中时再通过 MAP_HHBLITS_AATYPE_TO_OUR_AATYPE转换为restype id,与网络中其他氨基酸编号保持一致。
氨基酸相关常量
变量名 |
类型 |
说明 |
值 |
---|---|---|---|
residue_atom_renaming_swaps |
dict |
20种氨基酸中有四种氨基酸的部分原子具有对称性。本表记录了每种氨基酸中具有对称性的原子映射信息。键为氨基酸类型,值为原子对。 |
|
residue_atoms |
dict |
20种氨基酸对应原子种类,键是三字符的氨基酸名称,值为所包含的原子类型。 |
|
restype_name_to_atom14_names |
dict |
每种氨基酸最多包含14种原子类型,键是三字符的氨基酸名称,值为14种原子类型,不足14种用"''"补齐。 |
|
restype_1to3 |
dict |
氨基酸单字符对应的三字符表示,以单字符为键,三字符为值。 |
|
restype_3to1 |
dict |
氨基酸三字符对应的单字符表示,以三字符为键,单字符为值。 |
|
restype_atom14_mask |
array |
21种氨基酸(20种氨基酸与未知氨基酸 UNK )稠密编码的掩码。 |
|
restype_atom37_mask |
array |
21种氨基酸(20种氨基酸与未知氨基酸 UNK )稀疏编码的掩码。 |
|
restype_num |
scalar |
氨基酸种类总数,不包含未知氨基酸 UNK 。 |
20 |
resnames |
list |
氨基酸种类列表,使用三字符表示,共包含20种氨基酸和 UNK 表示的未知氨基酸。 |
|
resname_to_idx |
dict |
氨基酸种类列表使用三字符表示下对应序号,顺序与 resnames 列表内氨基酸顺序一致,键为氨基酸三字符表示,值为序号。 |
|
restypes |
list |
氨基酸种类列表,使用单字符表示,共包含20种氨基酸,不包含未知氨基酸。 |
|
restype_order |
dict |
氨基酸种类列表使用单字符表示下对应序号,顺序与 restypes 列表内氨基酸顺序一致,键为氨基酸单字符表示,值为序号。 |
|
restypes_with_x |
list |
氨基酸种类列表,使用单字符表示,共包含20种氨基酸和 UNK 表示的未知氨基酸。 |
|
restype_order_with_x |
dict |
氨基酸种类列表使用单字符表示下对应序号,顺序与 restypes_with_x 列表内氨基酸顺序一致,键为氨基酸单字符表示,值为序号。 |
|
order_restype_with_x |
dict |
序号对应使用单字符表示下氨基酸种类列表,顺序与 restypes_with_x 列表内氨基酸顺序一致,键为序号,值为氨基酸单字符表示。 |
|
restypes_with_x_and_gap |
list |
氨基酸种类列表,使用单字符表示,共包含20种氨基酸, UNK 表示的未知氨基酸和gap表示的不在列表内的氨基酸。 |
氨基酸中相关原子常量
变量名 |
类型 |
说明 |
值 |
---|---|---|---|
atom_order |
dict |
氨基酸所有原子名称及对应的索引编码,键是原子名称,值是索引编码。 |
|
atom_type_num |
scalar |
氨基酸所有原子数目。 |
37 |
atom_types |
list |
氨基酸所有原子名称。 |
氨基酸相关键长键角经验常量
变量名 |
类型 |
说明 |
值 |
---|---|---|---|
between_res_bond_length_c_n |
list |
氨基酸肽键长度,单位是埃(Å),第一个值表示除脯氨酸之外的其他氨基酸的肽键长度,第二个表示脯氨酸的肽键长度。 |
[1.329, 1.341] |
between_res_bond_length_stddev_c_n |
list |
氨基酸肽键长度的标准差,单位是埃(Å),第一个值表示表示除脯氨酸之外的其他氨基酸,第二个表示脯氨酸。 |
[0.014, 0.016] |
between_res_cos_angles_c_n_ca |
list |
氨基酸 \(C-N-C\alpha-(C+1)\) 之间形成的二面角的余弦值,第一个值是余弦值的均值,第二个值是余弦值的标准差。 |
[-0.5203, 0.0353] |
between_res_cos_angles_ca_c_n |
list |
氨基酸 \(N-C\alpha-C-(N-1)\) 之间形成的二面角的余弦值,第一个值是余弦值的均值,第二个值是余弦值的标准差。 |
[-0.4473, 0.0311] |
ca_ca |
scalar |
相邻氨基酸 \(C\alpha-C\alpha\) 之间的距离,单位是埃(Å)。 |
3.80209737096 |
范德华原子半径
变量名 |
类型 |
说明 |
值 |
---|---|---|---|
van_der_waals_radius |
dict |
C原子,N原子,O原子和S原子的范德华半径,键为原子名称,值为范德华半径。 |
扭转角相关常量
变量名 |
类型 |
说明 |
值 |
---|---|---|---|
chi_angles_atoms |
dict |
氨基酸中所有原子在对应侧链扭转角编码中的索引,键为氨基酸原子对(tuple)如('ARG', 'N') ,值为该氨基酸中原子所对应侧链编码 chi_angles_atoms 中的二维数组索引。 |
|
chi_angles_mask |
list |
氨基酸中是否存在相应扭转角的掩码,二维数组,第一维长度20,代表20种不同的氨基酸,与 restype_order 的顺序一致;第二维长度4,每个氨基酸最多有四个侧链扭转角,值为1.0代表该扭转角存在,0.0代表不存在。 |
|
chi_groups_for_atom |
dict |
氨基酸中所有原子在对应侧链扭转角编码中的索引。 |
|
chi_pi_periodic |
list |
氨基酸相应扭转角中是否具有对称不变性,即对应扭转角旋转180度不影响整体三维结构。 |
氨基酸局部坐标系相关常量
变量名 |
类型 |
说明 |
值 |
---|---|---|---|
restype_atom14_rigid_group_positions |
array |
21种氨基酸按照稠密编码方式,每种氨基酸中所包含原子在其所属的刚体变换组的局部坐标系中的坐标。shape为 \((21, 37, 3)\) 。 |
|
restype_atom14_to_rigid_group |
array |
21种氨基酸按照稠密编码方式,每种氨基酸中所包含原子所属的刚体变换组, 每个原子所属的刚体变换组从 rigid_group_atom_positions 中获取。 |
|
restype_atom37_rigid_group_positions |
array |
21种氨基酸按照稀疏编码方式,每种氨基酸中所包含原子在其所属的刚体变换组的局部坐标系中的坐标。shape为 \((21, 37, 3)\) 。 |
|
restype_atom37_to_rigid_group |
array |
21种氨基酸按照稀疏编码方式,每种氨基酸中所包含原子所属的刚体变换组, 每个原子所属的刚体变换组从 rigid_group_atom_positions 中获取。 |
|
restype_rigid_group_default_frame |
array |
21种氨基酸的每个刚体变换组的仿射变换矩阵,即从各个刚体变换组的局部坐标系到之前相邻的刚体变换组的局部坐标系的坐标变换矩阵 |
|
rigid_group_atom_positions |
dict |
21种氨基酸中原子所属于的刚体变换组以及坐标,键为氨基酸三字符表示,值为每种氨基酸中所包含原子所属的刚体变换组,以及它在其所属的刚体变换组的局部坐标系中的坐标。 |