文档反馈

问题文档片段

问题文档片段包含公式时,显示为空格。

提交类型
issue

有点复杂...

找人问问吧。

请选择提交类型

问题类型
规范和低错类

- 规范和低错类:

- 错别字或拼写错误,标点符号使用错误、公式错误或显示异常。

- 链接错误、空单元格、格式错误。

- 英文中包含中文字符。

- 界面和描述不一致,但不影响操作。

- 表述不通顺,但不影响理解。

- 版本号不匹配:如软件包名称、界面版本号。

易用性

- 易用性:

- 关键步骤错误或缺失,无法指导用户完成任务。

- 缺少主要功能描述、关键词解释、必要前提条件、注意事项等。

- 描述内容存在歧义指代不明、上下文矛盾。

- 逻辑不清晰,该分类、分项、分步骤的没有给出。

正确性

- 正确性:

- 技术原理、功能、支持平台、参数类型、异常报错等描述和软件实现不一致。

- 原理图、架构图等存在错误。

- 命令、命令参数等错误。

- 代码片段错误。

- 命令无法完成对应功能。

- 界面错误,无法指导操作。

- 代码样例运行报错、运行结果不符。

风险提示

- 风险提示:

- 对重要数据或系统存在风险的操作,缺少安全提示。

内容合规

- 内容合规:

- 违反法律法规,涉及政治、领土主权等敏感词。

- 内容侵权。

请选择问题类型

问题描述

点击输入详细问题描述,以帮助我们快速定位问题。

mindsponge.common.make_atom14_positions

mindsponge.common.make_atom14_positions(aatype, all_atom_mask, all_atom_positions)[源代码]

本函数提供将稀疏编码方式转为稠密编码方式的功能。

针对蛋白质全原子坐标编码分为两种形式

  • 稀疏编码:20种氨基酸包含原子种类共计37种,详见 common.residue_constants.atom_types ,故可将蛋白质全原子坐标编码为 (Nres,37,3) 的张量。

  • 稠密编码:单氨基酸最多包含14种不同的原子类型,详见 common.residue_constants.restype_name_to_atom14_names ,故可将蛋白质全原子坐标编码为 (Nres,14,3) 的张量。

参数:
  • aatype (numpy.array) - 蛋白质一级序列编码,编码方式参考 common.residue_constants.restype_order, 取值范围 [0,20] ,若为20表示该氨基酸为unkown(UNK)。

  • all_atom_mask (numpy.array) - 蛋白质所有原子坐标掩码,维度为 (Nres,37) ,若对应位置为0则表示该氨基酸不含该原子坐标。

  • all_atom_positions (numpy.array) - 蛋白质所有原子坐标,维度为 (Nres,37,3)

返回:
  • numpy.array。按照稠密编码方式编码,蛋白质全原子掩码,包含unkown氨基酸原子, [Nres,14]

  • numpy.array。按照稠密编码方式编码,蛋白质全原子掩码,不包含unkown氨基酸原子, [Nres,14]

  • numpy.array。按照稠密编码方式编码,蛋白质全原子坐标, [Nres,14,3]

  • numpy.array。稀疏编码方式原子在稠密编码方式中的索引映射, [Nres,14]

  • numpy.array。稠密编码方式原子在稀疏编码方式中的索引映射, [Nres,37]

  • numpy.array。按照稀疏编码方式编码,蛋白质全原子掩码,包含unkown氨基酸原子, [Nres,37]

  • numpy.array。针对稠密编码方式全原子坐标进行手性变换后的全原子坐标。 [Nres,14,3]

  • numpy.array。手性变换后原子掩码, [Nres,14]

  • numpy.array。进行手性变换的原子标识,1为进行变换,0为未进行变换, [Nres,14]

符号:
  • Nres - 蛋白质中氨基酸个数,按蛋白质一级序列排列。

支持平台:

Ascend GPU

样例:

>>> from mindsponge.common import make_atom14_positions
>>> from mindsponge.common import protein
>>> import numpy as np
>>> pdb_path = "YOUR_PDB_FILE"
>>> with open(pdb_path, 'r', encoding = 'UTF-8') as f:
>>>     prot_pdb = protein.from_pdb_string(f.read())
>>> result = make_atom14_positions(prot_pdb.aatype, prot_pdb.atom_mask.astype(np.float32),
>>>                                prot_pdb.atom_positions.astype(np.float32))
>>> for val in result:
>>>     print(val.shape)
(Nres, 14)
(Nres, 14)
(Nres, 14, 3)
(Nres, 14)
(Nres, 37)
(Nres, 37)
(Nres, 14, 3)
(Nres, 14)
(Nres, 14)