蛋白质-蛋白质结合亲和力预测方法、计算机和存储介质技术

技术编号:33287486 阅读:18 留言:0更新日期:2022-04-30 23:57
本发明专利技术公开一种蛋白质

【技术实现步骤摘要】
蛋白质

蛋白质结合亲和力预测方法、计算机和存储介质


[0001]本专利技术属于计算机
,尤其是一种蛋白质

蛋白质结合亲和力预测方法、计算机和存储介质。

技术介绍

[0002]蛋白质

蛋白质相互作用是指两个或两个以上的蛋白质分子通过非共价键形成蛋白质复合体的过程,其构成了细胞生化反应网络的主要组成部分。
[0003]蛋白质

蛋白质复合物结构是蛋白质

蛋白质相互作用的产物和形式。从结构上刻画和阐明蛋白质

蛋白质相互作用的决定因素,有助于更深刻地理解相关生物学过程的机制、更清楚地了解疾病的发病机理和更高效地设计蛋白质药物。作为与之紧密相关的研究方向之一,蛋白质

蛋白质复合物结构中的几何特性与结合亲和力之间的定量关系的研究越来越多。。例如,蛋白质

蛋白质结合亲和力预测的微模型,使用了蛋白质

蛋白质的界面面积和结合前后界面氨基酸Cα原子均方根位移的平方。该模型只考虑界面信息。预测蛋白质

蛋白质结合亲和力的全局表面模型(Global Surface Model):PRODIGY(PROtein binDIng enerGY prediction),使用了不同类型的界面原子对或界面氨基酸接触的数目和不同类型的表面氨基酸的百分比。该模型同时考虑界面和表面信息,界面信息用接触数表示,表面信息用不同类型表面氨基酸的百分比表示。一个蛋白质

蛋白质结合能的微预测器,使用了不同类型氨基酸的界面面积。该预测器只考虑界面信息,属于经典界面模型(Classical Interface Model)。一个预测蛋白质

蛋白质结合亲和力的界面氨基酸数目模型(Interface Amino Acid Count Model)。该模型只考虑界面信息,属于经典界面模型(Classical Interface Model)。一个蛋白质

蛋白质亲和力预测的非线性模型:LISA(Local Interaction Signal Analysis),使用了描述界面上偏好接触和非偏好接触的项、不同类型或区域的界面氨基酸的贡献、非相互作用的带电氨基酸和二级结构的贡献[5]。该模型同时考虑界面和表面信息,界面信息用偏好接触、非偏好接触、氨基酸的不同类型或区域以及二级结构刻画,表面信息用带电表面氨基酸的百分比表示。
[0004]以上模型无法准确预测蛋白质

蛋白质结合亲和力,且无法有效的刻画和整合蛋白质

蛋白质复合物的界面信息和表面信息。

技术实现思路

[0005]为解决上述技术问题,本专利技术创造的实施例提供一种蛋白质

蛋白质结合亲和力的预测方法,包括:
[0006]获取蛋白质

蛋白质复合物的结构信息,并根据所述结构信息计算所述蛋白质

蛋白质复合物中原子的表面信息和界面信息;
[0007]按照氨基酸类型将所述蛋白质

蛋白质复合物中原子的表面信息和界面信息进行划分;
[0008]通过线性模型、非线性模型、混合模型以及神经网络模型按照所述界面信息和表
面信息对亲和力的不同贡献进行整合,得到所述蛋白质

蛋白质复合物中多个原子的亲和力信息。进一步地,包括:
[0009]利用Shrake

Rupley算法计算所述蛋白质

蛋白质复合物中原子表面面积;
[0010]利用Voronoi多面体计算方法计算所述蛋白质

蛋白质复合物中原子之间的接触界面面积。
[0011]进一步地,包括:
[0012]按照氨基酸的极性、疏水性、酸碱性和是否带电将所述表面信息划分为:受体的碱性氨基酸表面面积A1、受体的非极性疏水氨基酸表面面积A2、受体的极性不带电氨基酸的表面面积A3、受体的酸性氨基酸的表面面积A4、配体的碱性氨基酸表面面积A5、配体的非极性疏水氨基酸表面面积A6、配体的极性不带电氨基酸的表面面积A7、配体的酸性氨基酸的表面面积A8。
[0013]进一步,包括:
[0014]按照氨基酸的极性、疏水性、酸碱性和是否带电将所述界面信息划分为:受体和配体之间的碱性氨基酸与碱性氨基酸界面面积A9、非极性疏水氨基酸与非极性疏水氨基酸界面面积A
10
、极性不带电氨基酸与极性不带电氨基酸界面面积A
11
、酸性氨基酸与酸性氨基酸界面面积A
12
、碱性氨基酸与非极性疏水氨基酸界面面积A
13
、碱性氨基酸与极性不带电氨基酸界面面积A
14
、碱性氨基酸与酸性氨基酸界面面积A
15
、非极性疏水氨基酸与极性不带电氨基酸界面面积A
16
、非极性疏水氨基酸与酸性氨基酸界面面积A
17
、极性不带电氨基酸与酸性氨基酸界面面积A
18

[0015]一种蛋白质

蛋白质结合亲和力的预测装置,包括:
[0016]获取模块,用于获取蛋白质

蛋白质复合物的结构信息,并根据所述结构信息计算所述蛋白质

蛋白质复合物中原子的表面信息和界面信息;
[0017]处理模块,用于按照氨基酸类型将所述蛋白质

蛋白质复合物中原子的表面信息和界面信息进行划分;
[0018]执行模块,用于通过线性模型、非线性模型、混合模型以及神经网络模型按照所述界面信息和表面信息对亲和力的不同贡献进行整合,得到所述蛋白质

蛋白质复合物中多个原子的亲和力信息。
[0019]进一步地,还包括:
[0020]第一处理子模块,用于利用Shrake

Rupley算法计算所述蛋白质

蛋白质复合物中原子表面面积;
[0021]第二处理子模块,用于利用Voronoi多面体计算方法计算所述蛋白质

蛋白质复合物中原子之间的接触界面面积。
[0022]进一步地,还包括:
[0023]第三处理子模块,用于按照氨基酸的极性、疏水性、酸碱性和是否带电将所述表面信息划分为:受体的碱性氨基酸表面面积A1、受体的非极性疏水氨基酸表面面积A2、受体的极性不带电氨基酸的表面面积A3、受体的酸性氨基酸的表面面积A4、配体的碱性氨基酸表面面积A5、配体的非极性疏水氨基酸表面面积A6、配体的极性不带电氨基酸的表面面积A7、配体的酸性氨基酸的表面面积A8。
[0024]进一步地,还包括:
[0025]第四处理子模块,用于按照氨基酸的极性、疏水性、酸碱性和是否带电将所述界面信息划分为:受体和配体之间本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种蛋白质

蛋白质结合亲和力的预测方法,其特征在于,包括:获取蛋白质

蛋白质复合物的结构信息,并根据所述结构信息计算所述蛋白质

蛋白质复合物中原子的表面信息和界面信息;按照氨基酸类型将所述蛋白质

蛋白质复合物中原子的表面信息和界面信息进行划分;通过线性模型、非线性模型、混合模型以及神经网络模型按照所述界面信息和表面信息对亲和力的不同贡献进行整合,得到所述蛋白质

蛋白质复合物中多个原子的亲和力信息。2.根据权利要求1所述的预测方法,其特征在于,包括:利用Shrake

Rupley算法计算所述蛋白质

蛋白质复合物中原子表面面积;利用Voronoi多面体计算方法计算所述蛋白质

蛋白质复合物中原子之间的接触界面面积。3.根据权利要求1所述的预测方法,其特征在于,包括:按照氨基酸的极性、疏水性、酸碱性和是否带电将所述表面信息划分为:受体的碱性氨基酸表面面积A1、受体的非极性疏水氨基酸表面面积A2、受体的极性不带电氨基酸的表面面积A3、受体的酸性氨基酸的表面面积A4、配体的碱性氨基酸表面面积A5、配体的非极性疏水氨基酸表面面积A6、配体的极性不带电氨基酸的表面面积A7、配体的酸性氨基酸的表面面积A8。4.根据权利要求1所述的预测方法,其特征在于,包括:按照氨基酸的极性、疏水性、酸碱性和是否带电将所述界面信息划分为:受体和配体之间的碱性氨基酸与碱性氨基酸界面面积A9、非极性疏水氨基酸与非极性疏水氨基酸界面面积A
10
、极性不带电氨基酸与极性不带电氨基酸界面面积A
11
、酸性氨基酸与酸性氨基酸界面面积A
12
、碱性氨基酸与非极性疏水氨基酸界面面积A
13
、碱性氨基酸与极性不带电氨基酸界面面积A
14
、碱性氨基酸与酸性氨基酸界面面积A
15
、非极性疏水氨基酸与极性不带电氨基酸界面面积A
16
、非极性疏水氨基酸与酸性氨基酸界面面积A
17
、极性不带电氨基酸与酸性氨基酸界面面积A
18
。5.一种蛋白质

蛋白质结合亲和力的预测装置,其特征在于,包括:获取模块,用于获取蛋白质

蛋白质复合物的结构信息,并根据所述结构信息计算所述蛋白质

蛋白质复合物中原子的表面信息和界面信息;处理模块,用于...

【专利技术属性】
技术研发人员:杨雍逍王攀朱宝亭
申请(专利权)人:香港中文大学深圳
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1