System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 具有晶体结构的蛋白评估方法技术_技高网

具有晶体结构的蛋白评估方法技术

技术编号:40787242 阅读:8 留言:0更新日期:2024-03-28 19:18
本发明专利技术提供了具有晶体结构的蛋白评估方法,包括以下步骤:数据收集和预处理:采集蛋白质晶体的结构数据,并预处理得到完整标准化的蛋白质晶体;特征提取与表示:利用机器学习技术从靶点信息中提取关键特征,所述关键特征至少包括靶点数据,拆解所述靶点数据,形成待评估数据;评估模型构建:构建图神经网络模型,并通过图卷积层处理节点和边信息,获得图的全局信息,利用数据库中的数据对模型训练,得到更新模型参数,以最后更新的模型参数形成评估模型;分子评估和优化:根据评估模型,输出评估结果并转为分子结构,对生成的分子结构进行质量评估,基于评估结构,对分子结构进行优化改进,直至获得预期的分子质量。

【技术实现步骤摘要】

本专利技术涉及蛋白评估,尤其涉及具有晶体结构的蛋白评估方法


技术介绍

1、现有技术中,针对蛋白质,多以修复等为核心进行研究,但是针对原始的蛋白结构以及修复后的蛋白分子,缺少其质量评估和优化方法,故现有技术中缺乏针对蛋白质分子的评估方法,技术人员也无法知晓其具体质量如何?使得对蛋白分子的研究以及后续的应用,受到限制。


技术实现思路

1、本专利技术的目的在于提供具有晶体结构的蛋白评估方法,通过对蛋白质晶体结构采集和预处理,利用特征,结合评估模型,得到最终的评估结果,以便于进行参考。

2、为实现上述目的,本专利技术通过以下技术方案予以实现。

3、具有晶体结构的蛋白评估方法,包括以下步骤:

4、数据收集和预处理:采集蛋白质晶体的结构数据,并预处理得到完整标准化的蛋白质晶体;

5、特征提取与表示:利用机器学习技术从靶点信息中提取关键特征,所述关键特征至少包括靶点数据,拆解所述靶点数据;

6、评估模型构建:构建图神经网络模型,并通过图卷积层处理节点和边信息,获得图的全局信息,利用数据库中的数据对模型训练,得到更新模型参数,以最后更新的模型参数形成评估模型;

7、分子评估和优化:利用拆解的靶点数据形成分子三维结构,然后对分子三维结构的几何构型的合理性以及物理特征的可能性进行评估,基于评估结果,对分子结构进行优化改进,直至获得预期的分子质量。

8、在本专利技术的一个实施例中,所述预处理具体为数据增强、迁移学习或处理数据缺失中的一种。

9、在本专利技术的一个实施例中,所述评估模型构建包括以下步骤:

10、s1)数据获取:获取蛋白质数据库中蛋白质数据结构;

11、s2)数据预处理:预处理所述蛋白质数据结构,使其转换为图结构;

12、s3)提取节点和边的特征;

13、s4)图神经网络建模;

14、s5)输出和预测:

15、在本专利技术的一个实施例中,所述步骤s2)数据处理具体为:使用python的rdkit和networkx库将蛋白质结构数据转换为图形结构,以图形中的节点代表蛋白质的氨基酸残基,图形中的边代表氨基酸之间的连接关系或空间邻近关系。

16、在本专利技术的一个实施例中,所述步骤s3)提取节点和边的特征具体为;分别抽取节点和边的特征,所述节点的特征包括氨基酸的类型、原子的类型和原子的电荷;边的特征可以包括两个氨基酸之间的距离和键的类型。

17、在本专利技术的一个实施例中,所述步骤s4)图神经网络建模具体为:以图注意力网络为模型,通过图卷积层处理节点和边的信息,以获取图的全局信息,形成图神经网络模型。

18、在本专利技术的一个实施例中,利用数据库中的数据对模型训练,具体为:在深度学习模型中,定义损失函数为均方误差和优化器进行训练,每个epoch都会进行一次前向传播和反向传播,然后更新模型参数。

19、在本专利技术的一个实施例中,所述评估模型构建后还包括输出和预测,具体为:在输出层中,图的全局信息通过在节点上,以求和、平均或最大化的形式聚合获得最终预测目标。

20、在本专利技术的一个实施例中,所述输出层中,还包括通过diffpool算法进行每一层的层处理,使得每一层的输出都有一个对应的全局表示。

21、在本专利技术的一个实施例中,所述利用拆解的靶点数据形成分子三维结构具体为:将拆解靶点数据得到的子结构和关联关系,使用分子建模技术,生成分子的初始三维结构,并对初始三维结构利用分子动力学模拟,得到高质量分子结构。

22、本专利技术的有益效果如下:

23、本专利技术中,对于靶点数据拆解,而后又建立了分子结构,能够使得蛋白质分子以三维图像的分子结构方式进行评估,使得评估更加方便直观,且参考性更强。

24、本专利技术中,建模时,以图神经网络进行建模,其可以捕捉到节点之间的复杂关系,尤其是在处理结构性数据如蛋白质数据时特别有效。gat通过引入注意力机制,使得每个节点在更新自身特征时,能对其邻居节点进行自适应的加权。

25、本专利技术中,为了避免重要的结构新型的丢失,故选用用diffpool算法。diffpool(differentiable pooling)是一种图神经网络的池化方法,主要用于生成图的层次结构表示。diffpool通过学习一个节点到簇的分配矩阵来减小图的大小。这种方法是端到端可训练的,并且具有对图结构的自适应性,使其在图分类任务上特别有效。

本文档来自技高网...

【技术保护点】

1.具有晶体结构的蛋白评估方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的具有晶体结构的蛋白评估方法,其特征在于,所述预处理具体为数据增强、迁移学习或处理数据缺失中的一种。

3.根据权利要求1所述的具有晶体结构的蛋白评估方法,其特征在于,所述评估模型构建包括以下步骤:

4.根据权利要求3所述的具有晶体结构的蛋白评估方法,其特征在于,所述步骤S2)数据处理具体为:使用Python的RDKit和NetworkX库将蛋白质结构数据转换为图形结构,以图形中的节点代表蛋白质的氨基酸残基,图形中的边代表氨基酸之间的连接关系或空间邻近关系。

5.根据权利要求4所述的具有晶体结构的蛋白评估方法,其特征在于,所述步骤S3)提取节点和边的特征具体为;分别抽取节点和边的特征,所述节点的特征包括氨基酸的类型、原子的类型和原子的电荷;边的特征可以包括两个氨基酸之间的距离和键的类型。

6.根据权利要求4所述的具有晶体结构的蛋白评估方法,其特征在于,所述步骤S4)图神经网络建模具体为:以图注意力网络为模型,通过图卷积层处理节点和边的信息,以获取图的全局信息,形成图神经网络模型。

7.根据权利要求1所述的具有晶体结构的蛋白评估方法,其特征在于,利用数据库中的数据对模型训练,具体为:在深度学习模型中,定义损失函数为均方误差和优化器进行训练,每个epoch都会进行一次前向传播和反向传播,然后更新模型参数。

8.根据权利要求1所述的具有晶体结构的蛋白评估方法,其特征在于,所述评估模型构建后还包括输出和预测,具体为:在输出层中,图的全局信息通过在节点上,以求和、平均或最大化的形式聚合获得最终预测目标。

9.根据权利要求1所述的具有晶体结构的蛋白评估方法,其特征在于,所述输出层中,还包括通过DiffPool算法进行每一层的层处理,使得每一层的输出都有一个对应的全局表示。

10.根据权利要求1所述的具有晶体结构的蛋白评估方法,其特征在于,所述利用拆解的靶点数据形成分子三维结构具体为:将拆解靶点数据得到的子结构和关联关系,使用分子建模技术,生成分子的初始三维结构,并对初始三维结构利用分子动力学模拟,得到高质量分子结构。

...

【技术特征摘要】

1.具有晶体结构的蛋白评估方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的具有晶体结构的蛋白评估方法,其特征在于,所述预处理具体为数据增强、迁移学习或处理数据缺失中的一种。

3.根据权利要求1所述的具有晶体结构的蛋白评估方法,其特征在于,所述评估模型构建包括以下步骤:

4.根据权利要求3所述的具有晶体结构的蛋白评估方法,其特征在于,所述步骤s2)数据处理具体为:使用python的rdkit和networkx库将蛋白质结构数据转换为图形结构,以图形中的节点代表蛋白质的氨基酸残基,图形中的边代表氨基酸之间的连接关系或空间邻近关系。

5.根据权利要求4所述的具有晶体结构的蛋白评估方法,其特征在于,所述步骤s3)提取节点和边的特征具体为;分别抽取节点和边的特征,所述节点的特征包括氨基酸的类型、原子的类型和原子的电荷;边的特征可以包括两个氨基酸之间的距离和键的类型。

6.根据权利要求4所述的具有晶体结构的蛋白评估方法,其特征在于,所述步骤s4)图神经网络建模具体为:以图注意力网络为模型,通...

【专利技术属性】
技术研发人员:郑铮刘昊危鉴敏
申请(专利权)人:苏州予路乾行生物科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1