System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 表皮生长因子受体致病性预测方法、装置、服务器和介质制造方法及图纸_技高网

表皮生长因子受体致病性预测方法、装置、服务器和介质制造方法及图纸

技术编号:45006864 阅读:3 留言:0更新日期:2025-04-15 17:22
本发明专利技术公开了一种表皮生长因子受体致病性预测方法、装置、服务器和介质,包括:提取复合突变氨基酸序列的三维空间构象氨基酸残基特征,生成初始氨基酸残基结构图;利用第一图神经网络进行预测,通过加权聚合生成第二层级的氨基酸团簇结构图;利用第二图神经网络进行预测,加权聚合生成更高层级的蛋白质亚基结构图;利用第三图神经网络进行预测,再进行特征映射得到蛋白质结构特征向量用于突变位点的致病性评估。相较于现有技术,本发明专利技术采用逐层深入的图神经网络架构,精准捕捉多个突变位点对多层级蛋白质结构的综合影响,从而有效评估表皮生长因子受体突变位点致病性,提高预测的准确性和全面性。

【技术实现步骤摘要】

本专利技术涉及表皮生长因子受体,尤其涉及一种表皮生长因子受体致病性预测方法、装置、服务器和介质


技术介绍

1、表皮生长因子受体(egfr)是酪氨酸激酶受体家族的重要成员,在维持细胞生理功能中发挥着重要的作用,但egfr容易受环境、遗传、生活习惯等多重因素影响而发生突变,成为多种癌症的致病诱因,对人体健康产生威胁。目前,针对egfr突变的癌症患者,酪氨酸激酶抑制剂(tki)是主要靶向药物,通过抑制egfr活性来控制肿瘤生长。然而,egfr突变的多样性和持续动态变化给靶向治疗带来挑战。

2、通过对egfr潜在的突变位点进行预测,并进行致病性评估,可以为临床治疗提供更为精准的决策支持。目前利用图神经网络等模型对单个突变位点的蛋白质结构进行预测并评估其致病性,但在对包含多个突变位点的复合突变导致的蛋白质结构变异进行预测时,无法准确捕捉并预测多个突变位点之间的空间位置关系及其对蛋白质结构产生的综合影响,进而无法准确评估突变位点的致病性。


技术实现思路

1、本专利技术实施例提供了一种表皮生长因子受体致病性预测方法、装置、服务器和介质,可以准确预测多个egfr突变位点对蛋白质结构的影响,从而准确评估突变位点致病性。

2、第一方面,本专利技术实施例提供了一种表皮生长因子受体致病性预测方法,包括:

3、基于包含多个突变位点的复合突变氨基酸序列的三维空间构象,提取氨基酸残基特征,所述氨基酸残基特征包括:氨基酸残基类型特征、氨基酸残基质心坐标特征、关键残基特征和二面角特征,所述氨基酸残基特征为矩阵形式;

4、根据氨基酸残基特征,生成初始氨基酸残基结构图,所述初始氨基酸残基结构图中各节点的特征为对应的氨基酸残基特征;将所述初始氨基酸残基结构图输入训练完成的第一图神经网络,利用所述第一图神经网络的卷积层对各节点的氨基酸残基特征进行更新,得到各节点的预测氨基酸残基特征矩阵;

5、根据各节点的预测氨基酸残基特征矩阵,基于空间相近性对氨基酸残基进行dbscan聚类,对每个类别中的所有预测氨基酸残基特征矩阵进行加权聚合,生成每个类别的氨基酸团簇特征矩阵;

6、根据氨基酸团簇特征矩阵,生成初始氨基酸团簇结构图,所述初始氨基酸团簇结构图中各节点的特征为对应的氨基酸团簇特征矩阵;将所述初始氨基酸团簇结构图输入训练完成的第二图神经网络,利用所述第二图神经网络的卷积层对各节点的氨基酸团簇特征矩阵进行更新,得到各节点的预测氨基酸团簇特征矩阵;

7、根据预测氨基酸团簇特征矩阵,确定氨基酸团簇组合阈值,利用氨基酸团簇组合阈值对预测氨基酸团簇特征矩阵进行层次聚类,对每个类别中的所有预测氨基酸团簇特征矩阵进行加权聚合,生成多个蛋白质亚基特征矩阵;

8、根据蛋白质亚基特征矩阵,生成初始蛋白质亚基结构图,所述初始蛋白质亚基结构图中各节点的特征为对应的蛋白质亚基特征矩阵;将所述初始蛋白质亚基结构图输入训练完成的第三图神经网络,利用所述第三图神经网络的卷积层对各节点的蛋白质亚基特征进行更新,得到各节点的预测蛋白质亚基特征矩阵;

9、将所有预测蛋白质亚基特征矩阵进行特征映射,生成预测蛋白质结构特征向量,利用预测蛋白质结构特征向量进行突变位点的致病性评估。

10、进一步的,所述根据各节点的预测氨基酸残基特征矩阵,基于空间相近性对氨基酸残基进行聚类,根据每个类别中的所有预测氨基酸残基特征矩阵进行加权聚合,生成每个类别的氨基酸团簇特征矩阵,包括:

11、根据所述各节点的预测氨基酸残基特征矩阵,提取各节点的氨基酸残基三维坐标;

12、根据各节点的氨基酸残基三维坐标进行dbscan聚类,设置dbscan的邻域半径为12埃,最小点数为6;

13、基于空间注意力机制,对位于酪氨酸激酶区的氨基酸残基进行加权,并计算每个类别下的所有预测氨基酸残基特征矩阵之和,得到每个类别的氨基酸团簇特征矩阵。

14、进一步的,所述根据预测氨基酸团簇特征矩阵,确定氨基酸团簇组合阈值,利用氨基酸团簇组合阈值对预测氨基酸团簇特征矩阵进行层次聚类,对每个类别中的所有预测氨基酸团簇特征矩阵进行加权聚合,生成多个蛋白质亚基特征矩阵,包括:

15、根据所述预测氨基酸团簇特征矩阵,计算所有氨基酸团簇质心坐标之间的最大距离,将所述最大距离的12%作为氨基酸团簇组合阈值;

16、根据氨基酸团簇组合阈值和氨基酸团簇质心坐标对各节点的氨基酸团簇进行层次聚类,每个类别均包含氨基酸团簇质心坐标之间距离小于氨基酸团簇组合阈值的多个预测氨基酸团簇特征矩阵;

17、基于空间注意力机制,对每个类别下的所有预测氨基酸团簇特征矩阵进行加权,并计算每个类别的所有预测氨基酸团簇特征之和,得到每个类别的蛋白质亚基特征矩阵。

18、进一步的,所述基于包含多个突变位点的复合突变氨基酸序列的三维空间构象,提取氨基酸残基特征,包括:

19、获取预测的高致病性egfr单点突变位点,将高致病性egfr突变位点与敏感突变位点组合,得到复合突变氨基酸序列预测集;

20、将复合突变氨基酸序列预测集中的每个复合突变氨基酸序列分别进行三维结构转换,得到复合突变氨基酸序列的三维空间构象;

21、遍历复合突变氨基酸序列的三维空间构象,提取复合突变氨基酸序列中的所有氨基酸残基顺序特征、氨基酸残基类型特征和所有原子的三维坐标;

22、根据每个氨基酸残基的氨基酸残基类型特征和氨基酸残基顺序特征,确定每个氨基酸残基的关键残基特征;

23、根据每个氨基酸残基的所有原子的三维坐标的均值,确定每个氨基酸残基质心坐标特征;

24、根据每个氨基酸残基的所有原子的三维坐标,确定每个氨基酸残基的二面角特征。

25、进一步的,所述方法还包括:

26、识别每个氨基酸残基特征的关键残基特征,根据关键残基特征在所述第一图神经网络的卷积层中利用注意力机制对各节点的氨基酸残基特征进行加权。

27、进一步的,所述对预测蛋白质结构特征向量进行致病性评估,包括:

28、对所述预测蛋白质结构特征向量进行聚类,利用包含已知突变位点的蛋白质结构特征,对与已知突变位点同类别下的未知突变位点进行致病性和药物敏感性评估。

29、进一步的,所述方法还包括:

30、利用所述预测氨基酸残基特征中的关键氨基酸残基特征,对所述预测氨基酸残基特征矩阵进行聚类,利用包含已知突变位点的预测氨基酸残基特征,对相同类别下的未知突变位点进行致病性、致病机理和药物敏感性评估。

31、第二方面,本专利技术实施例还提供了一种表皮生长因子受体致病性预测装置,包括:

32、临床突变交集分析模块,用于根据复合突变氨基酸序列的三维空间构象,提取氨基酸残基特征;

33、点-面构象柔性融合模块,用于根据氨基酸残基特征,预测蛋白质结构特征;

34、所述点-面构象柔性融合模块,包括第本文档来自技高网...

【技术保护点】

1.一种表皮生长因子受体致病性预测方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述根据各节点的预测氨基酸残基特征矩阵,基于空间相近性对氨基酸残基进行DBSCAN聚类,对每个类别中的所有预测氨基酸残基特征矩阵进行加权聚合,生成每个类别的氨基酸团簇特征矩阵,包括:

3.根据权利要求1所述的方法,其特征在于,所述根据预测氨基酸团簇特征矩阵,确定氨基酸团簇组合阈值,利用氨基酸团簇组合阈值对预测氨基酸团簇特征矩阵进行层次聚类,对每个类别中的所有预测氨基酸团簇特征矩阵进行加权聚合,生成多个蛋白质亚基特征矩阵,包括:

4.根据权利要求1所述的方法,其特征在于,所述基于包含多个突变位点的复合突变氨基酸序列的三维空间构象,提取氨基酸残基特征,包括:

5.根据权利要求1所述的方法,其特征在于,所述方法还包括:

6.根据权利要求1所述的方法,其特征在于,所述对预测蛋白质结构特征向量进行致病性评估,包括:

7.根据权利要求1所述的方法,其特征在于,所述方法还包括:

8.一种表皮生长因子受体致病性预测装置,其特征在于,包括:

9.一种服务器,其特征在于,所述服务器包括:

10.一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行如权利要求1-7任一所述的表皮生长因子受体致病性预测方法。

...

【技术特征摘要】

1.一种表皮生长因子受体致病性预测方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述根据各节点的预测氨基酸残基特征矩阵,基于空间相近性对氨基酸残基进行dbscan聚类,对每个类别中的所有预测氨基酸残基特征矩阵进行加权聚合,生成每个类别的氨基酸团簇特征矩阵,包括:

3.根据权利要求1所述的方法,其特征在于,所述根据预测氨基酸团簇特征矩阵,确定氨基酸团簇组合阈值,利用氨基酸团簇组合阈值对预测氨基酸团簇特征矩阵进行层次聚类,对每个类别中的所有预测氨基酸团簇特征矩阵进行加权聚合,生成多个蛋白质亚基特征矩阵,包括:

4.根据权利要求1所述的方法,其特征在于,所述基于包...

【专利技术属性】
技术研发人员:杨洁高星杰李沛颖张士杰
申请(专利权)人:天津医科大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1