System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术属于计算机科学、生物化学和深度学习,涉及一种跨领域信息融合方法、设备及软件产品,具体涉及一种用于药物发现的跨领域信息融合方法、设备及软件产品,用于改进药物反应预测模型的泛化性能。
技术介绍
1、药物-蛋白相互作用预测是药物开发过程中至关重要的一部分,包括小分子药物与靶标相互作用(dti)和大分子药物与蛋白质相互作用。蛋白质-蛋白质相互作用(ppi)是研究大分子药物与蛋白质相互作用的研究领域之一。dti和ppi属于蛋白质表示学习在药物开发各个领域的具体应用。蛋白质表示所包含的信息在两个应用领域有所不同。首先,dti领域致力于检测蛋白质结构中较小的特定区域(即局部信息)中包含的信息,例如结合口袋和活性。其次,ppi领域侧重于捕获蛋白质的整体结构和生物学功能(即全局信息),包括蛋白质大小和三级结构。此外,局部和全局蛋白质信息是相互依赖的,同时影响蛋白质的生物学功能。因此,整合不同领域的蛋白质信息可以从多个角度生成更全面的蛋白质表征,提高药物-蛋白质相互作用的预测精度。
2、小分子dti预测在药物发现中起着至关重要的作用,因为小分子药物具有化学稳定性高、生产成本低等优点。当训练数据包含测试集中存在的药物和靶标类型时,这些药物和靶标被认为是“已知的”。相反,如果它们没有出现在训练数据中,则被认为是“新颖的”(零样本学习)。计算生物学和医学领域正在经历快速增长,导致不断识别和探索新的目标。同时,药物在广阔的分子领域中只占极小的一部分。因此,新型dti的预测与药物开发工程的实际应用更加密切相关。
3、尽管对已
技术实现思路
1、为了解决现有技术中的药物靶点相互作用预测方法中存在的技术问题,本专利技术提出了一种用于药物发现的跨领域信息融合方法、设备及软件产品。
2、第一方面,本专利技术提供了一种用于药物发现的跨领域信息融合方法,其特征在于:采用药物靶点相互作用预测模型,针对输入的药物和靶点数据信息,在药物和靶点数据上进行零样本的相互作用预测;
3、所述药物靶点相互作用预测模型,包括靶蛋白编码器、药物编码器、第一融合编码器、第二融合编码器和多层感知器;
4、所述蛋白质编码器,用于蛋白质的特征提取;所述药物编码器,用于药物特征提取;所述第一融合编码器用于药物特征与靶蛋白特征的融合;所述第二融合编码器用于蛋白质特征与蛋白质特征的融合;所述多层感知器,用于将不同融合编码器的融合特征进行药物靶点相互作用分类。
5、作为优选,所述靶蛋白编码器,包括3个相同的transformer编码器层,所述transformer编码器的注意力头数为8,在第六层的transformer编码器层加入激活层,激活函数为relu;
6、
7、其中,σ表示激活函数,为relu函数,表示transformer编码器中可学习的权重矩阵,表示第l层的隐藏蛋白质表征,且xp表示蛋白质的嵌入表征,θp表示蛋白质的最大序列长度,dp表示蛋白质的嵌入维度。
8、作为优选,所述药物编码器,包括三层图卷积层,第三层卷积层后加入激活层,激活函数为relu函数;
9、
10、其中,σ表示激活函数,为relu函数;gcn为药物编码器层;和分别表示可学习的第l层可学习的权重矩阵和偏差矩阵,表示分子图的邻接矩阵,表示第l层的节点表征,且xd表示药物分子的嵌入表征,θd表示药物分子的最大节点数量,dd表示蛋白质的嵌入维度。
11、作为优选,所述第一融合编码器、第二融合编码器,均包括一个双线性相互作用图和一个池化层,所述双线性相互作用图包含两个注意力头,嵌入尺寸为168,所述池化层的池化窗口尺寸为3;
12、所述双线性相互作用图,用于获取成对的相互作用信息:
13、
14、其中,和分别表示药物和靶点对应的可学习的权重矩阵,1∈rn是固定的1矩阵,°表示哈德马积;是一个可学习的权重矩阵,σ表示激活函数,表示由第三层的transformer编码器层和药物编码器层gcn生成的隐藏层蛋白质和药物表征;n表示药物分分子中原子的数量,k表示嵌入特征的维度;
15、然后对b矩阵应用双线性池化,
16、
17、其中,uk和vk表示第k列的权重值,fk′为f′向量的第k个元素;m、n分别代表蛋白质中氨基酸的数量和药物分子中原子的数量;bi,j为b矩阵的第i行第j列的元素;表示矩阵的第i列,表示矩阵的第j列;
18、第一融合编码器中的特征图fdt为:
19、fdt=sumpool(f′,s);
20、其中sumpool(·)为一维非重叠的池化操作,s表示一维非重叠的池化步长;第二融合编码器中的特征图fpp采用同样的方式进行获取;
21、通过比较两个通道特征的区分度来获得最终的融合表征f=fdt-fpp。
22、作为优选,所述多层感知器,包括三层的全链接层,输入为两个融合编码器输出特征的差值,特征维度为256,全连接层的维度分别为256、512、256;输出为一个数值,用于表示药物和靶点发生相互作用的概率。
23、作为优选,所述药物靶点相互作用预测模型,是训练好的模型;
24、训练中,药物di和靶蛋白ti的特征表示过程如下:
25、pi=φdrug(di),ti=φφarget(ti);
26、其中,i∈[0,n],n表示训练数据集样本总数,φdrug和φtarget表示药物编码器和蛋白质编码器,pi和ti是药物di和靶点ti的特征;
27、第一融合编码器φf1编码后的特征为:
28、f1=φf1([pi,ti]);
29、第二融合编码器φf2编码后的特征为:
30、f2=φf2([ti,ti]);
31、其中,f1,f2∈rn×m,r代表实数域,m代表特征向量的维度。
32、作为优选,所述药物靶点相互作用预测模型,是训练好的模型;
33、训练中,多层感知器的目标是最小化二元交叉熵损失:
34、
35、其中,θ表示所有可学习的权重矩阵和偏差向量,yi表示所有药物靶点对的真实标签,pi模型预测的药物靶点对的相互作用的,λ是用于l2正则化的超参数。
36、第本文档来自技高网...
【技术保护点】
1.一种用于药物发现的跨领域信息融合方法,其特征在于:采用药物靶点相互作用预测模型,针对输入的药物和靶点数据信息,在药物和靶点数据上进行零样本的相互作用预测;
2.根据权利要求1所述的用于药物发现的跨领域信息融合方法,其特征在于:所述靶蛋白编码器,包括3个相同的Transformer编码器层,所述Transformer编码器的注意力头数为8,在第六层的Transformer编码器层加入激活层,激活函数为ReLU;
3.根据权利要求1所述的用于药物发现的跨领域信息融合方法,其特征在于:所述药物编码器,包括三层图卷积层,第三层卷积层后加入激活层,激活函数为ReLU函数;
4.根据权利要求1所述的用于药物发现的跨领域信息融合方法,其特征在于:所述第一融合编码器、第二融合编码器,均包括一个双线性相互作用图和一个池化层,所述双线性相互作用图包含两个注意力头,嵌入尺寸为168,所述池化层的池化窗口尺寸为3;
5.根据权利要求1所述的用于药物发现的跨领域信息融合方法,其特征在于:所述多层感知器,包括三层的全链接层,输入为两个融合编码器输出特征的差
6.根据权利要求1-5任一项所述的用于药物发现的跨领域信息融合方法,其特征在于:所述药物靶点相互作用预测模型,是训练好的模型;
7.根据权利要求1-3任一项所述的用于药物发现的跨领域信息融合方法,其特征在于:所述药物靶点相互作用预测模型,是训练好的模型;
8.一种用于药物发现的跨领域信息融合设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至7任一项所述用于药物发现的跨领域信息融合方法。
9.一种软件产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述用于药物发现的跨领域信息融合方法。
...【技术特征摘要】
1.一种用于药物发现的跨领域信息融合方法,其特征在于:采用药物靶点相互作用预测模型,针对输入的药物和靶点数据信息,在药物和靶点数据上进行零样本的相互作用预测;
2.根据权利要求1所述的用于药物发现的跨领域信息融合方法,其特征在于:所述靶蛋白编码器,包括3个相同的transformer编码器层,所述transformer编码器的注意力头数为8,在第六层的transformer编码器层加入激活层,激活函数为relu;
3.根据权利要求1所述的用于药物发现的跨领域信息融合方法,其特征在于:所述药物编码器,包括三层图卷积层,第三层卷积层后加入激活层,激活函数为relu函数;
4.根据权利要求1所述的用于药物发现的跨领域信息融合方法,其特征在于:所述第一融合编码器、第二融合编码器,均包括一个双线性相互作用图和一个池化层,所述双线性相互作用图包含两个注意力头,嵌入尺寸为168,所述池化层的池化窗口尺寸为3;
5.根据权利要求1所述的用于药物...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。