System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术属于计算机数据处理,具体涉及一种药物和靶标相互作用预测方法和系统。
技术介绍
1、预测药物和靶点相互作用的任务在促进新药物发现的发展中起着重要作用。与基于实验室的方法相比,利用计算机进行图神经网络计算方法具有高效、低成本的优势,是药物和靶标相互作用预测的首选方法。近年来,应用不同的图神经网络模型从异构生物信息网络中发现潜在的药物和靶标相互作用引起了人们的广泛关注。虽然基于图神经网络的预测方法取得了较好的性能,但在异构生物信息网络中学习药物和靶标的潜在特征时,由于它们具有丰富的邻域信息,容易遇到过平滑的影响,从而降低了药物和靶标相互作用预测模型的准确性。
技术实现思路
1、本专利技术的目的在于克服现有图神经网络模型在异构生物信息网络中学习药物和靶标的潜在特征时,由于它们具有丰富的邻域信息,容易遇到过平滑的影响,从而降低了药物和靶标相互作用预测模型的准确性缺陷。
2、为了实现上述目的,本专利技术提出了一种药物和靶标相互作用预测方法,所述方法包括:
3、将候选药物和靶标输入训练好的药物和靶标的相互作用预测模型,生成该候选药物和靶标相互作用的预测分数;所述药物和靶标的相互作用预测模型为图神经网络模型;
4、所述药物和靶标的相互作用预测模型的训练过程包括:
5、将药物和靶标关联关系构建成为一个异构信息网络;
6、对得到的异构信息网络进行特征学习,获得药物和靶标的生物特征矩阵和图表示特征矩阵;
7、基于药物和靶标
8、作为上述方法的一种改进,所述药物和靶标的相互作用预测模型的训练过程具体包括:
9、步骤s1:基于已知药物和靶标的关联关系数据、药物的化学结构信息和靶标的氨基酸序列信息构建异构信息网络;
10、根据药物的化学结构信息得到药物的生物特征矩阵;根据靶标的氨基酸序列信息得到靶标的生物特征矩阵;
11、步骤s2:基于异构信息网络、药物的生物特征矩阵和靶标的生物特征矩阵,应用图神经网络模型计算出药物和靶标的图表示特征,得到药物和靶标的图表示特征矩阵;
12、步骤s3:基于药物和靶标的图表示特征矩阵,应用梯度提升树分类器训练出药物和靶标相互作用预测模型。
13、作为上述方法的一种改进,所述构建异构信息网络的过程包括:
14、定义异构信息网络为hbin={v,b,e},将药物vd和靶标vt分别抽象为网络中节点,将药物的生物知识bd和靶标分子的生物知识bt抽象为网络中的节点属性,将药物和靶标之间的关联关系eij抽象为网络中的边;
15、整理异构信息网络所有节点构成的集合v={vd,vt}、节点属性的集合b={bd,bt}和所有边构成的集合e={eij}。
16、作为上述方法的一种改进,所述根据药物的化学结构信息得到药物的生物特征矩阵具体为:
17、应用rdkit软件包计算药物的化学结构信息,再使用自动编码器进行降维,获得药物的生物特征矩阵。
18、作为上述方法的一种改进,所述根据靶标的氨基酸序列信息得到靶标的生物特征矩阵具体为:
19、根据靶标的氨基酸序列信息,将20种不同氨基酸分为四类:
20、第一类:ala,val,leu,ile,met,phe,trp,pro;
21、第二类:gly,ser,thr,cys,asn,gln,tyr;
22、第三类:arg,lys,his;
23、第四类:asp,glu;
24、应用3-mers算法计算这些类别的氨基酸出现的次数,获得靶标的生物特征矩阵。
25、作为上述方法的一种改进,所述步骤s2具体包括:
26、步骤s2-1:通过组合药物的生物特征矩阵cd和靶标的生物特征矩阵ct获得药物和靶标的生物特征矩阵c=[cd,ct]t;t表示矩阵转置;
27、步骤s2-2:
28、通过图神经网络模型采用ndls算法计算一个节点的药物和靶标图表示特征xi:
29、
30、
31、其中,ndls(vi,ε)>0;vi∈v,vi表示异构信息网络的一个节点,v表示异构信息网络所有节点构成的集合;k∈n+,k表示图神经网络层数,n+表示正整数;||·||2表示l2正则化;ε表示常数;表示当k是无穷大时候,其他节点对vi的影响分布;则表示q(k)的第i行,表示第k层其他节点对vi的影响分布;
32、
33、
34、其中,表示当图神经网络层数为k层时的节点i的特征表示;a表示异构信息网络的邻接矩阵;d表示异构信息网络的对角节点矩阵;r=[0,1]表示系数;i表示节点vi的序号,j表示节点vj的序号,vi,vj∈v;
35、根据每个节点的图表示特征xi,构建药物和靶标的图表示特征矩阵x=[xi]。
36、本申请还提供一种药物和靶标相互作用预测系统,基于上述任一项方法构建,所述系统包括:
37、模型预测模块,用于将候选药物和靶标输入训练好的药物和靶标的相互作用预测模型,生成该候选药物和靶标相互作用的预测分数;所述药物和靶标的相互作用预测模型为图神经网络模型;和
38、模型训练模块,用于将药物和靶标关联关系构建成为一个异构信息网络;对得到的异构信息网络进行特征学习,获得药物和靶标的生物特征矩阵和图表示特征矩阵;对所得药物和靶标的图表示特征矩阵进行训练,得到药物和靶标相互作用预测模型。
39、作为上述系统的一种改进,所述模型训练模块包括:
40、网络构建子模块,用于将药物和靶标的关联关系数据、药物的化学结构信息和靶标的氨基酸序列信息构建成为一个异构信息网络,并将构建好的异构信息网络传递给特征学习子模块;
41、特征学习子模块,用于提取异构信息网络中的药物和靶标的生物特征和图表示特征,得到药物和靶标的图表示特征矩阵,并将这些特征矩阵传递给模型训练子模块;和
42、模型训练子模块,用于根据药物和靶标生物特征矩阵和图表示特征矩阵训练药物和靶标的相互作用预测模型。
43、作为上述系统的一种改进,所述系统还包括:
44、结果展示模块,用于根据模型预测模块得到的结果,将每种候选的药物和靶标的关联关系作为一行,其中的药物、靶标和预测分数作为行中的元素,将所有预测结果处理为文本文件进行输出展示。
45、与现有技术相比,本专利技术的优势在于:
46、本专利技术所述的一种药物和靶标相互作用预测系统和方法,在算法设计过程中,利用异构信息网络拓扑结构和生物分子的生物属性信息来完成药物和靶标相互作用预测任务,通过更为全面地学习生物分子特征来提高药物和靶标相互作用预测的准确性,解决现有技术在生物网络中药物和靶标相互作用预测时的缺陷。
本文档来自技高网...【技术保护点】
1.一种药物和靶标相互作用预测方法,所述方法包括:
2.根据权利要求1所述的药物和靶标相互作用预测方法,其特征在于,所述药物和靶标的相互作用预测模型的训练过程具体包括:
3.根据权利要求2所述的药物和靶标相互作用预测方法,其特征在于,所述构建异构信息网络的过程包括:
4.根据权利要求2所述的药物和靶标相互作用预测方法,其特征在于,所述根据药物的化学结构信息得到药物的生物特征矩阵具体为:
5.根据权利要求2所述的药物和靶标相互作用预测方法,其特征在于,所述根据靶标的氨基酸序列信息得到靶标的生物特征矩阵具体为:
6.根据权利要求2所述的药物和靶标相互作用预测方法,其特征在于,所述步骤S2具体包括:
7.一种药物和靶标相互作用预测系统,基于权利要求1-6所述任一项方法构建,其特征在于,所述系统包括:
8.根据权利要求7所述的药物和靶标相互作用预测系统,其特征在于,所述模型训练模块包括:
9.根据权利要求7所述的药物和靶标相互作用预测系统,其特征在于,所述系统还包括:
【技术特征摘要】
1.一种药物和靶标相互作用预测方法,所述方法包括:
2.根据权利要求1所述的药物和靶标相互作用预测方法,其特征在于,所述药物和靶标的相互作用预测模型的训练过程具体包括:
3.根据权利要求2所述的药物和靶标相互作用预测方法,其特征在于,所述构建异构信息网络的过程包括:
4.根据权利要求2所述的药物和靶标相互作用预测方法,其特征在于,所述根据药物的化学结构信息得到药物的生物特征矩阵具体为:
5.根据权利要求2所述的药物和靶标相互作用预测...
【专利技术属性】
技术研发人员:赵博伟,胡伦,张俊,马玉鹏,周喜,
申请(专利权)人:中国科学院新疆理化技术研究所,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。