System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于多模态数据融合的药物协同组合预测方法技术_技高网

一种基于多模态数据融合的药物协同组合预测方法技术

技术编号:42730274 阅读:11 留言:0更新日期:2024-09-13 12:15
本发明专利技术公开了一种基于多模态数据融合的药物协同组合预测方法,首先获取药物组合样本的药物特征向量和细胞系基因表达量;接着基于多头自注意力的图注意力网络和最大池化操作提取药物特征向量中的药物分子图特征;再基于可变形卷积网络提取药物特征向量中的药物摩根指纹特征,并通过空间重建模块抑制药物摩根指纹特征的冗余;然后基于多层感知机提取细胞系基因表达量中的细胞系特征;最后采用Transformer将药物分子图特征、重建后的药物摩根指纹特征和细胞系特征进行特征融合,得到药物协同组合预测结果。本发明专利技术通过融合药物的多模态数据,增强了模型对药物的表征能力,进而提高了对未知药物协同组合的预测精度和泛化能力。

【技术实现步骤摘要】

本专利技术属于药物协同组合预测,具体涉及一种基于多模态数据融合的药物协同组合预测方法的设计。


技术介绍

1、药物协同组合指同时使用两种或两种以上的药物进行疾病治疗。相较于单一用药,具有多重优势,包括更高的疗效、更小的剂量需求、以及更少的药物副作用。因此,药物协同组合成为了治疗复杂疾病的有效方式,受到人们越来越多的关注。在过去,对药物组合的识别往往是基于直觉和经验的。由于药物组合的空间数量庞大,例如存在1000种药物的情况下,可能的药物成对组合就高达499500种,通过生化实验测试所有这些组合是非常困难的。因此,迫切需要有效的计算方法来加速药物组合预测。

2、目前,通过深度学习算法预测药物组合已经进行了许多研究。deepsynergy使用dnn网络,通过三种特征(结构、毒基团、化学性质)描述药物,通过基因表达谱描述细胞系,在大型癌症筛选数据库o‘nei上达到了0.92的预测精准度,开创了深度学习进行药物组合预测的先河。在deepsynergy之后,众多研究人员在提高药物组合预测性能方面做出了诸多的探索和突破,主要的影响集中在模型的架构上。如transynergy引入了transformer架构,从而提供更高质量的表征。deppdds使用图神经网络,从原子的角度提取药物分子图的表征,并取得了更优的性能表现。现有技术还通过构建生物网络异构图来探索药物和疾病之间潜在关联,以提升预测性能。然而,这些方法的预测精度和泛化能力都还有待提高。具体而言,现有的方法大多只使用单模态的数据,这使得模型从单个视角上看待药物分子,因此在未知药物预测任务上,模型无法有效获得药物的多角度信息,从而影响模型的整体预测性能。


技术实现思路

1、本专利技术的目的是为了解决现有通过深度学习进行药物组合预测的方法预测精度和泛化能力较低的问题,提出了一种基于多模态数据融合的药物协同组合预测方法。

2、本专利技术的技术方案为:一种基于多模态数据融合的药物协同组合预测方法,包括以下步骤:

3、s1、获取药物组合样本的药物特征向量和细胞系基因表达量。

4、s2、基于多头自注意力的图注意力网络和最大池化操作提取药物特征向量中的药物分子图特征。

5、s3、基于可变形卷积网络提取药物特征向量中的药物摩根指纹特征,并通过空间重建模块抑制药物摩根指纹特征的冗余,得到重建后的药物摩根指纹特征。

6、s4、基于多层感知机提取细胞系基因表达量中的细胞系特征。

7、s5、采用transformer将药物分子图特征、重建后的药物摩根指纹特征和细胞系特征进行特征融合,得到药物协同组合预测结果。

8、进一步地,步骤s1中获取药物组合样本的药物特征向量的具体方法为:

9、a1、通过药物组合样本中的药物名称获取对应药物的smiles表达式。

10、a2、将药物的smiles表达式转换为以原子为节点,化学键为边的药物分子图,并获取药物分子图中的原子特征。

11、a3、将原子特征表示为长度为78的一维原子特征向量。

12、a4、将药物的smiles表达式转换成长度为2048的一维药物摩根指纹向量。

13、a5、将一维原子特征向量与一维药物摩根指纹向量共同作为药物特征向量。

14、进一步地,步骤a2中的原子特征包括原子类型、相邻原子数量、相邻氢数量、原子隐含值和原子是否处于芳香结构中。

15、进一步地,步骤s1中获取药物组合样本的细胞系基因表达量的具体方法为:

16、b1、获取药物组合样本中细胞系的基因表达量数据。

17、b2、采用对数归一化方法压缩细胞系的基因表达量数据的动态范围,得到压缩后的基因表达量数据。

18、b3、取lincs的核心基因集与压缩后的基因表达量数据的交集,得到954维的细胞系基因表达量。

19、进一步地,步骤s2包括以下分步骤:

20、s21、基于多头自注意力的图注意力网络表示药物分子图中的原子特征:

21、

22、其中表示第层图注意力网络中第个节点的一维原子特征向量,表示relu激活函数,表示与第个节点相邻的节点集合,表示第层图注意力网络中第个节点和第个节点之间的注意力系数,表示第层图注意力网络中的可学习权重矩阵,表示第层图注意力网络中第个节点的一维原子特征向量。

23、s22、根据药物分子图中的原子特征得到药物分子图:

24、

25、其中表示药物分子图,上标3表示使用了三层图注意力网络,表示原子最大数量,表示特征拼接操作。

26、s23、采用最大池化操作提取药物分子图中每个原子最重要的特征信息作为药物分子图特征:

27、

28、其中表示药物分子图特征,表示最大池化操作。

29、进一步地,步骤s3包括以下分步骤:

30、s31、采用可变形卷积网络提取一维药物摩根指纹向量中的药物摩根指纹特征:

31、

32、其中表示可变形卷积网络输出的药物摩根指纹特征,表示输出特征中的任意位置,表示规则网格,表示规则网格中的第个网格,表示权重值,表示第个偏移量,,表示规则网格的数量。

33、s32、对药物摩根指纹特征进行组标准化处理:

34、

35、其中表示组标准化层输出的特征,表示组标准化层,表示药物摩根指纹特征的均值,表示药物摩根指纹特征的标准差,表示用于保证除法稳定性的正常数,和均表示可训练的仿射变换。

36、s33、对仿射变换进行归一化操作得到特征空间重要性权重:

37、

38、其中表示第个通道的仿射变换,表示第个通道的仿射变换,表示药物摩根指纹特征的通道数。

39、s34、根据药物摩根指纹特征与特征空间重要性权重得到权重阈值:

40、

41、其中表示门控,表示sigmoid函数。

42、s35、将高于权重阈值的权重作为权重,低于权重阈值的权重作为权重。

43、s36、根据权重与权重对药物摩根指纹特征进行重建,得到重建后的药物摩根指纹特征:

44、

45、其中表示具有丰富信息的特征空间,表示仅含有极少信息的特征空间,和表示从特征空间分割出来的两部分特征,和表示从特征空间分割出来的两部分特征,和均表示重建中的特征,表示元素相乘,表示元素相加,表示串联操作,表示重建后的药物摩根指纹特征。

46、进一步地,步骤s4中采用三层感知机提取细胞系基因表达量中的细胞系特征:

47、

48、

49、

50、其中表示细胞系基因表达量,表示第一层感知机提取后的特征,表示第二层感知机提取后的特征,表示细胞系特征,表示正则化操作,表示relu激活函数,表示多层感知机。

51、进一步地,步骤s5包括以下分步骤:本文档来自技高网...

【技术保护点】

1.一种基于多模态数据融合的药物协同组合预测方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于多模态数据融合的药物协同组合预测方法,其特征在于,所述步骤S1中获取药物组合样本的药物特征向量的具体方法为:

3.根据权利要求2所述的基于多模态数据融合的药物协同组合预测方法,其特征在于,所述步骤A2中的原子特征包括原子类型、相邻原子数量、相邻氢数量、原子隐含值和原子是否处于芳香结构中。

4.根据权利要求1所述的基于多模态数据融合的药物协同组合预测方法,其特征在于,所述步骤S1中获取药物组合样本的细胞系基因表达量的具体方法为:

5.根据权利要求2所述的基于多模态数据融合的药物协同组合预测方法,其特征在于,所述步骤S2包括以下分步骤:

6.根据权利要求2所述的基于多模态数据融合的药物协同组合预测方法,其特征在于,所述步骤S3包括以下分步骤:

7.根据权利要求1所述的基于多模态数据融合的药物协同组合预测方法,其特征在于,所述步骤S4中采用三层感知机提取细胞系基因表达量中的细胞系特征:

8.根据权利要求1所述的基于多模态数据融合的药物协同组合预测方法,其特征在于,所述步骤S5包括以下分步骤:

...

【技术特征摘要】

1.一种基于多模态数据融合的药物协同组合预测方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于多模态数据融合的药物协同组合预测方法,其特征在于,所述步骤s1中获取药物组合样本的药物特征向量的具体方法为:

3.根据权利要求2所述的基于多模态数据融合的药物协同组合预测方法,其特征在于,所述步骤a2中的原子特征包括原子类型、相邻原子数量、相邻氢数量、原子隐含值和原子是否处于芳香结构中。

4.根据权利要求1所述的基于多模态数据融合的药物协同组合预测方法,其特征在于,所述步骤s1中获取药物组合样本的细...

【专利技术属性】
技术研发人员:许源源肖钦引张永清袁豪何嘉龚美琴刘宇航熊术文周治淦
申请(专利权)人:四川省计算机研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1