一种基于多模态数据融合的药物相互作用预测方法及装置制造方法及图纸

技术编号：43491429 阅读：7 留言：0更新日期：2024-11-29 17:00

本发明专利技术的实施方式提供了一种基于多模态数据融合的药物相互作用预测方法及装置。该方法包括：基于待预测药物的SMILES序列构建药物数据集；基于药物数据集，确定每一待预测药物的特征向量集合；其中，特征向量集合中至少包括分子图特征向量、SMILES序列特征向量、药物信息特征向量以及药物特征相似度特征向量；将每一待预测药物的特征向量集合分别进行特征向量融合，得到每一待预测药物的融合特征向量；将融合特征向量输入至预先训练得到的药物相互作用预测模型中，输出药物相互作用预测结果。本发明专利技术可以考虑到药物的其他多模态特征与DDI事件之间的潜在相关性，并且能够有效挖掘各模态数据之间的关键信息，从而提升DDI的预测结果准确性。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术的实施方式涉及神经网络，更具体地，本专利技术的实施方式涉及一种基于多模态数据融合的药物相互作用预测方法及装置。

技术介绍

1、药物-药物相互作用(drug-drug interaction，ddi)的预测是生物医学研究的热点之一。在一种药物与另一种或多种药物共同使用时，药物之间相互作用可能会产生更好的效果，但是，也有可能会产生不良后果。因此，准确预测潜在的ddi至关重要，以最大限度提高药物之间的协同效益。

2、目前，可以通过三维图神经网络和预训练文本注意机制组成的模型对ddi进行预测，但是，现有算法通常是基于相似度、基于网络或基于药物结构进行预测的，很少考虑药物的其他多模态特征与ddi事件之间的潜在相关性，不能有效挖掘各模态数据之间的关键信息，从而导致ddi的预测结果准确性较低。

技术实现思路

1、在本上下文中，本专利技术的实施方式期望提供一种基于多模态数据融合的药物相互作用预测方法及装置，能够提升ddi的预测结果准确性。

2、在本专利技术实施方式的第一方面中，提供了一种基于多模态数据融合的药物相互作用预测方法，包括：

3、基于待预测药物的smiles序列构建药物数据集；其中，所述药物数据集中包括各个待预测药物的药物子数据集，所述药物子数据集中至少包括分子图数据集、smiles序列数据、药物-药物信息网络以及药物特征相似度数据；

4、基于所述药物数据集，确定每一所述待预测药物的特征向量集合；其中，所述特征向量集合中至少包括分

5、将每一所述待预测药物的特征向量集合分别进行特征向量融合，得到每一所述待预测药物的融合特征向量；

6、将所述融合特征向量输入至预先训练得到的药物相互作用预测模型中，输出药物相互作用预测结果。

7、在本实施方式的一个实施例中，所述基于所述药物数据集，确定一个目标待预测药物的分子图特征向量，包括：

8、从所述药物数据集中获取与所述目标待预测药物对应的目标分子图数据集；

9、将所述目标分子图数据集输入预先构建的图卷积网络，输出所述目标分子图数据集对应的嵌入向量；

10、基于最大值函数与平均值函数对所述嵌入向量进行计算，得到所述目标待预测药物的分子图特征向量。

11、在本实施方式的一个实施例中，基于所述药物数据集，确定一个目标待预测药物的smiles序列特征向量，包括：

12、从所述药物数据集中获取与所述目标待预测药物对应的目标smiles序列数据；其中，所述目标smiles序列数据中包含的字符与所述目标待预测药物中包含的目标节点一一对应；

13、将所述目标smiles序列数据输入预先构建的transformer模型，输出查询矩阵、键矩阵以及价值矩阵；

14、基于所述查询矩阵、所述键矩阵以及所述价值矩阵，确定所述目标smiles序列数据中的每一字符的注意力权重；

15、将所述每一字符的注意力权重进行拼接，得到拼接注意力权重；

16、通过前馈网络和最大池化层对所述拼接注意力权重进行运算，得到所述目标待预测药物的smiles序列特征向量。

17、在本实施方式的一个实施例中，所述基于所述药物数据集，确定一个目标待预测药物的药物信息特征向量，包括：

18、从所述药物数据集中获取与所述目标待预测药物对应的目标药物-药物信息网络；

19、基于所述目标待预测药物的各个节点的初始注意力系数对所述目标药物-药物信息网络进行计算，得到最终注意力系数；

20、获取预先设置的权重矩阵；

21、基于所述权重矩阵和所述最终注意力系数，计算得到所述目标待预测药物的药物信息特征向量。

22、在本实施方式的一个实施例中，所述基于所述目标待预测药物的各个节点的初始注意力系数对所述目标药物-药物信息网络进行计算，得到最终注意力系数βij的计算公式为：

23、

24、其中，w为预设的参数矩阵，leakyrelu为激活函数，为预设的权重向量，xdi为节点i的特征矩阵，m为药物属性个数，xdj为节点j的特征矩阵，所述节点j为所述节点i的相邻节点，n(i)表示节点i的相邻节点的集合，xdk为节点i的相邻节点的集合n(i)中的节点k的特征矩阵，t表示转置，∥为连接操作，rij为节点i的初始注意力系数。

25、在本实施方式的一个实施例中，所述待预测药物包括第一待预测药物和第二待预测药物，所述基于所述药物数据集，确定所述第一待预测药物的药物特征相似度特征向量，包括：

26、从所述药物数据集中获取与所述第一待预测药物对应的第一药物特征相似度数据；其中，所述第一药物特征相似度数据中至少包括第一药物-酶特征矩阵和第一药物-靶点特征矩阵；

27、从所述药物数据集中获取与所述第二待预测药物对应的第二药物特征相似度数据；其中，所述第二药物特征相似度数据中至少包含第二药物-酶特征矩阵和第二药物-靶点特征矩阵；

28、基于所述第一药物-酶特征矩阵和所述第二药物-酶特征矩阵，计算得到余弦相似度；

29、基于所述第一药物-靶点特征矩阵和所述第二药物-靶点特征矩阵，计算得到jaccard相似度；

30、对所述余弦相似度和所述jaccard相似度执行拼接及降维操作，得到所述第一待预测药物的药物特征相似度特征向量。

31、在本实施方式的一个实施例中，所述将每一所述待预测药物的特征向量集合分别进行特征向量融合，得到每一所述待预测药物的融合特征向量，包括：

32、基于每一所述待预测药物的特征向量集合，计算得到每一所述待预测药物的每个节点的注意力值集合；其中，所述注意力值集合中至少包括分子图注意力值、smiles序列注意力值、药物-药物信息网络注意力值以及药物特征相似度注意力值；

33、通过softmax函数对所述每个节点的注意力值集合进行正则化，得到所述每个节点的注意力系数集合；其中，所述注意力系数集合中至少包括分子图注意力系数、smiles序列注意力系数、药物-药物信息网络注意力系数以及药物特征相似度注意力系数；

34、基于所述每个节点的注意力系数集合对所述每一所述待预测药物的特征向量集合进行特征向量融合，得到每一所述待预测药物的融合特征向量。

35、在本专利技术实施方式的第二方面中，提供了一种基于多模态数据融合的药物相互作用预测装置，包括：

36、构建单元，用于基于待预测药物的smiles序列构建药物数据集；其中，所述药物数据集中包括各个待预测药物的药物子数据集，所述药物子数据集中至少包括分子图数据集、smiles序列数据、药物-药物信息网络以及药物特征相似度数据；

37、确定单元，用于基于所述药物数据集，确定每一所述待预测药物的特征向量集合；其中，所述特征向量本文档来自技高网...

【技术保护点】

1.一种基于多模态数据融合的药物相互作用预测方法，包括：

2.根据权利要求1所述的基于多模态数据融合的药物相互作用预测方法，所述基于所述药物数据集，确定一个目标待预测药物的分子图特征向量，包括：

3.根据权利要求1所述的基于多模态数据融合的药物相互作用预测方法，基于所述药物数据集，确定一个目标待预测药物的SMILES序列特征向量，包括：

4.根据权利要求1所述的基于多模态数据融合的药物相互作用预测方法，所述基于所述药物数据集，确定一个目标待预测药物的药物信息特征向量，包括：

5.根据权利要求4所述的基于多模态数据融合的药物相互作用预测方法，所述基于所述目标待预测药物的各个节点的初始注意力系数对所述目标药物-药物信息网络进行计算，得到最终注意力系数βij的计算公式为：

6.根据权利要求1所述的基于多模态数据融合的药物相互作用预测方法，所述待预测药物包括第一待预测药物和第二待预测药物，所述基于所述药物数据集，确定所述第一待预测药物的药物特征相似度特征向量，包括：

7.根据权利要求1所述的基于多模态数据融合的药物相

8.一种基于多模态数据融合的药物相互作用预测装置，包括：

9.一种计算设备，所述计算设备包括：

10.一种计算机可读存储介质，其包括指令，当其在计算机上运行时，使得计算机执行如权利要求1～7中的任一项所述的方法。

...

【技术特征摘要】

1.一种基于多模态数据融合的药物相互作用预测方法，包括：

2.根据权利要求1所述的基于多模态数据融合的药物相互作用预测方法，所述基于所述药物数据集，确定一个目标待预测药物的分子图特征向量，包括：

3.根据权利要求1所述的基于多模态数据融合的药物相互作用预测方法，基于所述药物数据集，确定一个目标待预测药物的smiles序列特征向量，包括：

5.根据权利要求4所述的基于多模态数据融合的药物相互作用预测方法，所述基于所述目标待预测药物的各个节点的初始注意力系数对所述目标药物-药物信息网络进行计算...

【专利技术属性】
技术研发人员：胡芳，金梦园，陈慧，刘丹，肖瑞，
申请(专利权)人：湖北中医药大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人