System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及生物信息,尤其涉及一种基于多模态知识图谱的药物-药物相互作用预测方法和系统。
技术介绍
1、药物-药物相互作用(ddis)是指多种药物共同服用时发生相互作用,可能导致药效增强或减弱,甚至产生不良反应。如若不能及时预测未知的ddis将严重威胁到病人的生命健康。预测ddis的方法分为传统实验方法和计算方法。然而,基于传统实验的ddis预测研究耗时长、成本高且成功率低。基于计算的方法协助和加速ddis的预测,集中在单模态数据上,没有充分利用多模态数据能够提供互补视角的优势;基于单一模态数据之间的交互提取特征,忽略了模态之间数据交互中潜在的信息;缺乏预测高阶药物关联的有效方法。
2、目前,已经提出多种基于计算的药物-药物相互作用预测方法,它们大致可以分为:基于相似性的方法、基于lstm的方法、基于编码器-解码器的方法、基于注意力机制的方法、基于多模态的方法。然而,这些方法都面临着不同程度的挑战:1.基于相似性的方法过度依赖已知的药物信息,缺少药物分子结构信息,未建模药物之间的高阶关系;2.基于lstm的方法可解释性不足,不能动态调整不同特征的重要性;3.基于编码器-解码器的方法未考虑药物其它模态信息,模型泛化能力依赖于数据集的质量;4.基于注意力机制的方法未捕获全局信息,未考虑多种模态数据;5.基于多模态的方法忽略模态内的信息建模,模态数据单一。
3、当前研究主要集中在单模态数据上,如仅关注分子结构的图像数据或仅考虑药物间的网络关系。这些方法虽然有效,但并未充分利用其它模态的数据,可能会忽略与ddi
4、知识图谱能够整合来自不同来源的数据,如科学文献、实验室数据、临床试验结果和病历信息。这些数据包括但不限于药物的化学性质、生物标志物、患者反应等,为ddis预测提供了一个全面的数据基础。在知识图谱中,不同的实体以节点的形式存在,它们之间的相互作用和联系通过边来表示。这种结构使得数据之间的复杂关系能够被直观地呈现和分析,有助于识别潜在的ddis。
5、在这种背景下,开发一种能够融合多种药物数据且建模药物之间高阶关系的多模态知识图谱预测方法变得至关重要。
技术实现思路
1、本专利技术提供了一种基于多模态知识图谱的药物-药物相互作用预测方法和系统,该方法通过整合多个数据库的药物相互作用数据和药物多模态信息,构建包含化学结构、靶点、酶与通路四种药物模态的知识图谱,采用多模态对齐和图神经网络方法学习药物的表征并进行ddis预测,重点解决如何融合药物的多模态信息并在ddis预测中捕捉药物之间的长路径依赖关系,提升基于计算的ddis预测方法的准确性与可泛化性,加快推进药物的开发进程。
2、本专利技术采用的技术方案如下:
3、一种基于多模态知识图谱的药物-药物相互作用预测方法,包括以下步骤:
4、收集药物相互作用数据和药物多模态信息,构建药物多模态知识图谱数据集;
5、从药物多模态知识图谱数据集中提取药物相互作用的结构特征;
6、从药物多模态知识图谱数据集中提取各模态的表征,并进行多模态对齐,得到药物的模态特征;
7、利用药物的结构特征和模态特征训练药物-药物相互作用预测模型,所述药物-药物相互作用预测模型捕捉药物之间相互作用的长路径关系依赖,在细粒度级别建模药物-药物潜在的相互作用;
8、将待预测的药物对的多模态信息输入训练完成的药物-药物相互作用预测模型中,得到药物对发生相互作用的关系类型。
9、进一步地,所述收集药物相互作用数据和药物多模态信息,构建药物多模态知识图谱数据集,包括:将药物相互作用数据处理为交互矩阵,包括发生作用的药物对名称以及作用的类型;所述药物多模态信息包括药物的化学结构、靶点、酶、通路;将交互矩阵与药物多模态信息构建为药物多模态知识图谱数据集。
10、进一步地,所述从药物多模态知识图谱数据集中提取药物相互作用的结构特征,包括:将药物相互作用的交互矩阵处理为知识图谱,使用图嵌入技术从知识图谱提取药物相互作用的结构特征;所述从药物多模态知识图谱数据集中提取各模态的表征,包括:使用rdkit从化学结构模态的smiles序列提取分子图表征,使用jaccard相似性度量提取靶点、酶和通路模态的表征。
11、进一步地,所述多模态对齐包括:使用多模态自增强捕捉药物模态内的潜在关联,使用跨模态对比学习捕捉药物模态间的潜在关联。
12、进一步地,所述多模态自增强包括:利用生成器模仿真实药物数据的分布,生成伪造的药物数据样本,将其与真实的药物交互数据混合在一起,输入到判别器;判别器则对输入的数据进行鉴别以区分真实数据和伪数据,通过训练不断提升判别器的鉴别能力,同时利用判别器指导生成器产生更接近真实数据分布的伪数据样本,直到生成器能够生成高质量的伪数据样本,从而训练生成器捕捉药物模态内的潜在关联。
13、进一步地,所述跨模态对比学习包括:对药物dj的m模态结构中的邻居进行信息聚合,将多模态上下文信息保留在模态特定嵌入中;采用infonce损失函数最大化与同一药物j的整体药物嵌入dj之间的互信息,采用跨模态对比损失学习一个不同的药物表征相距较远的嵌入空间,使得模型能够捕获不同药物特定模态的信息。
14、进一步地,所述药物-药物相互作用预测模型首先进行交互模态的表征学习,然后基于交互模态进行长路径关系聚合。
15、进一步地,所述交互模态的表征学习包括:将每个药物对的相互作用效应分解为各个交互模态的贡献之和,并最小化交互模态的距离相关性以减少不同交互模态的依赖性;所述长路径关系聚合包括:知识图谱聚合、交互模态聚合、信息聚合。
16、一种基于多模态知识图谱的药物-药物相互作用预测系统,其包括:
17、多模态知识图谱数据集构建模块,用于收集药物相互作用数据和药物多模态信息,构建药物多模态知识图谱数据集;
18、结构特征提取模块,用于从药物多模态知识图谱数据集中提取药物相互作用的结构特征;
19、模态特征提取模块,用于从药物多模态知识图谱数据集中提取各模态的表征,并进行多模态对齐,得到药物的模态特征;
20、模型训练模块,用于利用药物的结构特征和模态特征训练药物-药物相互作用预测模型,所述药物-药物相互作用预测模型捕捉药物之间相互作用的长路径关系依赖,在细粒度级别建模药物-药物潜在的相互作用;
21、预测模块,用于将待预测的药物对的多模态信息输入训练完成的药物-药物相互作用预测模型中,得到药物对发生相互作用的关系类型。
22、相对于以往的相关方法,本专利技术的基于多模本文档来自技高网...
【技术保护点】
1.一种基于多模态知识图谱的药物-药物相互作用预测方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的方法,其特征在于,所述收集药物相互作用数据和药物多模态信息,构建药物多模态知识图谱数据集,包括:将药物相互作用数据处理为交互矩阵,包括发生作用的药物对名称以及作用的类型;所述药物多模态信息包括药物的化学结构、靶点、酶、通路;将交互矩阵与药物多模态信息构建为药物多模态知识图谱数据集。
3.根据权利要求2所述的方法,其特征在于,所述从药物多模态知识图谱数据集中提取药物相互作用的结构特征,包括:将药物相互作用的交互矩阵处理为知识图谱,使用图嵌入技术从知识图谱提取药物相互作用的结构特征;所述从药物多模态知识图谱数据集中提取各模态的表征,包括:使用RDKit从化学结构模态的SMILES序列提取分子图表征,使用Jaccard相似性度量提取靶点、酶和通路模态的表征。
4.根据权利要求1所述的方法,其特征在于,所述多模态对齐包括:使用多模态自增强捕捉药物模态内的潜在关联,使用跨模态对比学习捕捉药物模态间的潜在关联。
5.根据权利要求4所述的方
6.根据权利要求1所述的方法,其特征在于,所述药物-药物相互作用预测模型首先进行交互模态的表征学习,然后基于交互模态进行长路径关系聚合。
7.根据权利要求6所述的方法,其特征在于,所述交互模态的表征学习包括:将每个药物对的相互作用效应分解为各个交互模态的贡献之和,并最小化交互模态的距离相关性以减少不同交互模态的依赖性;所述长路径关系聚合包括:
8.一种基于多模态知识图谱的药物-药物相互作用预测系统,其特征在于,包括:
9.一种计算机设备,其特征在于,包括存储器和处理器,所述存储器存储计算机程序,所述计算机程序被配置为由所述处理器执行,所述计算机程序包括用于执行权利要求1~7中任一项所述方法的指令。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储计算机程序,所述计算机程序被计算机执行时,实现权利要求1~7中任一项所述的方法。
...【技术特征摘要】
1.一种基于多模态知识图谱的药物-药物相互作用预测方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的方法,其特征在于,所述收集药物相互作用数据和药物多模态信息,构建药物多模态知识图谱数据集,包括:将药物相互作用数据处理为交互矩阵,包括发生作用的药物对名称以及作用的类型;所述药物多模态信息包括药物的化学结构、靶点、酶、通路;将交互矩阵与药物多模态信息构建为药物多模态知识图谱数据集。
3.根据权利要求2所述的方法,其特征在于,所述从药物多模态知识图谱数据集中提取药物相互作用的结构特征,包括:将药物相互作用的交互矩阵处理为知识图谱,使用图嵌入技术从知识图谱提取药物相互作用的结构特征;所述从药物多模态知识图谱数据集中提取各模态的表征,包括:使用rdkit从化学结构模态的smiles序列提取分子图表征,使用jaccard相似性度量提取靶点、酶和通路模态的表征。
4.根据权利要求1所述的方法,其特征在于,所述多模态对齐包括:使用多模态自增强捕捉药物模态内的潜在关联,使用跨模态对比学习捕捉药物模态间的潜在关联。
5.根据权利要求4所述的方法,其特征在于,所述多模态自增强包括:利用生成器模仿真实药物数据的分布,生成伪造的药物数据样本,将其与真实的药物交互数据混合在一起,输入到判别器;判别器则对输入的数据进行鉴别以区分真实数据和伪数据,通过训练不断提升判别器的鉴别能力,同时利...
【专利技术属性】
技术研发人员:孟珍,林国娇,胡智龙,王鹏飞,
申请(专利权)人:中国科学院计算机网络信息中心,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。