本发明专利技术提出了一种基于生物知识和网络拓扑结构的药物重定位方法和系统,包括网络构建模块、特征学习模块、模型训练模块、药物重定位模块以及结果展示模块,其中,所述网络构建模块将生物网络数据构建为异构信息网络,特征学习模块执行服务器计算指令,获得药物和疾病的生物特征矩阵和网络特征矩阵,模型训练模块获取输入参数后在服务器中训练药物发现模型,药物重定位模块在得到药物重定位模型后执行药物重定位指令,最后将药物重定位结果通过展示模块进行输出展示。本发明专利技术直接作用于包含有生物知识的生物网络数据集合,能够针对异构生物网络进行药物重定位,效果准确度高,能够有效挖掘已知药物的新用途。挖掘已知药物的新用途。挖掘已知药物的新用途。
【技术实现步骤摘要】
一种基于生物知识和网络拓扑结构的药物重定位方法和系统
[0001]本专利技术涉及计算机数据处理
,特别涉及到基于生物知识和网络拓扑结构的药物重定位方法和系统。
技术介绍
[0002]目前,现有的药物重定位方法仅仅主要是基于二部图网络来完成发现候选药物的工作,即仅考虑了生物网络中药物与疾病之间的联系。然而,这种仅基于二部图网络的药物重定位方法不仅忽视了生物网络中的蛋白质分子对于药物和疾病网络中的重要性,而且也遗漏了生物分子的生物属性信息。这会使得一些具有实际意义的药物和疾病的关联没有被发现。例如,以丙戊酸为例,它通过影响细胞中组蛋白的表达,从而改变乳腺癌细胞的生命周期。如果仅仅基于二部图网络,类似的药物和疾病的关联关系就很难被发现出来。
[0003]尽管有一些考虑生物属性信息或异构网络的药物重定位方法被提出,但它们所预测的药物和疾病关联关系在准确性上的表现欠佳。
技术实现思路
[0004]本专利技术的目的在于,提供一种基于生物知识和网络拓扑结构的药物重定位方法和系统,包括网络构建模块、特征学习模块、模型训练模块、药物重定位模块以及结果展示模块,通过综合考虑生物网络中分子的生物属性信息和网络拓扑信息实现药物筛选。本专利技术直接作用于包含有生物知识的生物网络数据集合,能够针对异构生物网络进行药物重定位,效果准确度高,能够有效挖掘已知药物的新用途。
[0005]本专利技术所述的一种基于生物知识和网络拓扑结构的药物重定位方法,按下列步骤进行:
[0006]a、收集已知药物和疾病的关联关系数据、药物和蛋白质的关联关系数据、蛋白质和疾病的关联关系数据、药物分子结构信息和疾病MeSH描述符信息;
[0007]b、基于步骤a中的药物和疾病的关联关系数据、药物和蛋白质的关联关系数据以及蛋白质和疾病的关联关系数据构建异构信息网络;
[0008]c、应用化学信息学对步骤a中药物分子结构信息采用了RDKit开源工具包进行计算,得到药物分子指纹矩阵;
[0009]d、应用语义相似性理论对步骤a中疾病MeSH描述符信息采用Jaccard公式进行计算,得到疾病语义相似矩阵;
[0010]e、基于步骤c中药物分子指纹矩阵和步骤d中疾病语义相似矩阵,应用自动编码器进行训练,得到药物和疾病的生物特征矩阵;
[0011]f、基于步骤b中异构信息网络,应用图嵌入模型采用DeepWalk算法计算出药物和疾病的网络特征,得到药物和疾病的网络特征矩阵;
[0012]g、基于步骤e中药物和疾病的生物特征矩阵和步骤f中药物和疾病的网络特征矩阵,应用随机森林分类器训练出药物重定位模型;
[0013]h、根据步骤g所得的药物重定位模型,获取所需的候选药物。
[0014]一种基于生物知识和网络拓扑结构的药物重定位系统,所述药物重定位系统是由网络构建模块、特征学习模块、模型训练模块、药物发现模块以及结果展示模块组成,所述网络构建模块与特征学习模块相连接,特征学习模块与模型训练模块相连接,模型训练模块与结果展示模块相连接;
[0015]网络构建模块将药物、蛋白质、疾病的生物关联网络构建成为一个异构信息网络,并将构建好的异构信息网络传递给特征学习模块;
[0016]特征学习模块对异构信息网络中的药物和疾病的生物特征和网络特征进行提取,得到药物和疾病的生物特征矩阵和网络特征矩阵,并将这些矩阵传递给模型训练模块;
[0017]模型训练模块根据输入模型参数和特征学习模块的结果训练关于药物和疾病的模型,并将该模型传递给结果展示模块;
[0018]网络构建模块通过引入蛋白质作为中介,构建了一个包含药物、蛋白质以及疾病的异构信息网络,来增强药物和疾病之间的连通性。
[0019]所述特征学习模块更为全面地考虑药物和疾病的特征,通过计算药物和疾病的生物特征矩阵和网络特征矩阵来进行训练药物重定位模型,能够更准确地给定疾病的候选药物。
[0020]本专利技术所述的一种基于生物知识和网络拓扑结构的药物重定位方法,在收集数据时,基于CTD数据库获取药物和疾病的关联关系数据,基于DrugBank v5.0数据库获取药物和蛋白质的关联关系数据,基于DisGeNET数据库获取蛋白质和疾病的关联关系数据,基于DrugBank v5.0数据库获取药物分子结构信息以及基于医学主题主题词(MeSH)同义词词典获取疾病MeSH描述符信息。其中:
[0021]药物分子结构信息和疾病MeSH描述符信息属于生物知识;
[0022]药物和疾病的关联关系数据、药物和蛋白质的关联关系数据和蛋白质和疾病的关联关系数据属于网络拓扑结构。
[0023]本专利技术所述的一种基于生物知识和网络拓扑结构的药物重定位系统,该系统包括:网络构建模块,将药物、蛋白质、疾病的生物关联网络构建成为一个异构信息网络,其中;
[0024]特征学习模块,输入学习参数,根据网络构建模块中的得到的异构信息网络进行特征学习,分别获得药物和疾病的生物特征矩阵和网络特征矩阵;
[0025]模型训练模块,输入模型参数,根据特征学习模块得到的药物和疾病的生物特征矩阵和网络特征矩阵,训练出药物发现模型;
[0026]药物重定位模块,对模型训练模块训练的药物重定位模型进行药物筛选;
[0027]结果展示模块,将药物重定位模块发现的候选药物进行输出。
[0028]与现有技术相比,本专利技术具有以下有益的技术效果:
[0029]本专利技术所述的本专利技术所述的一种基于生物知识和网络拓扑结构的药物重定位方法,在算法设计过程中,利用异构信息网络拓扑结构和生物分子的生物属性信息来完成药物重定位任务,通过更为全面地学习生物分子特征来提高药物重定位的准确性,解决现有技术在生物网络药物重定位时的缺陷。
[0030]本专利技术所述的一种基于生物知识和网络拓扑结构的药物重定位系统,主要由网络
构建模块、特征学习模块、模型训练模块、药物重定位模块和结果展示模块组成。首先,网络构建模块将三种生物关联关系构建成为一个异构信息网络。其次,特征学习模块对得到的异构信息网络进行特征学习,获得药物和疾病的生物特征矩阵和网络特征矩阵。然后,模型训练模块将所得药物和疾病的生物特征矩阵和网络特征矩阵进行训练,得到药物重定位模型。随后,药物重定位模块对给定疾病和候选药物的关联关系进行预测,实现药物重定位的目的。最后,结果展示模块则展示了药物重定位的结果。
附图说明
[0031]图1为本专利技术的逻辑结构图。
具体实施方式
[0032]为使本专利技术的目的、技术方案及优点更加清晰明白,以下参照附图并举实施例,对本专利技术作进一步详细说明。
[0033]实施例
[0034]本专利技术所述的一种基于生物知识和网络拓扑结构的药物重定位方法,按下列步骤进行:
[0035]a、收集已知药物和疾病的关联关系数据、药物和蛋白质的关联关系数据、蛋白质和疾病的关联关系数据、药物分子结构信息和疾病MeSH描述符信息;
[本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种基于生物知识和网络拓扑结构的药物重定位方法,其特征在于按下列步骤进行:a、收集已知药物和疾病的关联关系数据、药物和蛋白质的关联关系数据、蛋白质和疾病的关联关系数据、药物分子结构信息和疾病MeSH描述符信息;b、基于步骤a中的药物和疾病的关联关系数据、药物和蛋白质的关联关系数据以及蛋白质和疾病的关联关系数据构建异构信息网络;c、应用化学信息学对步骤a中药物分子结构信息采用了RDKit开源工具包进行计算,得到药物分子指纹矩阵;d、应用语义相似性理论对步骤a中疾病MeSH描述符信息采用Jaccard公式进行计算,得到疾病语义相似矩阵;e、基于步骤c中药物分子指纹矩阵和步骤d中疾病语义相似矩阵,应用自动编码器进行训练,得到药物和疾病的生物特征矩阵;f、基于步骤b中异构信息网络,应用图嵌入模型采用DeepWalk算法计算出药物和疾病的网络特征,得到药物和疾病的网络特征矩阵;g、基于步骤e中药物和疾病的生物特征矩阵和步骤f中药物和疾病的网络特征矩阵,应用随机森林分类器训练出药物重定位模型;h、根据步骤g所得的药物重定位模型,获取所需的候选药物。2.一种基于生物知识和网络拓扑结构的药物重定位系统,其特征在于所述药...
【专利技术属性】
技术研发人员:赵博伟,胡伦,周喜,蒋同海,苏小芮,
申请(专利权)人:中国科学院新疆理化技术研究所,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。