本发明专利技术提出了一种基于空间相似性约束和非负矩阵分解的药物重定位方法和系统,包括数据收集模块、数据预处理模块、模型构建模块、模型求解模块、网络表示学习模块以及潜在药物预测模块,充分利用药物和病毒自身的属性信息以及高维空间中药物和病毒的关联关系,包括药物分子指纹图、病毒核酸序列信息以及网络拓扑特征,有效地解决在网络中由于引入新病毒节点所产生的行为信息缺失冷启动问题,准确地预测网络中分子的关联关系,为新病毒提供可靠的药物候选集合。本发明专利技术可以有效解决药物重定位问题,为新病毒提供潜在可用于治疗的药物筛选。为新病毒提供潜在可用于治疗的药物筛选。为新病毒提供潜在可用于治疗的药物筛选。
【技术实现步骤摘要】
一种基于空间相似性约束和非负矩阵分解的药物重定位方法和系统
[0001]本专利技术涉及计算机科学中机器学习以及生物学中生物信息学领域,具体涉及药物研发中药物重定位问题。
技术介绍
[0002]大数据时代的到来和飞速发展是计算机科学技术在非专业领域的一次颠覆性应用创新。信息科学现如今被广泛应用到生物医学领域,具体包括探究生物小分子的关联关系,为疾病预防与治疗提供个性化诊断;探究药物重定位,为新出现具有紧急性且传染性强的疾病或病毒提供高效可靠的药物;探究药物分子靶标,为新药物的研制在分子层面提供指引,从而缩短药物开发所需时间等等。尽管目前计算机应用技术已在生物医学领域取得大量前沿性研究成果,但面向药物研发现代化的药物重定位问题依旧严峻,尤其在面对突发性病毒或疾病时,现有模型无法对新病毒或疾病进行建模,从而无法进行准确预测和防控防治。因此,解决药物重定位问题可以有效地加快药物研发进程,加强对新病毒、新疾病的处理能力,合理地为新病毒、新疾病提供防御及治疗方案。
技术实现思路
[0003]本专利技术的目的在于,提供一种基于空间相似性约束和非负矩阵分解的药物重定位方法和系统,包括数据收集模块、数据预处理模块、模型构建模块、模型求解模块、网络表示学习模块以及潜在药物预测模块,充分利用药物和病毒自身的属性信息以及高维空间中药物和病毒的关联关系,包括药物分子指纹图、病毒核酸序列信息以及网络拓扑特征,有效地解决在网络中由于引入新病毒节点所产生的行为信息缺失冷启动问题,准确地预测网络中分子的关联关系,为新病毒提供可靠的药物候选集合。本专利技术可以有效解决药物重定位问题,为新病毒提供潜在可用于治疗的药物筛选。
[0004]本专利技术所述一种基于空间相似性约束和非负矩阵分解的药物重定位方法,按下列步骤进行:
[0005]a、从药物分子数据库以及病毒序列数据库中下载相关药物与病毒关联关系数据;
[0006]b、对接收到的数据应用统计学知识和信息学理论,计算相似度并生成药物相似度矩阵、病毒相似度矩阵以及药物
‑
病毒关联关系相似度矩阵;
[0007]c、将步骤b相关相似度矩阵,基于空间相似性约束构建药物、病毒隐向量的非负矩阵分解优化模型;
[0008]d、将步骤c中得到的优化模型,通过应用拉格朗日乘子法,对优化模型进行求解,得到求解参数;
[0009]e、将步骤d的求解参数之后,利用图神经网络模型学习药物、病毒在药物
‑
病毒网络中的结构特征;最终获得节点在网络中的表示;
[0010]f、根据步骤e的药物和病毒的结构特征,对药物进行打分并推荐排名前十的药物
作为治疗该病毒对应疾病的药物候选集。
[0011]步骤a中下载数据时要对输入数据进行检查,是否存在该药物或者该病毒和确认是否存在相应药物
‑
病毒关联关系,再从药物分子数据库或病毒序列数据库中下载相应生物分子信息。
[0012]一种基于空间相似性约束和非负矩阵分解的药物重定位系统,该系统是由数据收集模块、数据预处理模块、模型构建模块、模型求解模块、网络表示学习模块以及潜在药物预测模块组成,其中数据预处理模块分别与数据收集模块和模型构建模块连接,模型构建模块与模型求解模块、网络表示学习模块以及潜在药物预测模块串接;
[0013]所述数据收集模块用于将收集与病毒有关的关联数据,以及下载相应药物分子化学结构和病毒核酸序列,并将药物
‑
病毒关联关系数据以及药物/病毒的分子基本信息传递给数据预处理模块;
[0014]所述数据处理模块对接收到的数据进行预处理,计算获得药物分子相似度矩阵、病毒相似度矩阵以及药物
‑
病毒关联关系相似度矩阵;
[0015]所述模型构建模块根据输入的参数和数据预处理结果构建基于空间相似性约束的非负矩阵分解优化模型,并将其传递到模型求解模块;
[0016]所述模型求解模块对模型构建模块所构建的优化模型通过拉格朗日乘子法求解,获得的求解参数为药物和病毒的初始向量,并传递到网络表示学习模块;
[0017]所述网络表示学习模块将模型求解模块获得的求解参数作为药物、病毒的节点特征整合到基于图神经网络模型的表示学习过程中,最终获得节点在网络中的表示,并将结果传递给潜在药物预测模块;
[0018]所述潜在药物预测模块根据网络表示学习模块的输出,计算药物的最终得分,并按照得分选出排名前十的药物作为潜在可治疗病毒的药物候选集。
[0019]模型构建模块在传统的非负矩阵分解上,引入空间相似性约束,使得所获得的隐向量既包含属性特征,又可以保持节点在各自属性空间的相似性。
[0020]模型求解模块通过将基于空间相似性约束和非负矩阵分解的结果作为网络节点的特征向量,赋予病毒和药物可靠的初始表示。
[0021]所述网络表示学习模块通过基于空间时序的分层学习策略保留网络的空间结构,使得最终学习到的节点全局表示既可以在低维空间维持节点属性的相似性,或在高维空间保持网络的空间结构。
[0022]本专利技术提供一种基于空间相似性约束和非负矩阵分解的药物重定位方法和系统,包括数据收集模块、数据预处理模块、模型构建模块、模型求解模块、网络表示学习模块以及潜在药物预测模块,其中,所述数据收集模块将根据与病毒相关的药物
‑
病毒关联数据,收集相应药物分子结构数据以及病毒核酸序列,数据预处理模块通过对原始数据进行处理从而获得药物分子结构相似度矩阵、病毒核酸序列相似度矩阵以及药物
‑
病毒关联关系相似度矩阵,模型构建模块在获取空间相似度信息后构建带有相似性约束的非负矩阵分解优化问题模型,模型求解模块将对优化问题进行迭代求解,计算结果作为药物和病毒的初始特征,网络表示学习模块在得到药物、病毒初始特征后对整个药物
‑
病毒关联关系网络进行深度学习,计算获得各个节点在网络中的最终特征,最后将节点最终特征送入潜在药物预测模块计算药物得分,潜在药物预测模块根据药物得分推选出可治疗给定病毒的药物候选
集。本专利技术可以有效解决药物重定位问题,为新病毒提供潜在可用于治疗的药物筛选。
[0023]本专利技术所述的一种基于空间相似性约束和非负矩阵分解的药物重定位方法和系统,其有益效果是:
[0024]本专利技术提出的通过基于空间相似性约束和非负矩阵分解的方法对节点进行初始化从而解决冷启动问题即具有物理意义又兼具现实意义。即保证了药物节点、病毒节点在自身相似度空间的距离关系,又通过构建药物
‑
病毒相似度空间增强了高维复杂的相似度关系,从而保证相似度高的药物节点对某类病毒有相似的治疗效果,符合病毒治疗的现实意义;
[0025]本专利技术充分利用非负矩阵分解所得到的隐向量,将其作为下一步获得节点网络表示中节点的初始向量,从而节点保留属性信息和彼此之间的相关性。当学习更高维特征时,模型易训练且较稳定;
[0026]本专利技术充分利用基于空间相似性约束的非负矩阵分解本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种基于空间相似性约束和非负矩阵分解的药物重定位方法,其特征在于按下列步骤进行:a、从药物分子数据库以及病毒序列数据库中下载相关药物与病毒关联关系数据;b、对接收到的数据应用统计学知识和信息学理论,计算相似度并生成药物相似度矩阵、病毒相似度矩阵以及药物
‑
病毒关联关系相似度矩阵;c、将步骤b相关相似度矩阵,基于空间相似性约束构建药物、病毒隐向量的非负矩阵分解优化模型;d、将步骤c中得到的优化模型,通过应用拉格朗日乘子法,对优化模型进行求解,得到求解参数;e、将步骤d的求解参数之后,利用图神经网络模型学习药物、病毒在药物
‑
病毒网络中的结构特征;最终获得节点在网络中的表示;f、根据步骤e的药物和病毒的结构特征,对药物进行打分并推荐排名前十的药物作为治疗该病毒对应疾病的药物候选集。2.如权利要求1所述的基于空间相似性约束和非负矩阵分解的药物重定位方法,其特征在于,步骤a中下载数据时要对输入数据进行检查,是否存在该药物或者该病毒和确认是否存在相应药物
‑
病毒关联关系,再从药物分子数据库或病毒序列数据库中下载相应生物分子信息。3.一种基于空间相似性约束和非负矩阵分解的药物重定位系统,其特征在于,该系统是由数据收集模块、数据预处理模块、模型构建模块、模型求解模块、网络表示学习模块以及潜在药物预测模块组成,其中数据预处理模块分别与数据收集模块和模型构建模块连接,模型构建模块与模型求解模块、网络表示学习模块以及潜在药物预测模块串接;所述数据收集模块用于将收集与病毒有关的关联数据,以及下载相应药物分子化学结构和病毒核酸序列,并将药物
‑
病毒关联关...
【专利技术属性】
技术研发人员:苏小芮,胡伦,周喜,蒋同海,赵博伟,
申请(专利权)人:中国科学院新疆理化技术研究所,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。