预测新冠病毒适应药物的药物重定位方法技术

技术编号:34555389 阅读:13 留言:0更新日期:2022-08-17 12:41
本发明专利技术实施例公开了一种预测新冠病毒适应药物的药物重定位方法,包括:步骤1:采用WKNKN算法处理人类药物

【技术实现步骤摘要】
预测新冠病毒适应药物的药物重定位方法


[0001]本专利技术涉及药物

疾病关联预测领域,尤其涉及一种预测新冠病毒适应药物的药物重定位方法。

技术介绍

[0002]2019年被发现的COVID

19病毒,因外形类同于以往发现的冠状病毒而被命名为“新型冠状病毒”,是继人类发现并研究的六种冠状病毒外的(229E(HCoV

229E)、HCoV

OC43、HCoVNL63、HCoV

HKU1、严重急性呼吸综合征(SARS)相关冠状病毒(SARS

Cov)和中东呼吸综合征(MERS)相关冠状病毒(MERS

Cov))第7种冠状类病毒。纵观全球疫情情况,新冠病毒正在严重影响人类的正常生活,并且随时威胁着人类的生命安全。尽管现在已经有团队研发了针对性的新冠疫苗,但放眼全球,疫苗还是属于紧缺资源,目前对于新冠肺炎的治疗药物在紧急研发中。更严重的是,新冠病毒的遗传物质是单链RNA,这种遗传物质会使新冠病毒在转录复制阶段很容易发生变异,这种变异存在改变新冠病毒的体外特征的可能,随时威胁着现有新冠病毒疫苗的有效性。目前研究人员已经发现变异的新冠病毒毒株(如德尔塔毒株、奥密克戎毒株),因此,加速研发治疗新冠的有效药物迫在眉睫。
[0003]药物开发通常包括三个阶段:发现、临床前和临床开发。每个阶段都需要花费大量的金钱和时间。药物重定位技术,是一种为现有药物寻找其他适应症状的技术(简称旧药新用)。得益于大数据时代的发展集成了很多生物临床试验结果,人们对于利用计算机算法模型作为辅助工具的药物重定位技术越来越感兴趣。与传统的药物临床试验相比,药物重定位技术能有效减少药物研发过程中的金钱和时间的花费。近年来不少学者已经提出了以计算机算法模型为辅助工具的药物重定位方法,并且均得到了有效的生物实验数据的验证。因此,采用药物重定位技术去筛选适应新冠病毒的治疗药物是可行的。
[0004]目前以计算机算法模型为辅助工具的药物重定位方法可分为三类:机器学习方法类、基于网络传播的方法和基于矩阵分解与补全的方法。这些方法是基于一种假设,即类似的药物与类似的疾病有关,反之亦然。
[0005]在基于机器学习方法中,预测潜在的药物

疾病关联可以被视为一个二元分类问题。药物

疾病关联被认为是样本,而药物和疾病先前的相似性被认为是特征。目前的机器学习方法类有基于有监督学习和半监督学习之分,它们的区别在于是否对训练集的样本标签存在依赖作用。有监督学习的方法严重依赖于数据集中的已知样本标签,但这些标签数据在实际情况下很难获得,从而限制了这些预测方法的应用范围。半监督学习方法不再需要负样本,但它们的性能并不稳定,这在一定程度上影响了半监督学习方法的应用。机器学习方法在药物重定位领域显示了巨大的潜力但当前方法依然存在着不足之处,限制了该类方法的实际应用。
[0006]药物和适应症状的关系结构利用网络结构可以很容易的表达出来,目前很多基于网络的药物重定位方法都是利用药物和适应症状的关联矩阵建立网络结构,基于各自的相似性信息进行权值的初始赋值,并使用游走或扩散的方式将关联资源从药物端传播到适应
症状端,从而推断网络中的缺失边,在计算效率上有很大的优势。
[0007]对于一个部分仅知的信息矩阵,矩阵补全是用一个低秩的模拟矩阵近似该信息矩阵,以模拟矩阵对应的元素作为目标矩阵中缺失的信息的估计值。而矩阵分解通常是指用两个低秩的子矩阵的内积来近似目标矩阵,那么子矩阵的内积矩阵的元素就可以用于估计目标矩阵中对应不可见位置的元素值,而子矩阵可以看作是目标矩阵的分解。显然,通过以上描述可知,矩阵分解可以用于矩阵补全任务,但是,矩阵补全也并不总是采用分解的方法。
[0008]在上述方法中应用于药物重定位的关联数据集仅有已验证的“正”数据,压缩感知作为矩阵补全的一类方法,因其使用“子矩阵模拟”技术来预测药物

疾病的潜在相互作用而不将所有缺失的数据作为负数据处理,在应用于药物重定位的方面与机器学习的监督类方法相比存在先天优势。另一方面,由于现有的数据集的关联信息受生物实验的因素影响而变得稀疏,基于网络或图的这类方法大多依靠关联数据作为二分图的资源传播路径往往会出现冷启动问题而影响模型的预测性能,部分采用游走方式的方法甚至会因游走方式偏好权值大的路径而陷入无意义循环,增大模型的时间复杂性。相比之下,以现有的矩阵信息出发,压缩感知利用子矩阵对原矩阵信息进行采集,生成一个低秩的模拟矩阵去补全原矩阵的缺失部分,与基于网络或图的方法相比在一定程度上避免了模型的冗余。
[0009]药物重新定位旨在为现有药物确定新的适应症,这技术将大大降低了药物开发的成本和时间。但是,到目前为止的所有应用于药物重定位的方法都直接使用未经处理的原始的药物

疾病关联矩阵的信息,由于在实际情况下这些相似关联信息只有小部分被证明并记录下来,还有很多相似关联信息亟待证明,导致用于预测方法的原始关联矩阵数据稀疏性大。另外,对于药物之间和疾病之间的相似性特征的提取,目前还缺乏充分挖掘方法。

技术实现思路

[0010]本专利技术实施例所要解决的技术问题在于,提供一种预测新冠病毒适应药物的药物重定位方法,以使能够作为寻找能与新冠病毒作用的药物研发辅助工具。
[0011]为了解决上述技术问题,本专利技术实施例提出了一种预测新冠病毒适应药物的药物重定位方法,包括:
[0012]步骤1:采用WKNKN算法处理人类药物

病毒关联数据集HDVD,所述数据集包括药物

疾病关联邻接矩阵Y、药物化学结构相似度矩阵、疾病语义相似度矩阵;挖掘潜在相互作用的似然分数,降低药物

疾病关联矩阵Y的稀疏性,得到处理后的人类药物

病毒关联数据集HDVD;
[0013]步骤2:根据处理后的人类药物

病毒关联数据集HDVD分别计算药物和病毒的杰卡德相似性和高斯核相似性,得到药物和疾病的杰卡德相似矩阵DS
jac
和dS
jac
,得到疾病的高斯核相似矩阵dS
Gaus
以及药物的高斯核相似矩阵DS
Gaus

[0014]步骤3:分别结合药物的化学相似性和病毒的序列相似性利用中心核对称多核学习方式进行整合,从而分别获得药物和病毒的综合相似性矩阵;
[0015]步骤4:结合处理后的人类药物

病毒关联数据集HDVD信息,通过压缩感知算法补全原人类药物

病毒关联数据集中缺失的关联,得到预测概率矩阵;
[0016]步骤5:将得到预测概率矩阵作为药物

病毒的预测结果矩阵。
[0017]进一步地,步骤1包括以下子步骤:
[0018]子步骤1、对于每个药物D...

【技术保护点】

【技术特征摘要】
1.一种预测新冠病毒适应药物的药物重定位方法,其特征在于,包括:步骤1:采用WKNKN算法处理人类药物

病毒关联数据集HDVD,所述数据集包括药物

疾病关联邻接矩阵Y、药物化学结构相似度矩阵、疾病语义相似度矩阵;挖掘潜在相互作用的似然分数,降低药物

疾病关联矩阵Y的稀疏性,得到处理后的人类药物

病毒关联数据集HDVD;步骤2:根据处理后的人类药物

病毒关联数据集HDVD分别计算药物和病毒的杰卡德相似性和高斯核相似性,得到药物和疾病的杰卡德相似矩阵DS
jac
和dS
jac
,得到疾病的高斯核相似矩阵dS
Gaus
以及药物的高斯核相似矩阵DS
Gaus
;步骤3:分别结合药物的化学相似性和病毒的序列相似性利用中心核对称多核学习方式进行整合,从而分别获得药物和病毒的综合相似性矩阵;步骤4:结合处理后的人类药物

病毒关联数据集HDVD信息,通过压缩感知算法补全原人类药物

病毒关联数据集中缺失的关联,得到预测概率矩阵;步骤5:将得到预测概率矩阵作为药物

病毒的预测结果矩阵。2.如权利要求1所述的预测新冠病毒适应药物的药物重定位方法,其特征在于,步骤1包括以下子步骤:子步骤1、对于每个药物D
i
,采用与其最接近的K种已知药物的化学相似度矩阵DS
chem
及其对应的关联作用来估计D
i
的相互作用似然分数,推导公式如下:其中D1到表示药物D
i
的K个近邻药物,按降序排列;的K个近邻药物,按降序排列;是权重系数,其中η是衰减项并满足η≤1,是权重系数,其中η是衰减项并满足η≤1,是正则化项;子步骤2、相似地,对于每个疾病d
j
,采用与其最接近的K种已知疾病的语义相似性及其对应的交互作用来估计d
j
的交互似然分数,推导公式如下:其中d
1 to表示d
j
的K个近邻药物,按降序排列;的K个近邻药物,按降序排列;是权重系数,其中η是衰减项并满足η≤1,重系数,其中η是衰减项并满足η≤1,是正则化项;子步骤3、采用下式计算得到处理后的药物

疾病关联邻接矩阵Y
F
:3.如权利要求2所述的预测新冠病毒适应药物的药物重定位方法,其特征在于,步骤2中,采用下式计算药物的杰卡德相似矩阵DS
jac
:其中Γ(x)是与药物D
x
相关联的疾病集合,Γ(y)是与药物D
y
相关联的疾病集合;
同理,按照上述方式计算出疾病的杰卡德相似矩阵dS
jac
。4.如权利要求3所述的预测新冠病毒适应药物的药物重定位方法,其特征在于,步骤2中,将疾病d
i
和d
j
之间的高斯核相似性表示为dS
Gaus
,药物D
i
和D
j
之间的高斯核相似性表示为DS
Gaus
,计算方法如下:dS
Gaus
(d
i
,d
j
)=exp(

α
d
||Q(d
i
)

Q(d
j
)||2);DS
Gaus
(D
i
,D
j
)=exp(

α
D
||Q(D
i
)

Q(D
j
)||2);在药物

【专利技术属性】
技术研发人员:顾国生李健明许浩杰谢国波孙宇平林志毅
申请(专利权)人:广东工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1