【技术实现步骤摘要】
一种基于异构图生成对抗网络的lncRNA
‑
疾病关联预测模型的构建方法
[0001]本专利技术涉及利用异构图生成对抗网络(GAN,Generative Adversarial Network,)生成 新的lncRNA
‑
疾病(长链非编码RNA
‑
疾病,long non
‑
coding RNA
‑
疾病)关联对的方法。生 成对抗网络利用对抗思想将生成器与鉴别器训练达到平衡,使输出生成分布尽可能接近真实 分布。
技术介绍
[0002]在生物学家的研究中,可以了解到人类基因中大约有75%能被转录为RNAs,其中又有 约74%为非编码RNA。通过生物实验,进一步了解到,lncRNA与人类疾病有着密不可分的 关系。例如LncRNA可以影响人类的发育或是导致肿瘤病变;miRNA是一类长度为18~24nt 的小分子非编码RNA,其参与了人类炎症的病变。由此可以看出长链非编码在生物研究中是 非常重要的研究,尤其是在临床诊断治疗等方面十分关键。
[0003]但是长链非编码RNAs种类繁多,与其相关联的疾病也不少,若是通过生物实验的方法 证明其相关性不仅需要耗费大量的时间还要承担高成本费用,为了解决这个问题,日渐崭露 头角的计算机技术走入大众视野,基于生物实验得到的准确数据,计算机技术成为核仁小分 子RNAs与疾病关联预测的新曙光。目前已经产生了很多模型来进行LncRNAs与疾病关联预 测,主要分为两大类,第一类是基于生物网络的预测,另一类是 ...
【技术保护点】
【技术特征摘要】
1.一种基于异构图生成对抗网络的lncRNA
‑
疾病关联预测模型的构建方法,所述预测模型包括:异构图偏好向量模型、生成对抗网络GAN,其特征在于:所述异构图偏好向量模型是包含节点和边的图;所述生成对抗网络,包括生成器和鉴别器两部分;所述节点有四种类型:lncRNA、疾病、miRNA、Gene;所述边有6种类型:lncRNA
‑
疾病、miRNA
‑
疾病、Gene
‑
疾病、lncRNA
‑
miRNA、miRNA
‑
Gene、lncRNA
‑
Gene;模型构建方法步骤如下:Step
‑
1:构建异构图并选取6条元路径;Step
‑
2:在异构图中采用P1,P2,...Pl的语义信息,其中l是元路径数目,利用交换矩阵在每一条元路径上计算lncRNA和疾病之间的相似性矩阵,由此可以得到lncRNA对所有疾病的偏好向量;Step
‑
3:采用注意力机制来聚合不同元路径上lncRNA和疾病之间的不同语义关系;Step
‑
4:利用权重矩阵w
i
与偏好向量a
i
计算每条元路径上的注意得分e
m
,其中i的取值范围是1~6;Step
‑
5:再使用注意得分e
m
分别计算6条元路径的权重α
i
;Step
‑
6:整合各原路径上的权重α
i
和注意得分e
m
,得到lncRNA的混合关联程度向量r
k
;Step
‑
7:将r
k
作为生成对抗网络GAN生成器的输入,经过阈值处理,得到输出lncRNA的关联偏好向量f
m
;Step
‑
8:将lncRNA的序列特征经4
‑
mer转化为特征向量c
k
;Step
‑
9:在lncRNA
‑
疾病关联矩阵C∈{0,1}
m
×
n
取出每对关联数据的偏好向量r;Step
‑
10:将获取的r和c
k
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。