System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于跨模态和图卷积的miRNA和疾病预测方法技术_技高网
当前位置: 首页 > 专利查询>常州大学专利>正文

基于跨模态和图卷积的miRNA和疾病预测方法技术

技术编号:39998144 阅读:7 留言:0更新日期:2024-01-09 02:59
本发明专利技术涉及图像技术领域,尤其涉及基于跨模态和图卷积的miRNA和疾病预测方法,包括利用跨模态数据填补算法得到填补关联矩阵;构成miRNA集成相似性和疾病集成相似性;利用miRNA集成相似性、填补关联矩阵、疾病集成相似性构建异构网络图G和特征矩阵H(0)作为图卷积神经网络输入;根据三个节点嵌入门之间的余弦相似性与相似性阈值ST比较,判断门输出集成卷积层或单层卷积层;利用双线性解码器得到miRNA‑疾病得分矩阵;采用加权交叉熵损失函数对CIGGNET模型进行训练。本发明专利技术解决现有的生物信息预测模型使用矩阵分解的方法去对关联矩阵进行处理时无法对关联矩阵做填补以及对关联数据的未知信息利用不完善的问题。

【技术实现步骤摘要】

本专利技术涉及图像处理,尤其涉及基于跨模态和图卷积的mirna和疾病预测方法。


技术介绍

1、如今,越来越多的研究表明mirna在各种生物生命过程中起着重要的作用。了解疾病的分子机制是生物医学研究的重要目标。大量证据表明,mirna在人类疾病的发生和发展中起着至关重要的作用;许多研究都表明mirna与癌症和其他类型的疾病有关,mirna正在成为新的潜在生物标志物以及疾病的诊断/治疗工具。

2、近几年来,潜在的mirna-疾病关联预测工作取得了一系列进展。随着机器学习的发展和系统生物学的不断改进,已经开发了许多计算方法来预测新的mirna-疾病关联。现有的计算方法可以分为两类,即基于复杂网络算法的模型和基于机器学习的预测模型。

3、目前有一些研究使用图神经网络来学习mirna-疾病关联对的特征表示,如mmgcn、lagcn、gcn-mf、iddkin、fcgcnmda,在预测mirna-疾病关联对上取得了较高的性能。但是,大部分模型并未对mirna-疾病关联信息做处理,如何有效的利用mirna-疾病的关联信息仍然是目前的一个挑战。例如,vgamf,nimcgcn它们都在图卷积网络上引入了矩阵分解的思路,它们基于mirna-疾病关联矩阵的稀疏性,通过矩阵分解算法得到需要的低秩矩阵和去除不必要的稀疏项这样通过图卷积学习到所需的特征值。

4、现有的生物信息预测模型使用矩阵分解的方法去对关联矩阵进行处理,这个方法虽然有效的剔除了关联矩阵中存在的低秩信息(可以理解噪声数据),并无法对关联矩阵做填补;且现有的方法对关联数据的未知信息利用的不完善。


技术实现思路

1、针对现有方法的不足,本专利技术利用已知的数据去对未知的数据进行评估和预测,可以有效的利用到未知数据中可能存在有效信息。

2、本专利技术所采用的技术方案是:基于跨模态和图卷积的mirna和疾病预测方法包括以下步骤:

3、步骤一、构建mirna与疾病关联矩阵a,利用跨模态数据填补算法得到填补关联矩阵a*;

4、进一步的,步骤一具体包括:

5、步骤11、将关联矩阵a灰度化处理转为一阶张量,并根据一阶张量折叠为三阶张量χ;

6、步骤12、设跨模态数据填补目标函数,设置初始估计张量满足:

7、

8、其中,χijk对应元素的索引集合为(i,j,k)∈ω;

9、步骤13、设置额外变量q=1,2,3;

10、步骤14、设跨模态数据填补约束条件,根据最大迭代次数更新中间张量βq、估计张量和额外变量yq;

11、

12、

13、

14、其中,ρ为迭代参数,foldq(.)为矩阵还原成张量函数,s为元素0和1构成的三阶张量,χ为关联矩阵a的三阶稀疏张量,为χ的估计张量,yq(q)为额外张量yq在模态q下的展开,为奇异值分解函数,βq为第q个中间张量;

15、步骤15、得到填补三阶估计张量将展开得到填补一阶张量图像,并转为填补关联矩阵a*。

16、进一步的,跨模态数据填补目标函数的公式为:

17、

18、其中,β1,β2,β3为中间张量,β1(1)为中间张量β1在模态1下的展开;β2(2)为β2的模态2展开,β3(3)为β3的模态3展开;α1、α2、α3为权值系数。

19、进一步的,跨模态数据填补约束条件的公式为:

20、

21、其中,s为元素0和1构成的三阶张量,χ为关联矩阵a的三阶稀疏张量,为χ的估计张量,βq为第q个中间张量。

22、步骤二、利用mirna相似性和疾病相似性分别构成mirna集成相似性sm和疾病集成相似性sd;

23、进一步的,如果mirna i和mirna j具有功能相似性、序列相似性或语义相似性;mirna的集成相似性sm为mirna序列相似性矩阵sm1、mirna功能相似性矩阵sm2、语义相似性矩阵sm3和mirna gip相似性sm4的平均值;否则,mirna集成相似性sm就是mirna gip相似性sm4。

24、步骤三、利用sm、a*、sd构建异构网络图g和特征矩阵h(0),并将异构网络图g和特征矩阵h(0)作为图卷积神经网络输入;

25、进一步的,步骤三具体包括:

26、步骤31、构建异构网络gh,gh=mm(mi,mj)×a*×md(di,dj),mm(mi,mj)为mirna标准化矩阵,md(di,dj)为疾病标准化矩阵;

27、步骤32、使用双随机游走算法分别对mirna集成相似性和疾病集成相似性网络做随机游走,得到初始关联分数;根据初始关联分数、标准化矩阵计算疾病特征矩阵网络和mirna特征矩阵网络上的随机游走;特征矩阵网络的公式为:

28、l_rt=(1-α)*md*rt-1+α*yd;

29、r_rt=(1-α)*mm*rt-1+α*ym;  (5)

30、其中,α为随机游走的衰减因子,mm、md分别为mirna、疾病标准化矩阵,rt-1为疾病-mirna的关联概率,ym、yd分别为mirna、疾病初始关联分数。

31、步骤四、将gcn第1-3层节点的嵌入h1-h3输入到控制门;根据三个节点嵌入门之间的余弦相似性与相似性阈值st比较,判断门输出集成卷积层或单层卷积层;利用双线性解码器得到mirna-疾病得分矩阵,得到ciggnet模型;

32、进一步的,判断门输出集成卷积层或单层卷积层的条件为:如果三个节点嵌入门之间余弦相似性cs大于给定相似性阈值st,判断门输出某单层卷积层;相反,如果三层卷积之间相似性cs小于给定相似性阈值st,判断门输出集成卷积层。

33、进一步的,判断门输出集成卷积层或单层卷积层的公式为:

34、

35、其中,hm是mirna的嵌入矩阵,hd疾病的嵌入矩阵,σ1,σ2,σ3表示三层gcn节点嵌入的权重,h1,h2,h3表示三层gcn节点嵌入。

36、进一步的,mirna-疾病得分矩阵的公式为:

37、

38、其中,w′∈rk×k为训练矩阵,hm为mirna的最终嵌入矩阵,hd为疾病的最终嵌入矩阵。

39、步骤五、采用加权交叉熵损失函数对ciggnet模型进行训练。

40、进一步的,加权交叉熵损失函数的公式为:

41、

42、其中,m为mirna已知关联对,n为疾病已知关联对,(i,j)为疾病di和mirna mj对,λ为权重因子,y+和y-分别为正样本和负样本的数量,α′ij为mirna-疾病得分矩阵a'中的值。

43、本专利技术的有益效果:

44、1、本专利技术提出一种跨模态填补算法对mirna-疾病关联缺失信息进行补全,为了更直观有效地获取缺失信息与已有信息的相互关系,将关联矩阵变换至图像本文档来自技高网...

【技术保护点】

1.基于跨模态和图卷积的miRNA和疾病预测方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于跨模态和图卷积的miRNA和疾病预测方法,其特征在于,步骤一具体包括:

3.根据权利要求2所述的基于跨模态和图卷积的miRNA和疾病预测方法,其特征在于,跨模态数据填补目标函数的公式为:

4.根据权利要求2所述的基于跨模态和图卷积的miRNA和疾病预测方法,其特征在于,跨模态数据填补约束条件的公式为:

5.根据权利要求1所述的基于跨模态和图卷积的miRNA和疾病预测方法,其特征在于,如果miRNA i和miRNA j具有功能相似性、序列相似性或语义相似性,miRNA集成相似性为miRNA序列相似性矩阵、miRNA功能相似性矩阵、语义相似性矩阵和miRNA GIP相似性的平均值;否则,miRNA集成相似性SM就是miRNA GIP相似性。

6.根据权利要求1所述的基于跨模态和图卷积的miRNA和疾病预测方法,其特征在于,步骤三具体包括:

7.根据权利要求1所述的基于跨模态和图卷积的miRNA和疾病预测方法,其特征在于,判断门输出集成卷积层或单层卷积层的条件为:如果三个节点嵌入门之间余弦相似性大于给定相似性阈值ST,判断门输出某单层卷积层;相反,如果三层卷积之间相似性小于给定相似性阈值ST,判断门输出集成卷积层。

8.根据权利要求7所述的基于跨模态和图卷积的miRNA和疾病预测方法,其特征在于,判断门输出集成卷积层或单层卷积层的公式为:

9.根据权利要求1所述的基于跨模态和图卷积的miRNA和疾病预测方法,其特征在于,miRNA-疾病得分矩阵的公式为:

10.根据权利要求1所述的基于跨模态和图卷积的miRNA和疾病预测方法,其特征在于,加权交叉熵损失函数的公式为:

...

【技术特征摘要】

1.基于跨模态和图卷积的mirna和疾病预测方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于跨模态和图卷积的mirna和疾病预测方法,其特征在于,步骤一具体包括:

3.根据权利要求2所述的基于跨模态和图卷积的mirna和疾病预测方法,其特征在于,跨模态数据填补目标函数的公式为:

4.根据权利要求2所述的基于跨模态和图卷积的mirna和疾病预测方法,其特征在于,跨模态数据填补约束条件的公式为:

5.根据权利要求1所述的基于跨模态和图卷积的mirna和疾病预测方法,其特征在于,如果mirna i和mirna j具有功能相似性、序列相似性或语义相似性,mirna集成相似性为mirna序列相似性矩阵、mirna功能相似性矩阵、语义相似性矩阵和mirna gip相似性的平均值;否则,mirna集成相似性sm就是mirna gip相似性。...

【专利技术属性】
技术研发人员:侯振杰陈严姚海滨李涵
申请(专利权)人:常州大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1