System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术属于生物信息学中的动态演化建模领域,尤其涉及一种基于多尺度基因图谱的帕金森疾病(parkinson’s disease—pd)的动态演化预测建模方法。
技术介绍
1、帕金森疾病是一种慢性进行性神经系统障碍,主要影响运动控制。随着人口老龄化的加剧,帕金森疾病的发病率逐渐上升,成为全球范围内备受关注的健康问题。传统的研究方法主要依赖于临床观察或者是单一尺度下的影像学检查,这些方法在早期诊断和预测疾病进展方面存在一定的局限性。这一方面临床诊断往往只能提供对疾病的表面症状和临床特征的描述,无法深入了解帕金森疾病的生物学机制和基础。对于研究人员而言,了解疾病的分子机制和相关基因的功能可能更有助于发现潜在的治疗目标和药物开发。另一方面,单一尺度的图谱数据难以提供关于疾病机制和功能连接的完整信息。疾病涉及到多种生物学和神经系统层面的变化,如基因表达、蛋白质互作、代谢物水平、神经连接等。单一尺度的数据可能无法揭示这些复杂的机制和连接。
2、动态演化建模可为个体化医疗提供支持。通过对个体疾病演化过程的建模,可以更好地了解疾病在不同患者之间的变化和异质性,为个体化的诊断和治疗方案制定提供理论支持。但是现有方法大都只是局限于基因表达数据,它仅仅反映了基因在不同时间点或条件下的转录水平变化,只提供了基因活动的一部分信息,因此关注基因表达数据可能无法全面了解基因功能和相互作用的复杂性。与基因表达相比,基因图谱可以提供更全面的分子信息,包括基因-基因、基因-蛋白质相互作用、信号通路、转录因子调控等,更好地揭示了基因网络的演化和调控机制
3、但是使用基因图谱来构建动态演化预测模型时面临的难点是如何获得高精度的基因图以及如何将基因表达中的时序模式和基因图谱中的空间模式结合,以此构建帕金森疾病的发展过程。本专利技术使用多尺度嵌入式基因共表达网络分析算法来构建动态的基因共表达网络图,并将其中的基因模块的子网络和全局网络进行融合得到高精度的动态基因图,然后使用时间卷积模型来提取基因表达中的时序特征,使用三层的多头图自注意力机制模型搭配门控循环单元机制来提取动态基因的图的空间特征,最后利用紧凑的双线性池化算法进行时空特征的融合,从而对帕金森疾病的演化过程进行建模。
技术实现思路
1、基于
技术介绍
存在的问题,本专利技术提出了一种基于多尺度基因图谱的帕金森疾病(parkinson’s disease—pd)的动态演化预测建模。深入研究帕金森疾病的血液组学数据,融合多个尺度的图谱信息,同时将时序信息和图谱信息协同训练,为帕金森疾病的演化建模提供了一个新的框架。
2、为了解决上述问题,本专利技术采用如下技术方案:
3、一种基于多尺度基因图谱的帕金森疾病parkinson’s disease—pd的动态演化预测建模方法,包括以下步骤:
4、s1:建立每个时刻的表达矩阵x包含m个病人,每个病人有n个基因,采用多尺度嵌入式基因共表达网络分析算法对每个时刻的基因表达矩阵x进行共表达网络分析,得到一个包含基因与基因之间相关性的全局网络然后再对全局网络进行多尺度聚类分析算法-mca,该算法为一种常用的聚类方法,旨在解决数据集中具有不同尺度特征的聚类问题。通过在不同尺度下对数据进行分析,多尺度聚类分析算法可以同时识别和描述不同尺度上的聚类结构,将具有相似功能的基因划分至同一个基因模块中;
5、s2:针对各个局部基因模块的子网络与全局的基因共表达网络的差异性和共性,采用低维投影的方法将多个尺度的图数据进行融合,得到一个用邻接矩阵表示的n*n的多尺度融合图数据s;
6、s3:将前t个时刻的表达矩阵x和多尺度融合图数据s同时作为整体模型的输入,来预测t+1时刻的帕金森疾病的严重程度;
7、s4:采用时间卷积模型-tcn方法来提取动态图节点的时间维度特征,采用三层的多头图自注意力机制模型搭配门控循环单元机制来提取图的空间维度的特征;
8、s5:采用紧凑的双线性池化操作,将时间维度张量和空间维度张量融合在一起,得到含有时空特征的张量,再使用真类概率置信度-tcp算法搭配全连接层算法进行分类预测。
9、进一步的,步骤s1中的基因表达矩阵的数据种类具体包括但不限于:
10、帕金森病进展标志物的倡议项目-ppmi的血液转录组-sncran数据;帕金森病数据与生物标记物计划-pdbp的血液转录组数据。
11、进一步的,步骤s1中的多尺度嵌入式基因共表达网络分析算法的基本步骤包括:
12、s11:引入并行化、提前终止和先验质量控制的快速平面滤波网络构造-fpfnc;
13、s12:引入以分辨率参数为特征的模块结构紧凑性的多尺度聚类分析算法-mca;
14、s13:采用多尺度中心分析-mha来识别高度复杂的网络聚类特征关联分析-cta探讨聚类与临床结果的相关性。
15、进一步的,所述步骤s11中具体计算方法的步骤为:
16、s111:首先使用皮尔森相关系数方法计算基因之间的相关系数,然后进行排名,公式为:
17、
18、假设一共有m个样本,给定两个基因i和j,其在第k个样本上的基因表达值分别为xik和xjk,和分别是基因i和j在所有样本上的平均表达值,rij表示基因i和基因j之间的相关性分数;
19、s112:然后对其平面性进行迭代测试,以形成有利于包含具有较大相似性的基因对的嵌入式网络。
20、进一步的,所述步骤s12中,计算方法的步骤为:
21、s121:利用最短路径距离-spd优化簇内紧密性;
22、s122:利用局部路径索引-lpi优化局部聚类结构;
23、s123:采用整体模块化-q来确定最优划分。
24、进一步的,所述步骤s2中,具体计算方法的步骤为:
25、s21:首先对多个基因模块的子图进行融合,公式如下:
26、
27、其中为局部图的融合,av为权重矩阵,av(1,...,v)表示v个局部图;
28、s22:然后将融合后的局部图和全局的共表达网络相融合,得到融合基因图s,公式如下:
29、
30、其中为全局图,γ为权重矩阵,s为融合基因图;
31、所述步骤s21中权重矩阵av的具体计算方法的步骤为:
32、
33、其中,表示第v个聚类中的第i个和第j个基因之间的连接权重,表示基准权重,用于衡量第i个和第j个基因之间的相似性。
34、进一步的,所述步骤s4中图节点特征的时间维度特征的提取步骤具体如下:
35、s41:首先使用时间卷积模型-tcn来对基因表达矩阵进行长期时间特征的提取;
36、s42:使用三层的图自注意力网络搭配门控循环单元来提取动态图的空间特征;
37、步骤s41中时间卷积模型的计算公式如下:
38、s4本文档来自技高网...
【技术保护点】
1.一种基于多尺度基因图谱的PD的动态演化预测建模方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种基于多尺度基因图谱的PD的动态演化预测建模方法,其特征在于,步骤S1中的基因表达矩阵的数据种类具体包括但不限于:
3.根据权利要求1所述的一种基于多尺度基因图谱的PD的动态演化预测建模方法,其特征在于,步骤S1中的多尺度嵌入式基因共表达网络分析算法的基本步骤包括:
4.根据权利要求3所述的一种基于多尺度基因图谱的PD的动态演化预测建模方法,其特征在于,所述步骤S11中具体计算方法的步骤为:
5.根据权利要求3所述的一种基于多尺度基因图谱的PD的动态演化预测建模方法,其特征在于,所述步骤S12中,计算方法的步骤为:
6.根据权利要求1所述的一种基于多尺度基因图谱的PD的动态演化预测建模方法,其特征在于,所述步骤S2中,具体计算方法的步骤为:
7.根据权利要求1所述的一种基于多尺度基因图谱的PD的动态演化预测建模方法,其特征在于,所述步骤S4中图节点特征的时间维度特征的提取步骤具体如下:
8
9.根据权利要求1所述的一种基于多尺度基因图谱的PD的动态演化预测建模方法,其特征在于,所述步骤S5中使用双线性池化操作将时间特征和空间特征进行时空融合,得到时空特征融合张量Bcompact(x,y),其公式如下:
10.根据权利要求1所述的一种基于多尺度基因图谱的帕金森疾病PD的动态演化预测建模方法,其特征在于,所述步骤S5中,使用真类概率置信度模型搭配全连接层进行分类预测,公式如下:
...【技术特征摘要】
1.一种基于多尺度基因图谱的pd的动态演化预测建模方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种基于多尺度基因图谱的pd的动态演化预测建模方法,其特征在于,步骤s1中的基因表达矩阵的数据种类具体包括但不限于:
3.根据权利要求1所述的一种基于多尺度基因图谱的pd的动态演化预测建模方法,其特征在于,步骤s1中的多尺度嵌入式基因共表达网络分析算法的基本步骤包括:
4.根据权利要求3所述的一种基于多尺度基因图谱的pd的动态演化预测建模方法,其特征在于,所述步骤s11中具体计算方法的步骤为:
5.根据权利要求3所述的一种基于多尺度基因图谱的pd的动态演化预测建模方法,其特征在于,所述步骤s12中,计算方法的步骤为:
6.根据权利要求1所述的一种基于多尺度基因图谱的pd的动态演化预测建模方法,其特征在于,所述步骤s2中,具...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。