System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及生物信息,尤其涉及一种哮喘病组学数据的处理方法、一种哮喘病组学数据的处理系统,以及一种计算机可读存储介质。
技术介绍
1、哮喘病作为一种异质性炎症性疾病,其临床表现主要包括反复的喘息、胸闷和咳嗽,对人类的健康产生严重的负面影响,因此探索哮喘病的生物标志物和构建其诊断模型显得尤其重要。
2、现有的诊断方法中,可以通过获取多种组学数据,并对数据进行整合分析来探索哮喘病的生物标志物和构建其诊断模型,如利用哮喘组学数据的逻辑斯特回归模型确定了几个与哮喘相关转录因子相关的单核苷酸多态性。然而,逻辑斯特回归假设原始组学数据之间存在线性关系,无法满足于存在非线性关系的组学数据中。
3、此外,现有技术中,非负矩阵分解算法可以合理运用组学数据中先验信息,提高生物标志物挖掘的有效性。虽然该方法初始参数的随机初始化使得目标函数的解不唯一且对噪声敏感,但是可以通过对初始参数采用奇异值初始化并加入多种网络正则化约束来构建竞争性内源rna网络的方式,得到解决并获得了良好的效果,但该算法仍然无法兼顾不同组学数据之间的非线性关系。
4、为了克服现有技术存在的上述缺陷,本领域亟需一种哮喘病组学数据的处理技术,基于数据驱动的临床信息规则提取方法,在融合样本先验信息的同时,整合多种具有非线性关联的组学数据、抵抗数据中的噪声,从而挖掘哮喘病相关的生物标志物,以为哮喘病的诊断和治疗靶点开发提供参考。
技术实现思路
1、以下给出一个或多个方面的简要概述以提供对这些方面的基本理
2、为了克服现有技术存在的上述缺陷,本专利技术提供了一种哮喘病组学数据的处理方法、一种哮喘病组学数据的处理系统,以及一种计算机可读存储介质,能够基于数据驱动的临床信息规则提取方法,在融合样本先验信息的同时,整合多种具有非线性关联的组学数据、抵抗数据中的噪声,从而挖掘哮喘病相关的生物标志物,以为哮喘病的诊断和治疗靶点开发提供重要参考。
3、具体来说,根据本专利技术的第一方面提供的一种哮喘病组学数据的处理方法包括以下步骤:获取哮喘病患者和对照样本的转录组数据和dna甲基化数据;对所述转录组数据和所述dna甲基化数据进行差异表达分析,以确定所述哮喘病患者和所述对照样本的差异表达基因和差异甲基化位点;经由深度子空间重建算法,根据所述哮喘病患者和所述对照样本的组别,改变所述差异表达基因和所述差异甲基化位点的分布情况,以重建获得基因表达矩阵和dna甲基化表达矩阵;对所述基因表达矩阵和所述dna甲基化表达矩阵,进行联合深度半监督非负矩阵的分解处理,以构建协同模块;经由深度正交典型相关分析和机器学习算法,构建基于所述协同模块的诊断模型;以及经由所述诊断模型,确定哮喘病相关的生物标志物。
4、进一步地,在本专利技术的一些实施例中,所述哮喘病患者的所述转录组数据和所述dna甲基化数据为无缺失值的表格数据。所述表格数据的每一行对应一个哮喘病患者,所述表格数据的每一列对应所述哮喘病患者的一个基因或一个甲基化位点。
5、进一步地,在本专利技术的一些实施例中,所述对所述转录组数据和所述dna甲基化数据进行差异表达分析,以确定所述哮喘病患者和所述对照样本的差异表达基因和差异甲基化位点的步骤包括:按预设比例划分各所述哮喘病患者和各所述对照样本的转录组数据和dna甲基化数据,以构建训练集和测试集;以及经由limma算法对所述训练集中的各所述哮喘病患者和各所述对照样本的转录组数据和dna甲基化数据进行所述差异表达分析,以确定所述哮喘病患者和所述对照样本的所述差异表达基因和所述差异甲基化位点。
6、进一步地,在本专利技术的一些实施例中,所述经由深度子空间重建算法,根据所述哮喘病患者和所述对照样本的组别,改变所述差异表达基因和所述差异甲基化位点的分布情况,以重建获得基因表达矩阵和dna甲基化表达矩阵的步骤包括:根据所述哮喘病患者和所述对照样本的组别,确定各所述差异表达基因和各所述差异甲基化位点的样本标签;以及根据所述样本标签,改变所述差异表达基因和所述差异甲基化位点的分布情况,以重建获得所述基因表达矩阵和所述dna甲基化表达矩阵。
7、进一步地,在本专利技术的一些实施例中,所述根据所述样本标签,改变所述差异表达基因和所述差异甲基化位点的分布情况,以重建获得所述基因表达矩阵和所述dna甲基化表达矩阵的步骤包括:确定各所述差异表达基因和各所述差异甲基化位点的初始表达矩阵;以及将所述初始表达矩阵及对应的样本标签配对输入深度子空间重建算法,使具有相同标签的样本数据在一子空间中接近,并使具有不同标签的样本数据在所述子空间中远离,以重建获得所述基因表达矩阵和所述dna甲基化表达矩阵。
8、进一步地,在本专利技术的一些实施例中,所述对所述基因表达矩阵和所述dna甲基化表达矩阵,进行联合深度半监督非负矩阵的分解处理,以构建协同模块的步骤包括:将重建获得的所述基因表达矩阵和所述dna甲基化表达矩阵,输入联合深度半监督非负矩阵分解算法,以获得多个候选协同模块,其中,每一所述候选协同模块中包括数目不等的基因和甲基化位点;以及基于至少一种预设的筛选规则筛选所述多个候选协同模块,以获得至少一个关键协同模块。
9、进一步地,在本专利技术的一些实施例中,所述将重建获得的所述基因表达矩阵和所述dna甲基化表达矩阵,输入联合深度半监督非负矩阵分解算法,以获得多个候选协同模块的步骤包括:将重建获得的所述基因表达矩阵和所述dna甲基化表达矩阵分解为一个共同的样本潜矩阵和多个特征潜矩阵;以及通过对所述多个特征潜矩阵进行逐层降维,并逐层激活函数降维过程中的非线性变换,进行非线性特征关联分析,以获得所述多个候选协同模块。
10、进一步地,在本专利技术的一些实施例中,所述经由深度正交典型相关分析和机器学习算法,构建基于所述协同模块的诊断模型的步骤包括:将所述关键协同模块中的至少一个基因和至少一个甲基化位点的表达量输入深度正交典型相关分析模型,以获得各所述基因和各所述甲基化位点的权重;对各所述权重取绝对值,并按其大小进行排序,以获得的预设数量的目标基因和目标甲基化位点;以及使用逻辑斯特回归算法,构建关于所述目标基因和所述目标甲基化位点的诊断模型。
11、此外,根据本专利技术的第二方面提供的一种哮喘病组学数据的处理系统包括存储器及处理器。所述存储器上存储有计算机指令。所述处理器连接所述存储器,并被配置用于执行所述存储器上存储的计算机指令,以实施如本专利技术的第一方面中任一项所述的哮喘病组学数据的处理方法。
12、此外,根据本专利技术的第三方面提供的一种计算机可读存储介质,其上存储有计算机指令。所述计算机指令被处理器执行时,实施如本专利技术的第一方面中任一项所述的哮喘病组学数据的处理方法。
本文档来自技高网...【技术保护点】
1.一种哮喘病组学数据的处理方法,其特征在于,包括以下步骤:
2.如权利要求1所述的处理方法,其特征在于,所述哮喘病患者的所述转录组数据和所述DNA甲基化数据为无缺失值的表格数据,其中,所述表格数据的每一行对应一个哮喘病患者,所述表格数据的每一列对应所述哮喘病患者的一个基因或一个甲基化位点。
3.如权利要求1所述的处理方法,其特征在于,所述对所述转录组数据和所述DNA甲基化数据进行差异表达分析,以确定所述哮喘病患者和所述对照样本的差异表达基因和差异甲基化位点的步骤包括:
4.如权利要求1所述的处理方法,其特征在于,所述经由深度子空间重建算法,根据所述哮喘病患者和所述对照样本的组别,改变所述差异表达基因和所述差异甲基化位点的分布情况,以重建获得基因表达矩阵和DNA甲基化表达矩阵的步骤包括:
5.如权利要求4所述的处理方法,其特征在于,所述根据所述样本标签,改变所述差异表达基因和所述差异甲基化位点的分布情况,以重建获得所述基因表达矩阵和所述DNA甲基化表达矩阵的步骤包括:
6.如权利要求1所述的处理方法,其特征在于,所述对所
7.如权利要求6所述的处理方法,其特征在于,所述将重建获得的所述基因表达矩阵和所述DNA甲基化表达矩阵,输入联合深度半监督非负矩阵分解算法,以获得多个候选协同模块的步骤包括:
8.如权利要求6所述的处理方法,其特征在于,所述经由深度正交典型相关分析和机器学习算法,构建基于所述协同模块的诊断模型的步骤包括:
9.一种哮喘病组学数据的处理系统,其特征在于,包括
10.一种计算机可读存储介质,其上存储有计算机指令,其特征在于,所述计算机指令被处理器执行时,实施如权利要求1~8中任一项所述的哮喘病组学数据的处理方法。
...【技术特征摘要】
1.一种哮喘病组学数据的处理方法,其特征在于,包括以下步骤:
2.如权利要求1所述的处理方法,其特征在于,所述哮喘病患者的所述转录组数据和所述dna甲基化数据为无缺失值的表格数据,其中,所述表格数据的每一行对应一个哮喘病患者,所述表格数据的每一列对应所述哮喘病患者的一个基因或一个甲基化位点。
3.如权利要求1所述的处理方法,其特征在于,所述对所述转录组数据和所述dna甲基化数据进行差异表达分析,以确定所述哮喘病患者和所述对照样本的差异表达基因和差异甲基化位点的步骤包括:
4.如权利要求1所述的处理方法,其特征在于,所述经由深度子空间重建算法,根据所述哮喘病患者和所述对照样本的组别,改变所述差异表达基因和所述差异甲基化位点的分布情况,以重建获得基因表达矩阵和dna甲基化表达矩阵的步骤包括:
5.如权利要求4所述的处理方法,其特征在于,所述根据所述样本标签,改变所述差异表达基因...
【专利技术属性】
技术研发人员:位凯,张国庆,黄涛,李亦学,
申请(专利权)人:中国科学院上海营养与健康研究所,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。