一种基于全转录组的肝细胞癌可变剪切事件系统分析的方法及预后模型应用技术方案

技术编号:21609101 阅读:25 留言:0更新日期:2019-07-13 19:28
本发明专利技术涉及基因技术及生物医学领域,具体涉及肝细胞癌(HCC)中可变剪切(AS)事件的全转录组系统分析的方法以及基于全转录组分析方法的相关预后模型构建与应用。本发明专利技术通过在HCC中发生了剪接变异信号的全局辨识和生物信息学分析的全面描述,以及基于系统的全转录组分析方法的预后模型及剪切网络的构建。本发明专利技术提供了HCC中mRNA剪接特征的全局变化的综合图像,并进一步开发了包含存活相关AS事件的预后模型和剪接网络。本发明专利技术是对HCC AS事件特征进行全面综合计算研究的第一次尝试,并进一步扩展到预后和分子靶向意义的新领域,为阐明生物发生和HCC的发展的潜在遗传机制提供了新的见解。

Analysis of Variable Shear Event System for Hepatocellular Carcinoma Based on Total Transcription Group and Application of Prognostic Model

【技术实现步骤摘要】
一种基于全转录组的肝细胞癌可变剪切事件系统分析的方法及预后模型应用
本专利技术涉及基因技术及生物医学领域,具体涉及肝细胞癌(HCC)中可变剪切(AS)事件的全转录组系统分析的方法以及基于全转录组分析方法的相关预后模型构建与应用。
技术介绍
肝细胞癌(HCC)是全球癌症死亡的第三大原因,每年报告的死亡人数约为50万。在临床中,HCC由不同的亚型组成,具有不同的结果,由于异质性而具有悲观的预后,传统的预后因素对预测HCC患者的个体化预后没有帮助。因此,进一步全面研究HCC中涉及的生物学机制和分子生物标志物是开展靶向治疗和改善HCC患者预后预测的重要步骤。最新研究主要考虑加速全基因组癌症研究的高通量技术的快速发展。近年来,HCC的许多诊断,预后和治疗分子生物标志物逐渐被鉴定和验证,包括非编码RNA,CpG甲基化位点和拷贝数变异。这些研究尽管结果很有希望,但主要集中在改变HCC的转录组分析水平。然而,转录后修饰的系统分析总是被忽略,而且很大程度上是未知的。从分子的角度来看,HCC是异质性肿瘤。在过去十年中,已经做出了重大努力来揭示参与HCC发展的基因组谱的分子变化。这些研究有助于确定预后遗传特征,包括基因,微小RNA和非编码RNA等特征促进了相关预后标志物甚至治疗靶标的鉴定。然而,AS作为增加基因组编码能力和扩展蛋白质多样性的主要转录后生物学行为,在癌症生物学中表现出更多的潜在意义。先前对AS特征的探索已经表明,异常调节的剪接变体可以用作HCC的诊断,预测和预后生物标志物。然而,缺乏关于在HCC中建立具有异常AS的预后特征的详细信息。因此,用于判断HCC预后的全转录组分析方法没有系统描述。
技术实现思路
鉴于现有技术存在的问题,本专利技术的目的在于提供了一种基于全转录组的肝细胞癌可变剪切事件系统分析的方法及预后模型应用。本专利技术通过在HCC中发生了剪接变异信号的全局辨识和生物信息学分析的全面描述,以及基于系统的全转录组分析方法的预后模型及剪切网络的构建。本专利技术确定了290名HCC患者的1314个基因中的1805个AS事件,这些事件与HCC患者的总体存活率显着相关。最终的预后模型包括26个AS事件被构建。风险评分(全部)的接受者-操作者特征(ROC)曲线下面积达到0.835,用于预测5年内HCC患者的生存状态。分类为中位数风险评分(全部)值的高风险和低风险评分组显示出显着不同的存活时间(高与低=827对3125天,P<2e-16)。此外,剪接调控网络显示出HCC中加香因子作用的明显趋势,这可能是与HCC患者预后相关的潜在生物学机制。此外,GeneOntology(GO),KyotoEncyclopediaofGenesandGenomes(KEGG)富集分析以及GSVA揭示了HCC中剪接机制中涉及的某些关键术语。本专利技术提供了HCC中mRNA剪接特征的全局变化的综合图像,并进一步开发了包含存活相关AS事件的预后模型和剪接网络。一种基于全转录组的肝细胞癌可变剪切事件系统分析的方法的应用,通过建立HCC中mRNA剪接特征的全局变化的综合图像,并进一步建立包含存活相关AS事件的预后模型和剪接网络。为了实现上述目的,本专利技术采用以下技术方案。一种基于全转录组的肝细胞癌可变剪切事件系统分析的方法,具体步骤如下。1)数据管理过程:HCC队列的第三级mRNA测序数据和相应的临床信息获自TCGA数据门户http://tcga-data.nci.nih.gov/,其包含374个HCC组织和50个相邻的非肿瘤组织。为了生成每个HCC患者的AS概况,使用一种明确量化每个外显子和剪接点的包含水平的Java应用程序即SpliceSeq来评估HCC患者的mRNA剪接模式。共纳入290名符合以下标准的患者:A.确诊HCC的组织学诊断;B.患者在初始病理诊断后至少30天仍存活;C.患者具有相应的mRNA剪接数据。从0到1的百分比拼接(PSI)评分通常用于评估特定基因与特定剪接模式的转录物比率。为尽可能地生成一组AS事件,实施一系列严格的过滤器,PSI得分≥75的样本百分比,PSI得分平均值≥0.05,并且使用k-最近邻居估算了缺失的表达值(kNN)算法与impute包。为了准确描述AS事件,为每个AS事件分配了一个唯一的注释,该注释由SpliceSeq中的剪接类型,ID号和匹配的基因符号组成。例如,“RI_C9orf9_ID_87994”表示保留的内含子(RI)表示剪接类型,C9orf9是父基因符号,ID_87994表示SpliceSeq数据库中的特定序列号。2)HCC患者的生存分析和预后特征的构建:根据中位数切点,将HCC患者AS事件的PSI评分分为低指数和高指数,然后进行适合分类PSI指数和患者总生存(OS)的单变量Cox回归分析,以确定预后AS事件。UpSetR是一个用于生成镦粗图(upsetplot)的R包,可以可视化七种类型的生存相关AS事件之间的交叉集(如图1d和图1c所示)。前20名(如果可用)最重要的生存相关选择每种AS类型的AS事件作为搜索独立预后因子的候选者,并分别通过多变量Cox回归进一步构建HCC患者的AS特征。每个预后特征选择通过前向逐步选择过程和Akaike信息标准(AIC)[23]进行。然后,将每个AS特征中识别的AS事件组合起来,通过二级前向逐步方法构建最终预测模型,以找到最小的AS事件集。其中,使用以下方法计算OS预测的每个AS特征的风险评分:,此外根据中位风险评分将HCC患者分为低风险和高风险亚组,并进行Kaplan-Meier生存分析以区分这两个亚组。此外,每个预后模型的临床疗效和预测准确性是可比拟的,拟合时间依赖性ROC曲线与survivalROC包,并且分别计算1年,3年和5年的曲线下面积(AUC)。3)生存相关AS事件的功能丰富和相互作用分析:通过单变量Cox回归分析确定的存活相关AS事件的亲本基因通过设定错误发现率(FDR)<0.05进行基因本体论(GO)和京都基因百科全书和基因组(KEGG)途径分析。上述分析使用clusterProfiler包(版本3.7)进行。此外通过使用ReactomeFICytoscapePlugIn(版本3.6.1)分析和可视化基因相互作用网络,目的是搜索重要的中枢基因。4)HCC队列中潜在的SF-AS监管网络:通过筛选文献和SpliceAid2数据库鉴定总共67个SF,并且使用DESeq2包将TCGAHCC样品中的相应表达水平用“方差稳定转化功能”整合和标准化。然后进行单变量Cox危害回归以筛选独立的预后SF。还进行了存活相关SF的表达与预后AS事件的PSI评分之间的Spearman相关性分析。P值由Benjamini&Hochberg(BH)相关调整,调整后的P值<0.001被认为是显着的。此外由Cytoscape生成SF-AS监管网络。5)SF-AS相关对的基因集变异分析(GSVA):GSVA是一种差异功能基因集富集分析,可通过计算样本方式基因集富集分数来检测异质样本的细微途径活性变化。使用来自bioconductor(www.bioconductor.org)的GSVA包进行GSVA以进一步从HCC组织中搜索显着富集的GO和经典途径(KEGG,Re本文档来自技高网
...

【技术保护点】
1.一种基于全转录组的肝细胞癌可变剪切事件系统分析的方法,其特征在于,具体步骤如下:1)数据管理过:HCC队列的第三级mRNA测序数据和相应的临床信息获自TCGA数据门户http://tcga‑data.nci.nih.gov/,其包含374个HCC组织和50个相邻的非肿瘤组织;为了生成每个HCC患者的AS概况,使用一种明确量化每个外显子和剪接点的包含水平的Java应用程序即SpliceSeq来评估HCC患者的mRNA剪接模式,共纳入290名符合以下标准的患者:1)确诊HCC的组织学诊断;2)患者在初始病理诊断后至少30天仍存活;3)患者具有相应的mRNA剪接数据;从0到1的百分比拼接评分通常用于评估特定基因与特定剪接模式的转录物比率,为尽可能地生成一组AS事件,实施一系列严格的过滤器,PSI得分≥75的样本百分比,PSI得分平均值≥0.05,并且使用k‑最近邻居估算了缺失的表达值算法与impute包;为准确描述AS事件,为每个AS事件分配了一个唯一的注释,该注释由SpliceSeq中的剪接类型,ID号和匹配的基因符号组成;2)HCC患者的生存分析和预后特征的构建:根据中位数切点,将HCC患者AS事件的PSI评分分为低指数和高指数,然后进行适合分类PSI指数和患者总生存的单变量Cox回归分析,以确定预后AS事件;UpSetR是一个用于生成镦粗图的R包,可以可视化七种类型的生存相关AS事件之间的交叉集,前20名最重要的生存相关选择每种AS类型的AS事件作为搜索独立预后因子的候选者,并分别通过多变量Cox回归进一步构建HCC患者的AS特征,每个预后特征选择通过前向逐步选择过程和Akaike信息标准(AIC)进行,然后将每个AS特征中识别的AS事件组合起来,通过二级前向逐步方法构建最终预测模型,以找到最小的AS事件集,其中使用以下方法计算OS预测的每个AS特征的风险评分:...

【技术特征摘要】
1.一种基于全转录组的肝细胞癌可变剪切事件系统分析的方法,其特征在于,具体步骤如下:1)数据管理过:HCC队列的第三级mRNA测序数据和相应的临床信息获自TCGA数据门户http://tcga-data.nci.nih.gov/,其包含374个HCC组织和50个相邻的非肿瘤组织;为了生成每个HCC患者的AS概况,使用一种明确量化每个外显子和剪接点的包含水平的Java应用程序即SpliceSeq来评估HCC患者的mRNA剪接模式,共纳入290名符合以下标准的患者:1)确诊HCC的组织学诊断;2)患者在初始病理诊断后至少30天仍存活;3)患者具有相应的mRNA剪接数据;从0到1的百分比拼接评分通常用于评估特定基因与特定剪接模式的转录物比率,为尽可能地生成一组AS事件,实施一系列严格的过滤器,PSI得分≥75的样本百分比,PSI得分平均值≥0.05,并且使用k-最近邻居估算了缺失的表达值算法与impute包;为准确描述AS事件,为每个AS事件分配了一个唯一的注释,该注释由SpliceSeq中的剪接类型,ID号和匹配的基因符号组成;2)HCC患者的生存分析和预后特征的构建:根据中位数切点,将HCC患者AS事件的PSI评分分为低指数和高指数,然后进行适合分类PSI指数和患者总生存的单变量Cox回归分析,以确定预后AS事件;UpSetR是一个用于生成镦粗图的R包,可以可视化七种类型的生存相关AS事件之间的交叉集,前20名最重要的生存相关选择每种AS类型的AS事件作为搜索独立预后因子的候选者,并分别通过多变量Cox回归进一步构建HCC患者的AS特征,每个预后特征选择通过前向逐步选择过程和Akaike信息标准(AIC)进行,然后将每个AS特征中识别的AS事件组合起来,通过二级前向逐步方法构建最终预测模型,以找到最小的AS事件集,其中使用以下方法计算OS预测的每个AS特征的风险评分:,此外根据中位风险评分将HCC患者分为低风险和高风险亚组,并进行Kaplan-Meier生存分析以区分这两个亚组,此外每个预后模型的临床疗效和预测准确性是可比拟的,拟合时间依赖性ROC曲线与survivalROC包,并且分别计算1年,3年...

【专利技术属性】
技术研发人员:王哲朱家伟
申请(专利权)人:辽宁省肿瘤医院
类型:发明
国别省市:辽宁,21

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1