本发明专利技术公开了一种环状RNA的高通量芯片处理及分析流程控制方法,首先由系统生成自定义参数配置文件,再根据用户设定参数后的自定义参数文件和高通量芯片数据处理流程模块生成与数据流程对应的批处理可执行文件;由系统执行批处理可执行文件,实现数据流程自动化,最终生成结果报告文件。从而能高效的帮助生物信息分析人员完成一套标准化的高通量数据分析流程,甚至可以让不懂高通量数据分析的科研人员自己完成高通量数据分析。从而可以达到优化科研人员的工作效率,降低科研成本的目的。本发明专利技术不仅提出了可靠且多样的环状RNA分析方法,也可用于长链非编码RNA等高通量数据分析流程,且在不同种属领域通用,其实现方法简单,应用范围广泛。
【技术实现步骤摘要】
本专利技术设计医学基因组学和计算生物学领域,具体涉及一种环状RNA的高通量芯片数据处理及分析流程控制方法。
技术介绍
环状RNA(circular RNA,circRNA)是最近发现的一类特殊的非编码RNA,它大量存在于真核细胞胞质内,主要由pre-mRNA通过可变剪切加工产生。具有闭合环状结构,大部分的环状RNA是由外显子序列构成,在不同的物种中具有保守性,同时存在组织及不同发育阶段的表达特异性。由于环状RNA对核酸酶不敏感,所以比线性RNA更为稳定,这使得环状RNA在作为新型临床诊断标记物的开发应用上具有明显优势。然而使用环状RNA作为标记物也存在诸多问题,例如大量的环状RNA被鉴定出来,但是其功能机制都了解的太少,给科研工作者带来了挑战和困难,尤其是面对高通量大数据的时候。如何分析环状RNA数据,研究其潜在功能成为该领域目前急需解决的问题。
技术实现思路
本专利技术的目的是提供一种环状RNA的高通量芯片数据处理及分析流程控制方法,以解决现有的技术对circRNA高通量芯片数据处理中的不准确性、以及不懂如何分析circRNA等问题。为实现上述目的,本专利技术采用的技术方案为:一种环状RNA的高通量芯片处理及分析流程控制方法,包括如下步骤:步骤1,自定义参数配置文件的生成:导入环状RNA高通量原始芯片数据,经过信号值筛选和标准化得到理论上有效的环状RNA,在此基础上进行生物信息学参数分析;步骤2,输入步骤:用户根据需要,输入设定的各参数配置文件;步骤3,分析步骤:根据上述步骤输入设定的参数配置文件,通过环状RNA高通量数据处理流程模块生成对应的自动化分析流程;步骤4,执行及输出步骤:执行上述步骤所生成的自动化分析流程,获得并输出环状RNA分析结果报告。优选的,所述的步骤1具体包括如下步骤:步骤1.1,导入环状RNA高通量芯片原始信号值文件;步骤1.2,对所述的环状RNA高通量芯片原始信号文件进行质量分析并剔除低质量信号数据,获得经过筛选的信号数据;步骤1.3,将所述的经过筛选的数据进行前景值和背景值校正,得到消除噪音污染的环状RNA信号数据;步骤1.4,将校正过的信号数据进行标准化,并去除极值,得到理论上有效的环状RNA表达值。优选的,所述的步骤1.2中,所述低质量信号数据是指扫描微阵列芯片荧光强度作为RNA表达信号值且荧光强度小于30的数据,同一探针的重复信号数据采用中位数计算法取中位值作为该探针的表达值。优选的,所述的步骤1.3中,使用针对Affymetrix芯片原理设计的Affy软件包中的MAS5或者RMA方法根据不同的芯片类型进行芯片数据预处理,其中不同的芯片类型是指单、双色通道;MAS5得到的数据是原始信号强度,RMA得到的是经过对数变换的信号值。优选的,所述的步骤1.4中,使用limma软件包进行芯片间归一化,得到标准化的环状RNA表达谱数据。优选的,所述的步骤1中,生物信息学参数分析包括差异表达环状RNA的筛选,环状RNA的功能性分析和对环状RNA的调控机制分析。优选的,所述的差异表达环状RNA的筛选包括输入指令选取1.5倍或者2倍的差异倍数,选用三个标准Benjamini–Hochberg方法、FDR方法或者Bonforroni方法校正P-value得到差异表达的环状RNA。优选的,所述的环状RNA的功能性分析包括环状RNA和基因数据的共表达分析,基因本体分析,代谢通路分析,化学反应分析和调控网络的构建;其中,所述的环状RNA和基因数据的共表达分析采用Pearson相关系数法或Spearman相关系数法;所述的基因本体分析采用g:Profiler法从生物过程、分子功能和细胞组分三个成分进行注释和富集分析;所述的代谢通路分析和化学反应采用g:Profiler法通过KEGG和Reactive数据库信息进行分析。优选的,所述的对环状RNA的调控机制分析包括miRNA结合位点预测,靶基因预测和竞争性内源RNA调控网络的构建;其中,所述的microRNA结合位点预测采用TargetScan算法和Miranda算法;所述的靶基因预测采用miRWalk和TargetScan数据库信息。有益效果:利用本专利技术,将环状RNA各分析步骤模块分和流程分,能够单独运行一个模块或流程中的局部分析模块,并进行模块内规定数据分析流程的快速执行。从而通过不同模块的选取,帮助科研人员迅速完成一套高通量数据的前期数据质控、功能分析和结果报告。该工具能够优化生物信息分析人员和科研人员的工作时间,显著提高工作效率,降低科研成本,本专利技术的分析流程思路清晰,其实现方法简单,可广泛应用于生物学研究工作中,也可用于临床相关应用。本专利技术的方法首先由系统生成自定义参数配置文件,再根据用户设定参数后的自定义参数文件和高通量数据处理流程模块生成与数据流程对应的批处理可执行文件;由系统执行批处理可执行文件,实现数据流程自动化,最终生成结果报告文件。从而能高效的帮助生物信息分析人员完成一套标准化的高通量数据分析流程,甚至可以让不懂高通量数据分析的科研人员自己完成高通量数据分析。从而可以达到优化科研人员的工作效率,降低科研成本的目的。本专利技术不仅仅可以用于环状RNA高通量数据分析流程,也可用于其他非编码RNA例如lncRNA等高通量芯片分析流程,甚至在任何物种中通用,其实现方法简单,应用范围较为广泛。附图说明图1是环状RNA自动化分析流程;图2是环状RNA生物信息学分析步骤;图3是环状RNA-共表达基因网络示意图;图4是环状RNA生物通路富集调控示意图;图5是环状RNA的竞争性内源RNA调控网络示意图。具体实施方式下面结合附图对本专利技术作更进一步的说明。如图1所示,本专利技术的一种环状RNA的高通量芯片处理及分析流程控制方法,包括如下步骤:步骤1,自定义参数配置文件的生成:导入环状RNA高通量原始芯片数据,经过信号值筛选和标准化得到理论上有效的环状RNA,在此基础上进行生物信息学参数分析;步骤2,输入步骤:用户根据需要,输入设定的各参数配置文件;步骤3,分析步骤:根据上述步骤输入设定的参数配置文件,通过环状RNA高通量数据处理流程模块生成对应的自动化分析流程;步骤4,执行及输出步骤:执行上述步骤所生成的自动化分析流程,获得并输出环状RNA分析结果报告。优选的,所述的步骤1具体包括如下步骤:步骤1.1,导入环状RNA高通量芯片原始信号值文件;步骤1.2,对所述的环状RNA高通量芯片原始信号文件进行质量分析并剔除低质量信号数据,获得经过筛选的信号数据;其中,低质量信号数据是指扫描微阵列芯片荧光强度作为RNA表达信号值且荧光强度小于30的数据,同一探针的重复信号数据采用中位数计算法取中位值作为该探针的表达值。步骤1.3,将所述的经过筛选的数据进行前景值和背景值校正,得到消除噪音污染的环状RNA信号数据;其中,使用针对全球销量第一的Affymetrix芯片原理设计的Affy软件包中的MAS5或者RMA方法根据不同的芯片类型进行芯片数据预处理,其中不同的芯片类型是指单、双色通道;MAS5得到的数据是原始信号强度,RMA得到的是经过对数变换的信号值。步骤1.4,将校正过的信号数据进行标准化,并去除极值,得到理论上有效的环状RNA表达值;其中,使用目前芯片处理最通用的本文档来自技高网...
【技术保护点】
一种环状RNA的高通量芯片处理及分析流程控制方法,其特征在于:包括如下步骤:步骤1,自定义参数配置文件的生成:导入环状RNA高通量原始芯片数据,经过信号值筛选和标准化得到理论上有效的环状RNA,在此基础上进行生物信息学参数分析;步骤2,输入步骤:用户根据需要,输入设定的各参数配置文件;步骤3,分析步骤:根据上述步骤输入设定的参数配置文件,通过环状RNA高通量数据处理流程模块生成对应的自动化分析流程;步骤4,执行及输出步骤:执行上述步骤所生成的自动化分析流程,获得并输出环状RNA分析结果报告。
【技术特征摘要】
1.一种环状RNA的高通量芯片处理及分析流程控制方法,其特征在于:包括如下步骤:步骤1,自定义参数配置文件的生成:导入环状RNA高通量原始芯片数据,经过信号值筛选和标准化得到理论上有效的环状RNA,在此基础上进行生物信息学参数分析;步骤2,输入步骤:用户根据需要,输入设定的各参数配置文件;步骤3,分析步骤:根据上述步骤输入设定的参数配置文件,通过环状RNA高通量数据处理流程模块生成对应的自动化分析流程;步骤4,执行及输出步骤:执行上述步骤所生成的自动化分析流程,获得并输出环状RNA分析结果报告。2.根据权利要求1所述的环状RNA的高通量芯片数据处理及分析流程控制方法,其特征在于:所述的步骤1具体包括如下步骤:步骤1.1,导入环状RNA高通量芯片原始信号值文件;步骤1.2,对所述的环状RNA高通量芯片原始信号文件进行质量分析并剔除低质量信号数据,获得经过筛选的信号数据;步骤1.3,将所述的经过筛选的数据进行前景值和背景值校正,得到消除噪音污染的环状RNA信号数据;步骤1.4,将校正过的信号数据进行标准化,并去除极值,得到理论上有效的环状RNA表达值。3.根据权利要求2所述的环状RNA的高通量芯片数据处理及分析流程控制方法,其特征在于:所述的步骤1.2中,所述低质量信号数据是指扫描微阵列芯片荧光强度作为RNA表达信号值且荧光强度小于30的数据,同一探针的重复信号数据采用中位数计算法取中位值作为该探针的表达值。4.根据权利要求2所述的环状RNA的高通量芯片数据处理及分析流程控制方法,其特征在于:所述的步骤1.3中,使用针对Affymetrix芯片原理设计的Affy软件包中的MAS5或者RMA方法根据不同的芯片类型进行芯片数据预处理,其中不同的芯片类型是指单、双色通道;MAS5得到的数据是原始信号强度,RMA得到的是经过对数变换的...
【专利技术属性】
技术研发人员:陈瑞,高娜,李晓波,孟庆涛,吴申申,
申请(专利权)人:东南大学,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。