【技术实现步骤摘要】
本专利技术涉及生物信息分析领域,尤其涉及一种生物信息项目的自动化分析方法及系统。
技术介绍
随着生命科学领域实验技术的快速发展,科学仪器的自动化、智能化水平日益提高,数据产出能力有了质的飞跃。同时,生命科学研究对分析测试的要求无论在样品数量、分析周期、分析项目和数据准确性等方面都提出了更高的标准和要求,生物实验室产出的信息呈几何级数增长。在传统的生物实验室中,由于数据类型多样、格式不一,数据的保存、交换、查询、分析、维护都很不方便,严重阻碍了研究人员之间的信息提交。在大规模并行测序(也叫下一代测序技术、高通量测序,英文:NGS、High-throughput Sequencing)的实验和生物信息学分析中涉及到的多种流程,如DNA文库构建,基因组测序,数据处理,结果分析,成果产出,数据共享等多个环节,每个环节有不同的技术人员参与,因此在各个环节传递或是承接中会出现信息丢失或是效率低下等等问题。尤其在生物信息学中的测序,高性能计算环节,专业测序实验室需要接受大量的测序订单项目、安排测序实验、及时处理高速产出的测序结果。在生物信息学中的测序完成后的环节中,所有项目有相应的业务线项目组来做。业务线既做只过滤,又做标准化,又做个性化。同样要经过1.项目管理立项、2.信息人负责人审批、3.信息执行人确认,4.安排跑流程,5.报告填写,6.交付,7.项目管理沟通等过程,因此耗费了业务线的本就有限的资源。 >
技术实现思路
本专利技术的目的提供一种生物信息项目的自动化分析方法和系统,能有效简化现有的生物信息分析的过程和步骤,减少工作量,节约资源。本专利技术提供了一种生物信息项目的自动化分析方法,包括步骤:步骤一:创建项目并存于业务管理系统中,每个项目包括多个子项目;并选择所述创建项目中的子项目和任务信息;所述子项目的类型包括只过滤子项目和标准化子项目;步骤二:当所述子项目的类型为只过滤子项目,则根据选择的子项目类型和任务信息,依次从下机数据管理系统中获取对应的且经过测序仪测序后的样品数据;且每获取一个样品数据,即根据预设的参数配置运用统一的过滤标准进行过滤与分析,从而过滤不符合参数配置的样品数据;且待获取的所有样品数据过滤与分析完后,生成分析结果,分析结果包括子项目信息和对应的样品信息;步骤三:当所述子项目的类型为标准化子项目时,则该子项目对应的样品在经测序仪测序的同时,对该样品创建包括过滤分析、表达谱定量分析、差异比较分析、Cluster聚类分析、靶基因预测分析、KOGO分析和碱基编辑分析中的一种或多种的标准流程分析,且在创建每个标准流程分析过程中由用户根据当前子项目的样品情况输入对应的过滤参数;经测序仪测序完成后,根据所述输入的过滤参数对每一样品数据进行过滤,从而去掉不符合过滤参数的样品数据;然后再运用所创建的标准流程分析对符合过滤参数的每一样品数据步骤四:对所述分析结果进行质控,若质控通过,则直接输出该分析结果;若质控不通过,且所述分析结果和质控标准的差距在阈值范围内,则重新编辑所述样品数据或过滤/质控参数后再次进行步骤二或者步骤三的过滤与分析过程,直至分析结果通过质控;若质控不通过,且所述分析结果和质控标准的差距超过阈值,则编辑所述样品且废弃相关Lane,并在所述业务管理系统中重新下单。作为上述方案的改进,每个子项目的概要信息包括子项目代码、子项目名称、子项目类型、是否是只过滤、总的样品数、执行人、开始时间和结束时间、子项目状态以及子项目相关操作。作为上述方案的改进,所述样品信息包括样品名称、文库名称、Lane ID、测序策略、Flowcell ID、Raw data、Raw Reads、Read Length、GC%、Q20%、Q30%、Error Rate、碱基分布图以及碱基质控分布图。作为上述方案的改进,还包括:步骤五:将所述分析结果进行存储备份。作为上述方案的改进,在所述步骤四中:若质控不通过且所述分析结果和质控标准的差距在阈值范围内,在重新编辑所述样品数据是可以单个样品数据编辑或样品批量编辑。本专利技术还提供了一种生物信息项目的自动化分析系统,包括:创建单元,用于创建项目并存于业务管理系统中,每个项目包括多个子项目;并选择所述创建项目中的子项目和任务信息;所述子项目的类型包括只过滤子项目和标准化子项目;第一过滤分析单元,用于当所述子项目的类型为只过滤子项目,则根据选择的子项目类型和任务信息,依次从下机数据管理系统中获取对应的且经过测序仪测序后的样品数据;且每获取一个样品数据,即根据预设的参数配置运用统一的过滤标准进行过滤与分析,从而过滤不符合参数配置的样品数据;且待获取的所有样品数据过滤与分析完后,生成分析结果,分析结果包括子项目信息和对应的样品信息;第二过滤分析单元,用于当所述子项目的类型为标准化子项目时,则该子项目对应的样品在经测序仪测序的同时,对该样品创建包括过滤分析、表达谱定量分析、差异比较分析、Cluster聚类分析、靶基因预测分析、KOGO分析和碱基编辑分析中的一种或多种的标准流程分析,且在创建每个标准流程分析过程中由用户根据当前子项目的样品情况输入对应的参数;经测序仪测序完成后,根据所述输入的过滤参数对每一样品数据进行过滤,从而去掉不符合过滤参数的样品数据;然后再运用所创建的标准流程分析对符合过滤参数的每一样品数据进行分析,从而生成分析结果,分析结果包括子项目信息和对应的样品信息;质控单元,用于对所述分析结果进行质控,若质控通过,则直接输出该分析结果;若质控不通过,且所述分析结果和质控标准的差距在阈值范围内,则重新编辑所述样品数据或过滤/质控参数后再次进行步骤二或者步骤三的过滤与分析过程,直至分析结果通过质控;若质控不通过,且所述分析结果和质控标准的差距超过阈值,则编辑所述样品且废弃相关Lane,并在所述业务管理系统中重新下单。作为上述方案的改进,每个子项目的概要信息包括子项目代码、子项目名称、子项目类型、是否是只过滤、总的样品数、执行人、开始时间和结束时间、子项目状态以及子项目相关操作。作为上述方案的改进,所述样品信息包括样品名称、文库名称、Lane ID、测序策略、Flowcell ID、Raw data、Raw Reads、Read Length、GC%、Q20%、Q30%、Error Rate、碱基分布图以及碱基质控分布图。作为上述方案的改进,还包括:存储单元:用于将所述分析结果进本文档来自技高网...
【技术保护点】
一种生物信息项目的自动化分析方法,其特征在于,包括步骤:步骤一:创建项目并存于业务管理系统中,每个项目包括多个子项目;并选择所述创建项目中的子项目和任务信息;所述子项目的类型包括只过滤子项目和标准化子项目;步骤二:当所述子项目的类型为只过滤子项目,则根据选择的子项目类型和任务信息,依次从下机数据管理系统中获取对应的且经过测序仪测序后的样品数据;且每获取一个样品数据,即根据预设的参数配置运用统一的过滤标准进行过滤与分析,从而过滤不符合参数配置的样品数据;且待获取的所有样品数据过滤与分析完后,生成分析结果,分析结果包括子项目信息和对应的样品信息;步骤三:当所述子项目的类型为标准化子项目时,则该子项目对应的样品在经测序仪测序的同时,对该样品创建包括过滤分析、表达谱定量分析、差异比较分析、Cluster聚类分析、靶基因预测分析、KOGO分析和碱基编辑分析中的一种或多种的标准流程分析,且在创建每个标准流程分析过程中由用户根据当前子项目的样品情况输入对应的过滤参数;经测序仪测序完成后,根据所述输入的过滤参数对每一样品数据进行过滤,从而去掉不符合过滤参数的样品数据;然后再运用所创建的标准流程分析对符 ...
【技术特征摘要】
1.一种生物信息项目的自动化分析方法,其特征在于,包括步骤:
步骤一:创建项目并存于业务管理系统中,每个项目包括多个子项目;并
选择所述创建项目中的子项目和任务信息;所述子项目的类型包括只过滤子项
目和标准化子项目;
步骤二:当所述子项目的类型为只过滤子项目,则根据选择的子项目类型
和任务信息,依次从下机数据管理系统中获取对应的且经过测序仪测序后的样
品数据;且每获取一个样品数据,即根据预设的参数配置运用统一的过滤标准
进行过滤与分析,从而过滤不符合参数配置的样品数据;且待获取的所有样品
数据过滤与分析完后,生成分析结果,分析结果包括子项目信息和对应的样品
信息;
步骤三:当所述子项目的类型为标准化子项目时,则该子项目对应的样品
在经测序仪测序的同时,对该样品创建包括过滤分析、表达谱定量分析、差异
比较分析、Cluster聚类分析、靶基因预测分析、KOGO分析和碱基编辑分析中
的一种或多种的标准流程分析,且在创建每个标准流程分析过程中由用户根据
当前子项目的样品情况输入对应的过滤参数;经测序仪测序完成后,根据所述
输入的过滤参数对每一样品数据进行过滤,从而去掉不符合过滤参数的样品数
据;然后再运用所创建的标准流程分析对符合过滤参数的每一样品数据进行分
析,从而生成分析结果,分析结果包括子项目信息和对应的样品信息;
步骤四:对所述分析结果进行质控,若质控通过,则直接输出该分析结果;
若质控不通过,且所述分析结果和质控标准的差距在阈值范围内,则重新编辑
所述样品数据或过滤/质控参数后再次进行步骤二或者步骤三的过滤与分析过
程,直至分析结果通过质控;若质控不通过,且所述分析结果和质控标准的差
距超过阈值,则编辑所述样品且废弃相关Lane,并在所述业务管理系统中重新
\t下单。
2.如权利要求1所述的生物信息项目的自动化分析方法,其特征在于,每
个子项目的概要信息包括子项目代码、子项目名称、子项目类型、是否是只过
滤、总的样品数、执行人、开始时间和结束时间、子项目状态以及子项目相关
操作。
3.如权利要求1所述的生物信息项目的自动化分析方法,其特征在于,所
述样品信息包括样品名称、文库名称、Lane ID、测序策略、Flowcell ID、Raw data、
Raw Reads、Read Length、GC%、Q20%、Q30%、Error Rate、碱基分布图以及
碱基质控分布图。
4.如权利要求1所述的生物信息项目的自动化分析方法,其特征在于,还
包括:
步骤五:将所述分析结果进行存储备份。
5.如权利要求1所述的生物信息项目的自动化分析方法,其特征在于,在
所述步骤四中:若质控不通过且所述分析结果和质控标准的差距在阈值范围内,
在重新编辑所述样品数据是可以单个样品数据编辑或样品批量编辑。
6.一种生物信息项目的自动化分析系...
【专利技术属性】
技术研发人员:苏海桥,董博,徐伟玲,石俊杰,黄泽辉,梁绍光,刘娜,李国庆,
申请(专利权)人:深圳华大基因科技服务有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。