System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及二代测序技术测序,具体涉及基于二代测序技术筛查血液肿瘤标本拷贝数变异的方法及检测系统。
技术介绍
1、拷贝数变异是遗传变异的主要来源,它属于染色体/基因组结构变异的一种,定义为:与参考基因组相比,存在1kb以上的片段重复或缺失异常。然而,包括染色体数目异常、大片段缺失/重复的致病性基因组拷贝数变异(pathogenic copy number variations,pcnvs)是导致出生缺陷、自然流产及肿瘤发生等的重要原因。
2、目前检测拷贝数变异的技术包括细胞遗传学技术(染色体核型分析和fish),也包括分子检测技术(array cgh、snp-array和cnv-seq)。其中,基于下一代测序(nextgeneration sequencing,ngs)的基因组拷贝数变异测序(copy number variationsequencing,cnv-seq)是2016年以来发展起来的新技术,是基于与cma的方法(array cgh/snp array)比对验证后发展起来的低深度全基因组测序技术,将测序结果与人类参考基因组碱基序列进行比对,通过生物信息分析发现受检样本存在的cnvs(拷贝数变异,copynumber variation)。
3、cnv-seq在极低测序深度(0.1~1x)的基础下即可准确进行全基因组水平的染色体拷贝数异常检测,可检测长度低至100kb、嵌合比例低至10%的染色体拷贝数异常。cnv-seq对于拷贝数异常的检测的准确性比cma更高,并且由于cnv-seq的检测成本
4、因此,综上,有必要开发了基于cnv-seq技术筛查血液肿瘤标标本拷贝数变异的方法及检测系统,以促进血液肿瘤检测的发展。
技术实现思路
1、基于上述表述,本专利技术提供了一种基于二代测序技术筛查血液肿瘤标本拷贝数变异的方法及检测系统,以提高血液肿瘤获得性拷贝数变异的筛查技术。
2、本专利技术的关键是选建立了合适的拷贝数变异分析流程,提供了可视化的图表和数据,同时建立了常染色体和性染色体阳性拷贝数变异的报出阈值标准;本专利技术首次利用cnv-seq技术检测血液肿瘤的拷贝数变异,包括缺失或重复,关键是能检出血液肿瘤中的低比例嵌合缺失或重复,比传统细胞遗传学技术中的核型分析的分辨率更高、比fish的通量更高,比cma的成本更低。
3、本专利技术解决上述技术问题的技术方案如下:
4、本专利技术提供一种基于二代测序技术筛查血液肿瘤标本拷贝数变异的方法,包括以下步骤:
5、s1、获取待测样本的全基因组dna测序的原始数据;
6、s2、对所述原始数据进行预处理,得到合格的reads;
7、s3、通过软件将所述合格的reads定位至基因组相应位置,并以存储为bam格式的比对文件;
8、s3、根据所述比对文件计算相关参数,进行测序数据质控分析;
9、s5、通过软件将基因组划分成多个窗口,比较待测样本与阴性对照样本的每个窗口的对比参数来分析拷贝数变异,形成复制比率文件,根据所述复制比率文件生成拷贝数变异文件;
10、s6、对所述拷贝数变异文件进行注释。
11、在上述技术方案的基础上,本专利技术还可以做如下改进。
12、进一步地,在步骤s2中;
13、所述对所述原始数据进行预处理,具体包括:根据质量值对所述原始数据进行过滤;
14、滤除判读为n的碱基占比达到10%或以上的reads;
15、滤除质量值低于5的碱基占比达到50%的reads;
16、滤除整条序列碱基平均质量值低于10的reads;
17、截取或去除含有接头序列的reads。
18、进一步地,在步骤s3中;
19、所述相关参数包括:覆盖度、平均深度、重复序列比例、比对到目标区域的read比例、q20合格率、q30合格率和gc含量。
20、进一步地,在步骤s5中;
21、所述比较待测样本与阴性对照样本的每个窗口的对比参数来分析拷贝数变异,具体包括:
22、通过比较待测样本与阴性对照样本的每个窗口的标准化读取计数或者归一化读取深度的平均值或中位数值来分析拷贝数变异,以log2ration的形式体现;
23、其中,log2 ration代表待测标本与参考标本的拷贝数比值的对数值。
24、进一步地,在步骤s5中;
25、所述根据所述复制比率文件生成拷贝数变异文件,具体包括:
26、将相同或相近log2ration值的相邻窗口连接合并起来,形成复制分段文件,即生成拷贝数变异文件。
27、进一步地,在所述生成拷贝数变异文件之后,还包括:
28、收集snp array检测拷贝数变异结果为阳性的血液肿瘤基因组dna标本,做基因组拷贝数变异测序检测,得到基因组拷贝数变异测序检测的拷贝数变异文件;
29、通过与cma技术的检测结果进行对比,确定cma阳性变异所对应的基因组拷贝数变异测序检测的log2raito值,逐步筛查出基因组拷贝数变异测序检测的阳性筛选阈值。
30、进一步地,在步骤s6中,
31、所述对所述拷贝数变异文件进行注释,具体包括:
32、使用软件对拷贝数变异所在基因组坐标范围、变异类型做注释,包括变异区间包含的蛋白编码基因、致病基因、变异在正常人群中的频率,变异在疾病数据库的收录情况以及acmg评分情况。
33、第二方面、本专利技术还提供一种基于二代测序技术筛查血液肿瘤标本拷贝数变异的检测系统,包括:
34、原始数据获取模块,用于获取待测样本的全基因组dna测序的原始数据。
35、质控和过滤模块,用于对所述原始数据进行预处理,得到合格的reads。序列比对模块,用于通过软件将所述合格的reads定位至基因组相应位置,并以存储为bam格式的比对文件。
36、测序数据质控模块,用于根据所述比对文件计算相关参数,进行测序数据质控分析;
37、拷贝数变异检测模块,用于通过软件将基因组划分成多个窗口,比较待测样本与阴性对照样本的每个窗口的对比参数来分析拷贝数变异,形成复制比率文件,根据所述复制比率文件生成拷贝数变异文件;
38、拷贝数变异注释模块,用于对所述拷贝数变异文件进行注释。
39、第三方面、本专利技术还提供一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上本文档来自技高网...
【技术保护点】
1.一种基于二代测序技术筛查血液肿瘤标本拷贝数变异的方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的基于二代测序技术筛查血液肿瘤标本拷贝数变异的方法,其特征在于,在步骤S2中;
3.根据权利要求1所述的基于二代测序技术筛查血液肿瘤标本拷贝数变异的方法,其特征在于,在步骤S3中;
4.根据权利要求1所述的基于二代测序技术筛查血液肿瘤标本拷贝数变异的方法,其特征在于,在步骤S5中;
5.根据权利要求3所述的基于二代测序技术筛查血液肿瘤标本拷贝数变异的方法,其特征在于,在步骤S5中;
6.根据权利要求5所述的基于二代测序技术筛查血液肿瘤标本拷贝数变异的方法,其特征在于,
7.根据权利要求1所述的基于二代测序技术筛查血液肿瘤标本拷贝数变异的方法,其特征在于,在步骤S6中,
8.一种基于二代测序技术筛查血液肿瘤标本拷贝数变异的检测系统,其特征在于,包括:
9.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序当被处理器执行时使所述处理器执行如权利要求1至7任一项所述的基于二代测序技术筛查血液肿瘤标本拷贝数变异的方法。
...【技术特征摘要】
1.一种基于二代测序技术筛查血液肿瘤标本拷贝数变异的方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的基于二代测序技术筛查血液肿瘤标本拷贝数变异的方法,其特征在于,在步骤s2中;
3.根据权利要求1所述的基于二代测序技术筛查血液肿瘤标本拷贝数变异的方法,其特征在于,在步骤s3中;
4.根据权利要求1所述的基于二代测序技术筛查血液肿瘤标本拷贝数变异的方法,其特征在于,在步骤s5中;
5.根据权利要求3所述的基于二代测序技术筛查血液肿瘤标本拷贝数变异的方法,其特征在于,在步骤s5中;
6.根据权利要求5所述的基于二代测序技术筛查血液肿瘤标本拷贝数变异的方法,其特征在于,
<...【专利技术属性】
技术研发人员:杨伟红,马浩然,孙黎,李小青,
申请(专利权)人:武汉康圣达医学检验所有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。