System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及一种高通量测序文库的接头污染率的预测方法,属于高通量测序。
技术介绍
1、在高通量基因测序中,文库构建是非常重要的一个步骤,而接头连接是文库构建的关键步骤之一。接头连接时,接头试剂中会因为以下的原因导致污染:
2、1)引物污染:接头试剂中的引物可能存在杂质或者降解产物,这些杂质会影响接头连接的效率和准确性。2)酶污染:接头试剂中的酶可能受到杂质或者不完全纯化的影响,导致酶活性降低或者产生不良反应。3)实验室污染:在接头连接的实验操作过程以及接头连接试剂的配制过程中,可能会受到环境、实验仪器、实验室的气溶胶或者实验人员等因素的污染,导致接头试剂的污染。
3、接头污染会导致以下问题:1)文库构建失败:接头污染会影响接头连接的效率和准确性,导致文库构建失败。2)测序结果不准确:接头污染会导致测序数据中出现假阳性或假阴性结果,影响测序数据的准确性和可靠性。3)数据解读困难:接头污染会使得数据分析和解读变得困难,可能会影响对基因组或转录组的研究结果的准确性和可信度。因此,在高通量基因测序中,需要严格控制接头试剂的质量和纯度,避免接头污染对实验结果的影响。
4、因此,如何能够对不同的试剂进行接头污染率的预先评估,对于测序质量有着重要的影响。
技术实现思路
1、本专利技术涉及一种高通量测序文库的接头污染率的预测方法,本方法通过采用特定的核酸序列,并且采用待测试接头进行文库的构建,再通过高通量测序获得目标读段的数量,进而可以统计出接头试剂本身所存在
2、一种高通量测序文库的接头污染率的预测方法,包括如下步骤:
3、步骤1,获得多个不同的dna标准品,并将各个dna标准品上连接不同的接头,获得测序文库;
4、步骤2,对测序文库进行上机测序,获得测序数据;
5、步骤3,测序数据中,对于每个接头上的读段数据,按下式计算出该接头的污染率:
6、y=(x1+x2+x3+…+xn)*m/xi,其中,x1……xn是指非目标标签下的标准品reads数,xi是指目标标签下的标准品reads数;m为系数。
7、步骤2中,获得的测序数据需要经过去除低质量数据的处理。
8、所述的非目标标签是指建库时未进行样品与特定接头进行连接的标签;所述的目标目标标签是指建库时进行了样本与特定接头进行连接的标签。
9、所述的接头种类2-5000种。
10、所述的dna标准品的种类是2-50种。
11、所述的标准品的dna碱基长度是50-500bp。
12、建库中采用单端测序接头或者双端测序接头。
13、所述的接头为y型接头。
14、y型接头上的标签长度5-15nt。
15、y型接头上的互补序列长度是8-20bp。
16、有益效果:
17、文库构建是ngs检测的关键环节,在文库构建过程中,需要将带有index标签序列的接头与目标样本的dna分子片段连接,使该目标样本dna分子片段携带上相同的index标签序列。但是,接头生产过程中可能存在携带有不同index标签信息的接头间产生交叉污染现象,导致样本间的交叉污染,最终影响测序样本的突变检出。如何评估接头污染率至关重要。为此,采用生物信息学技术模拟出n条特定的已知核酸序列并合成出标准品作为目标序列,接头连接后使每种标准品携带有不同标签index的接头,ngs测序完成后通过生物信息学分析出目的读段的reads数及非目的读段的reads数即可判定出接头污染率的情况。
本文档来自技高网...【技术保护点】
1.一种高通量测序文库的接头污染率的预测方法,其特征在于,包括如下步骤:
2.根据权利要求1所述的高通量测序文库的接头污染率的预测方法,其特征在于,步骤2中,获得的测序数据需要经过去除低质量数据的处理。
3.根据权利要求1所述的高通量测序文库的接头污染率的预测方法,其特征在于,所述的非目标标签是指建库时未进行样品与特定接头进行连接的标签;所述的目标标签是指建库时进行了样本与特定接头进行连接的标签。
4.根据权利要求1所述的高通量测序文库的接头污染率的预测方法,其特征在于,所述的接头种类2-5000种。
5.根据权利要求1所述的高通量测序文库的接头污染率的预测方法,其特征在于,所述的DNA标准品的种类是2-50种。
6.根据权利要求1所述的高通量测序文库的接头污染率的预测方法,其特征在于,所述的标准品的DNA碱基长度是50-500bp。
7.根据权利要求1所述的高通量测序文库的接头污染率的预测方法,其特征在于,建库中采用单端测序接头或者双端测序接头。
8.根据权利要求1所述的高通量测序文库的接头污染
9.根据权利要求1所述的高通量测序文库的接头污染率的预测方法,其特征在于,Y型接头上的标签长度5-15nt。
10.根据权利要求1所述的高通量测序文库的接头污染率的预测方法,其特征在于,Y型接头上的互补序列长度是8-20bp。
...【技术特征摘要】
1.一种高通量测序文库的接头污染率的预测方法,其特征在于,包括如下步骤:
2.根据权利要求1所述的高通量测序文库的接头污染率的预测方法,其特征在于,步骤2中,获得的测序数据需要经过去除低质量数据的处理。
3.根据权利要求1所述的高通量测序文库的接头污染率的预测方法,其特征在于,所述的非目标标签是指建库时未进行样品与特定接头进行连接的标签;所述的目标标签是指建库时进行了样本与特定接头进行连接的标签。
4.根据权利要求1所述的高通量测序文库的接头污染率的预测方法,其特征在于,所述的接头种类2-5000种。
5.根据权利要求1所述的高通量测序文库的接头污染率的预测方法,其特征在于,所述的dna标准品...
【专利技术属性】
技术研发人员:邵阳,高存义,刘思思,杨若巍,王梦瑶,李月霞,
申请(专利权)人:南京世和基因生物技术股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。