DNA文库的制备方法和对DNA文库的分析方法技术

技术编号:22046982 阅读:63 留言:0更新日期:2019-09-07 12:41
本发明专利技术涉及DNA文库的制备方法。所述DNA文库的制备方法包括预文库的制备过程,其中所述的预文库制备过程包括DNA的制备、末端修复和3’端加A,用防污染接头进行接头连接,接头连接产物纯化,预文库扩增,扩增的预文库纯化。本发明专利技术还提供了防污染接头在制备用于DNA文库捕获试剂盒中的用途以及对本发明专利技术的制备方法制备的DNA文库进行生物信息学分析的方法。本发明专利技术的制备方法降低样本间交叉污染风险。

Preparation of DNA Library and Analysis of DNA Library

【技术实现步骤摘要】
DNA文库的制备方法和对DNA文库的分析方法
本专利技术属于核酸测序领域。具体地,本专利技术涉及DNA文库的制备及对DNA文库的分析方法。
技术介绍
随着与用药敏感性、耐药性、预后等多种临床价值密切相关的基因变异不断被发现,临床的迫切需求和科学的发展推动了我国在基于二代测序(NGS)技术的多基因检测产品的监管方式上的改革与创新,近几年NGS多基因检测产品在国内得到了极大的普及和推广,市场需求急速上升,面对更多的样本量和更短的检测周期,样本的建库检测流程有了更大的压力。增加操作人员和引入自动化设备可以提高检测通量,但同时样本间交叉污染风险也相应升高。本领域需要降低样本间交叉污染风险的DNA文库制备方法。
技术实现思路
本专利技术基于专利技术人的下述发现:在现有技术中的DNA建库流程在最后一步通过PCR的方法给不同样本添加特异性标签,即直到建库最后样本才被彼此区分开,在此步骤之前,人工手动建库实验操作都是靠物理隔离(管盖,封膜)来隔离不同样本,严格遵守实验SOP。为了提高检测通量而增加每个操作员的建库通量或者增加操作员或者将该建库流程转化到自动化工作站平台,都会在无形中提高样本交叉污染的风险。专利技术人在中国专利申请号:201611154433.8(该专利通过引用并入本文)中提供了一种DNA文库建库方法。在此基础上,专利技术人进一步进行了改进。本专利技术把样本区分从建库最后一步提前到建库流程的第二步——接头连接阶段,只需要将原本的单一接头对替换成新的4种接头对(只比原来的接头多2~3bp),再通过不同的位置排列即可。每个样本连接一种接头对,4种接头对在96孔板上通过特别的模式排列,不论有多少个样本,都可以确保每个样本使用的接头对与其周围的样本的接头对不一样,再通过更新的生物信息分析流程就可以彻底消除交叉污染的风险。在一方面,本专利技术提供了DNA文库的制备方法,其包括预文库的制备过程,其中所述的预文库制备过程包括DNA的制备、末端修复和3’端加A,用防污染接头进行接头连接,接头连接产物纯化,预文库扩增,扩增的预文库纯化,其中所述防污染接头与用于制备DNA文库的原始接头相比在3’端或5’端额外添加2-3个碱基,形成多对防污染接头。在一个实施方案中,多对防污染接头是4对、5对、6对、7对或8对防污染接头。在一个实施方案中,防污染接头的设计满足以下标准:(1)从原始接头的3’端开始添加碱基,并保证添加的最后一个碱基是T碱基;(2)在原始接头的3’端开始的第一个碱基位置分别添加A,T,G和C以保证测序中信号均衡,不影响碱基检出判断;(3)在原始接头的3’端开始添加的每个位置,同一种碱基占比不能超过50%;根据上述(1)-(3),获得多个第一防污染接头;且(4)原始接头在5’端添加与第一防污染接头中除末位T以外的额外碱基反向互补的碱基并且5’端第一位碱基被磷酸化,从而获得多个第二防污染接头。在一个实施方案中,在原始接头的3’端添加的第一个近端碱基位置上,有4种碱基,每种碱基占比均为25%;在原始接头3’端添加的第二个近端碱基位置上,有3种碱基,T碱基占比50%,剩下的2种碱基各占25%;在原始接头3’或5’端添加的第三个近端碱基位置上,两个接头在该位置为无碱基,另外两个接头是固定碱基T,占比50%。在一个实施方案中,所述原始接头的序列是:ADM-A5:ACACTCTTTCCCTACACGACGCTCTTCCGATC*TADM-A7:/5Phos/GATCGGAAGAGCACACGTCTGAACTCCAGTCAC;*代表硫代修饰;/5Phos/代表磷酸化修饰。在一个实施方案中,对于多个第一防污染接头,所述额外的碱基序列是A*T、G*T、TC*T和CA*T;且对于多个第二防污染接头,所述额外的碱基是TA、CA、GAA和TGA,*代表硫代修饰;/5Phos/代表磷酸化修饰。在一个实施方案中,防污染接头的序列是:ACA1-A5:ACA1-A7:ACA2-A5:ACA2-A7:ACA3-A5:ACA3-A7:ACA4-A5:ACA4-A7:分别对应于SEQIDNo.1-8。*代表硫代修饰;/5Phos/代表磷酸化修饰,其中加下划线且粗体的碱基是额外的碱基。在一个实施方案中,测试样品排列为使得所述每种防污染接头与相邻位置或周围位置的防污染接头不同。在一个实施方案中,使用以下引物进行预文库扩增:OligoPPS1.1:ACACTCTTTCCCTACACGACGCTC;OligoPPS2.1:GTGACTGGAGTTCAGACGTGTGC(分别对应于SEQIDNo.9-10)。在一个实施方案中,测试样品排列为使得防污染接头的基本排列单位为:其中ACA1表示使用ACA1-A5和ACA1-A7,ACA2表示使用ACA2-A5和ACA2-A7,ACA3表示使用ACA3-A5和ACA3-A7,且ACA4表示使用ACA4-A5和ACA4-A7。在另一个方面,本专利技术提供了根据本专利技术所述的接头在制备用于DNA文库捕获试剂盒中的用途。在一个实施方案中,DNA文库为cfDNA文库、白细胞gDNA文库或组织来源的DNA文库。在又一个方面,提供了对本专利技术的制备方法制备的DNA文库进行生物信息学分析的方法,其包括对DNA文库进行测序;对测序数据进行分析;满足如下两个条件的第1条,而不满足第2条则认为一对读段其5’端存在防污染接头,3’末端不存在防污染接头序列,而如下两个条件均满足,则认为一对读段其5’端和3’末端均存在防污染接头序列;条件1:具有相同序列ID的一对读段,读段1序列和读段2序列5’端的前2-3bp的碱基分别与防污染接头的5’端前2-3bp的碱基计算哈明距离,数值加和小于等于1;条件2:在满足条件1的情况下,且一对读段等长,其中一条读段的反向互补序列与另外一条读段的正向序列近似相同,即二者序列字符计算的哈明距离值小于或等于软件默认设定的数值4时被认为是近似相同。在一个实施方案中,在后续的分析过程中,对于只5’端存在防污染接头特有序列的一对读段,只减除读段的5’端的2-3bp的碱基;而对于5’端和3’末端均存在防污染接头特有序列的一对读段则均减除读段的5’端和3’末端的2-3bp的碱基。在一个实施方案中,将两种减除防污染接头序列后的一对读段分别放在后续进行分析的读段1和读段2的fastq文件中;而对于不满足条件1的一对读段,则将这对读段分别放入遗弃的读段1和读段2的fastq文件中用于后续检查分析。在一个实施方案中,方法包括判断防污染接头类型,在分析的过程中给出判断的接头序列和主要接头类型占比;如果该主要接头类型占比小于90%认为该样本受到了其他样本的污染,而停止后面的分析步骤;如果该主要接头类型占比大于90%但小于98%,认为该样本受到其他样本的轻微污染,在去除含有污染接头的读段后可进行后面的分析步骤;如果该主要接头类型占比大于98%,则认为该样本未被污染,直接进行后面的分析步骤。在一个实施方案中,最终的分析结果中统计原始数据文件的总读段对数,进行了接头剪切的读段对数,最终保留的读段对数和遗弃的读段对数。附图说明图1:现有技术的建库操作流程示意图。片段化的cfDNA末端会有损伤以及中间会有断口或切口;经过组合酶的处理,DNA得以修复,3’末端被加上A;连接酶连接不本文档来自技高网...

【技术保护点】
1.DNA文库的制备方法,其包括预文库的制备过程,其中所述的预文库制备过程包括DNA的制备,末端修复和3’端加A,用防污染接头进行接头连接,接头连接产物纯化,预文库扩增,扩增的预文库纯化,其中所述防污染接头与用于制备DNA文库的原始接头相比在3’端或5’端额外添加2‑3个碱基,形成多对防污染接头,优选地,其中所述多对防污染接头是4对、5对、6对、7对或8对防污染接头。

【技术特征摘要】
1.DNA文库的制备方法,其包括预文库的制备过程,其中所述的预文库制备过程包括DNA的制备,末端修复和3’端加A,用防污染接头进行接头连接,接头连接产物纯化,预文库扩增,扩增的预文库纯化,其中所述防污染接头与用于制备DNA文库的原始接头相比在3’端或5’端额外添加2-3个碱基,形成多对防污染接头,优选地,其中所述多对防污染接头是4对、5对、6对、7对或8对防污染接头。2.根据权利要求1的制备方法,其中所述防污染接头的设计满足以下标准:(1)从原始接头的3’端开始添加碱基,并保证添加的最后一个碱基是T碱基;(2)在原始接头的3’端开始的第一个碱基位置分别添加A,T,G和C以保证测序中信号均衡,不影响碱基检出判断;(3)在原始接头的3’端开始添加的每个位置,同一种碱基占比不能超过50%;根据上述(1)-(3),获得多个第一防污染接头;且(4)原始接头在5’端添加与多个第一防污染接头中除末位T以外的额外碱基反向互补的碱基并且5’端第一位碱基被磷酸化,从而获得多个第二防污染接头。3.根据权利要求1或2的制备方法,其中在原始接头的3’端添加的第一个近端碱基位置上,有4种碱基,每种碱基占比均为25%;在原始接头3’端添加的第二个近端碱基位置上,有3种碱基,T碱基占比50%,剩下的2种碱基各占25%;在原始接头3’或5’端添加的第三个近端碱基位置上,两个接头在该位置为无碱基,另外两个接头是固定碱基T,占比50%。4.根据前述权利要求中任一项的制备方法,其中所述原始接头的序列是:ADM-A5:ACACTCTTTCCCTACACGACGCTCTTCCGATC*TADM-A7:/5Phos/GATCGGAAGAGCACACGTCTGAACTCCAGTCAC;*代表硫代修饰;/5Phos/代表磷酸化修饰。5.根据前述权利要求中任一项的制备方法,其中对于多个第一防污染接头,所述额外的碱基序列是A*T、G*T、TC*T和CA*T;且对于多个第二防污染接头,所述额外的碱基是TA、CA、GAA和TGA,*代表硫代修饰;/5Phos/代表磷酸化修饰。6.根据前述权利要求中任一项的制备方法,其中所述防污染接头的序列是:ACA1-A5:ACA1-A7:ACA2-A5:ACA2-A7:ACA3-A5:ACA3-A7:ACA4-A5:ACA4-A7:*代表硫代修饰;/5Phos/代表磷酸化修饰,其中加下划线且粗体的碱基是额外的碱基。7.根据前述权利要求中任一项的制备方法,其中测试样品排列为使得所述每种防污染接头与相邻位置或周围位置的防污染接头不同。8.根据前述权利要求中任一项的制备方法,其中使用以下引物PPS进行预文库扩增:OligoPPS1.1:ACACTCTTTCCC...

【专利技术属性】
技术研发人员:张之宏王筱恬张振顾纭兆汉雨生张海波
申请(专利权)人:广州燃石医学检验所有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1