一种探针混合比例设计方法及混合探针集与测序文库构建方法,探针混合比例设计方法包括:预估步骤,包括提供探针集,根据每种探针集的芯片大小,以及测序深度要求,对探针集的混合比例进行预估;预测序步骤,包括根据预估的混合比例,设置预混比例,将探针集按照预混比例混合,得到预混探针,将预混探针与子文库杂交,进行预测序,获得符合预期的探针混合比例。本发明专利技术可以根据产品需求,分别设计多个不同目标区域的探针,可根据测序深度需求进行混合探针配制,从而达到针对不同目标区域同时进行不同测序深度检测的目的,成本低;亦可根据产品目标的变化进行探针配比的调整,或进行不同探针组合方式的检测,灵活性高。灵活性高。灵活性高。
【技术实现步骤摘要】
探针混合比例设计方法及混合探针集与测序文库构建方法
[0001]本专利技术涉及基因测序
,具体涉及一种探针混合比例设计方法及混合探针集与测序文库构建方法。
技术介绍
[0002]在肿瘤高通量测序中,常见的检测类型分为三种:SNV、InDel和SV。SNV,即单核苷酸变异(single nucleotide variations),是由单个碱基改变导致的变异类型,包括错义突变、无义突变及同义突变三种类型。InDel,包括insertion和deletion,指在基因组的某个位置上所发生的小片段序列的插入或者缺失,其长度通常≤50bp。SV,即结构变异(Structure Varia ntions),指基因组上较大长度的序列变化和位置关系变化,包括长度在50bp以上的长片段序列插入或者缺失(Big InDel)、串联重复(Tandem repeat)、染色体倒位(Inversion)、染色体内部或染色体之间的序列易位(Translocation)、拷贝数变异(CNV)以及形式更为复杂的嵌合性变异。其中,拷贝数变异(copy number variation,CNV)是基因组结构变异的重要组成部分。一般指长度为1kb以上的基因组大片段的拷贝数扩增或缺失。CNV的数量和复杂程度是许多实体肿瘤发生的主要原因,同时也是重要的诊断、预后指标。CNV的检测原理如下:根据CNV片段大小的不同,通常可分为三个等级。一是常规的外显子层面或基因层面的CN V,其CNV变异的片段大小通常为Kb级别;二是与基因组瘢痕相关的较大的CNV片段,包括LOH(Loss of Heterozygosity,杂合性缺失)、TAI(Telomeric Allelic Imbalance,端粒等位基因不平衡)和LST(Large
‑
scale Sate Transition,大片段迁移),其CNV变异的片段大小通常为Mb级别;三是整个染色体级别的扩增或缺失,会导致肿瘤细胞染色体不稳定性,通常是由染色体的不均等分离导致的。
[0003]在相同的测序深度下,CNV的片段越大,在测序数据中就越容易观察到。因此,根据检测目的的不同,需要设置不同的测序深度。例如,为了更加全面地评估患者的同源重组缺陷状态,则需要利用高深度的目标区域靶向捕获测序技术检测BRCA1/2等HRR(同源重组修复)相关基因的各种类型的变异,同时利用低深度的目标区域靶向捕获测序技术检测与基因组瘢痕相关的较大的CNV片段(LOH,TAI及LST)。
[0004]现有技术中,若要实现不同目标区域的差异化深度检测,主要通过以下技术方案进行检测:
[0005]A)产品打包:通过执行不同的实验流程,进行不同目标区域的靶向捕获和高通量测序,从而达到不同目标区域进行不同测序深度的高通量检测的目的。这种方式生产成本高,需要更多的人力和物料资源。
[0006]B)捕获探针优化:根据产品设计思路,在探针设计时,对于高深度的目标区域进行探针加密处理,而对于低深度的目标区域可进行探针条数的减半处理。这种设计方式的主要弊端在于,根据理论推算进行的探针加密或减半处理,但在实际应用过程中可能存在不符合检测需求的风险,此时就需要通过增加测序数据量或重新进行探针合成来进行补救。
[0007]因此,现有的针对不同目标区域的差异化深度检测方法存在灵活性差、检测成本
高等缺陷。
技术实现思路
[0008]根据第一方面,在一实施例中,提供一种探针混合比例设计方法,包括:
[0009]预估步骤,包括提供至少两种用于捕获待测文库中目标区域的探针集,每种探针集所捕获的目标区域不同,根据每种探针集的芯片大小,以及待测文库中不同目标区域的测序深度要求,对探针集的混合比例进行预估;
[0010]预测序步骤,包括根据预估的混合比例,设置至少一种预混比例,将所述至少两种用于捕获待测文库中目标区域的探针集按照所述预混比例混合,得到至少一种预混探针,每种预混比例对应一种预混探针,将各种预混比例的预混探针分别与来源于待测文库的子文库杂交,进行预测序,获得不同目标区域的测序深度及其比值,根据所述不同目标区域的测序深度及其比值,获得符合预期的探针混合比例。
[0011]根据第二方面,在一实施例中,提供一种混合探针集,包含至少两种用于捕获待测文库中目标区域的探针集,所述至少两种用于捕获待测文库中目标区域的探针集的混合比例为第一方面的探针混合比例设计方法获得的探针混合比例。
[0012]根据第二方面,在一实施例中,提供一种试剂盒,包含第二方面所述混合探针集。
[0013]根据第四方面,在一实施例中,提供一种测序文库构建方法,包括:
[0014]使第二方面所述混合探针集与待测文库混合反应,获得探针捕获后的文库。
[0015]依据上述实施例的一种探针混合比例设计方法及混合探针集与测序文库构建方法,可以根据产品需求,分别设计多个不同目标区域的探针,可根据测序深度需求进行混合探针配制,从而达到针对不同目标区域同时进行不同测序深度检测的目的,体现为本专利技术的成本低的特点;亦可根据产品目标的变化进行探针配比的调整,从而实现新的产品性能,或进行不同探针组合方式的检测,体现为本专利技术的灵活性高。
附图说明
[0016]图1为一种实施例的混合探针比例的设计过程图。
[0017]图2为实施例1的QC分析图。
[0018]图3为实施例1中基于53例血细胞的混合探针C的两个探针区域的深度比值图。
[0019]图4为实施例1中基于53例血细胞的混合探针C的捕获效率统计结果图。
[0020]图5为实施例1中基于53例血细胞的混合探针C的Fold80统计结果。
[0021]图6为实施例3中基于53例血细胞的混合探针B的两个探针区域的深度比值图。
[0022]图7为实施例3中基于53例血细胞的混合探针B的捕获效率统计结果图。
[0023]图8为实施例3中基于53例血细胞的混合探针B的Fold80统计结果。
具体实施方式
[0024]下面通过具体实施方式结合附图对本专利技术作进一步详细说明。其中不同实施方式中类似元件采用了相关联的类似的元件标号。在以下的实施方式中,很多细节描述是为了使得本申请能被更好的理解。然而,本领域技术人员可以毫不费力的认识到,其中部分特征在不同情况下是可以省略的,或者可以由其他元件、材料、方法所替代。在某些情况下,本申
请相关的一些操作并没有在说明书中显示或者描述,这是为了避免本申请的核心部分被过多的描述所淹没,而对于本领域技术人员而言,详细描述这些相关操作并不是必要的,他们根据说明书中的描述以及本领域的一般技术知识即可完整了解相关操作。
[0025]另外,说明书中所描述的特点、操作或者特征可以以任意适当的方式结合形成各种实施方式。同时,方法描述中的各步骤或者动作也可以按照本领域技术人员所能显而易见的方式进行顺序调换或调整。因此,说明书和附图中的各种顺序只是为了清楚描述某一个实施本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种探针混合比例设计方法,其特征在于,包括:预估步骤,包括提供至少两种用于捕获待测文库中目标区域的探针集,每种探针集所捕获的目标区域不同,根据每种探针集的芯片大小,以及待测文库中不同目标区域的测序深度要求,对探针集的混合比例进行预估;预测序步骤,包括根据预估的混合比例,设置至少一种预混比例,将所述至少两种用于捕获待测文库中目标区域的探针集按照所述预混比例混合,得到至少一种预混探针,每种预混比例对应一种预混探针,将各种预混比例的预混探针分别与来源于待测文库的子文库杂交,进行预测序,获得不同目标区域的测序深度及其比值,根据所述不同目标区域的测序深度及其比值,获得符合预期的探针混合比例。2.如权利要求1所述的探针混合比例设计方法,其特征在于,预估步骤中,还包括对至少一种探针集进行稀释,得到稀释的探针集,用于预测序步骤中按照所述预混比例混合。3.如权利要求1所述的探针混合比例设计方法,其特征在于,所述至少两种用于捕获待测文库中目标区域的探针集包含如下探针组合中的至少一种:1)包含第一探针集、第二探针集,所述第一探针集用于检测同源重组修复基因的单核苷酸变异、插入或者缺失、基因拷贝数变异中的至少一种,所述第二探针集用于检测基因组瘢痕;2)包含第三探针集、第四探针集、第五探针集,所述第三探针集用于检测全外显子组测序数据,所述第四探针集用于检测微卫星不稳定,所述第五探针集用于检测融合基因。4.如权利要求3所述的探针混合比例设计方法,其特征在于,所述第二探针集用于检测与基因组瘢痕相关的CNV片段;所述与基因组瘢痕相关的CNV片段包括杂合性缺失、端粒等位基因不平衡、大片段迁移中的至少一种。5.如权利要求1所述的探针混合比例设计方法,其特征在于,按照与待测文库相同的...
【专利技术属性】
技术研发人员:陈冬菊,宋程程,蔡宇航,邵明辉,王春丽,石太平,
申请(专利权)人:天津华大医学检验所有限公司华大生物科技武汉有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。