描述了一种用于校正与从模板分子的群体产生的序列数据的相位同步相关联的误差的方法的实施例,该方法包括以下步骤:检测响应于测序反应期间引入的核甘酸种类而产生的信号;针对从每个核甘酸种类检测的信号产生观测的值;利用推进值和不完全延伸值从观测的值定义正掺入值和负掺入值;利用从与负掺入值相关联的观测的值导出的噪声值修订推进值和不完全延伸值;利用修订的推进值和修订的不完全延伸值重新定义正掺入值和负掺入值;以及重复修订和重新定义的步骤,直到正掺入值和负掺入值收敛为止。
【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及分子生物学领域。更具体而言,本专利技术涉及一种递归方法,用于校正通过一般所谓的“合成测序”(SBS)技术产生的核酸序列数据中的相位同步误差。
技术介绍
合成测序(SBS) —般是指用于确定核酸样本中一个或多个核苷酸的身份或序列构成的方法,其中所述方法包括分步合成与要被确定其核苷酸序列构成的模板核酸分子互补的单链多核苷酸分子。例如,SBS技术通常通过在对应序列位置向与模板分子的核酸种类互补的新生多核苷酸分子添加单个核酸(也称为核甘酸)种类而工作。一般利用本领域 中已知的多种方法来检测向新生分子添加核酸种类,这些方法包括,但不限于,所谓的焦磷酸测序,所述焦磷酸测序可以包括酶促或电子(即利用ISFET或其他相关技术的pH检测)检测策略或荧光检测方法,在一些实施例中,其可以采用可逆的终止子。典型地,该过程迭代,直到合成了完全(即,所有序列位置被表示)或期望的与模板互补的序列长度为止。在美国专利 No. 6274320 ;No. 7211390 ;No. 7244559 ;No. 7264929 和 No. 7335762 中描述了 SBS技术的一些实例,在此出于所有目的通过引用将所述专利的每一个整体地并入本文。在SBS的一些实施例中,寡核苷酸引物被设计成对样品模板分子的预定互补位置退火。在存在核酸聚合酶的情况下,为引物/模板复合物提供核甘酸种类。如果核甘酸种类与对应于样本模板分子上直接与寡核苷酸引物的3’末端相邻的序列位置的核酸种类互补,那么聚合酶将利用所述核甘酸种类延伸所述引物。或者,在一些实施例中,同时为引物/模板复合物提供多个感兴趣的核甘酸种类(典型地为A、G、C和T),并且在样本模板分子上直接与寡核苷酸引物的3’末端相邻的对应序列位置处互补的核甘酸种类被掺入。在所述实施例的任一个中,可以用化学方式阻断核甘酸种类(例如在3’ -O位置处)以防止进一步延伸,并且需要在下一轮合成之前解除阻断核甘酸种类。如上所述,可以通过本领域中已知的多种方法检测核甘酸种类的掺入,例如,通过以酶促或电子方式检测焦磷酸盐(PPi)的释放(美国专利No. 6210891 ;No. 6258568和No. 6828100中描述的实例,在此出于所有目的通过引用将所述专利的每一个整体地并入本文),或通过结合到核苷酸的可检测标记。可检测标记的一些实例包括,但不限于,质量标签和荧光或化学发光标记。在典型的实施例中,例如,通过洗涤去除未掺入的核苷酸。在使用可检测标记的实施例中,通常必须在随后合成循环之前将它们灭活(例如,通过化学裂解或光漂白)。如上所述,然后可以利用另一核甘酸种类或多个感兴趣的核甘酸种类来查询模板/聚合酶复合物中的下一个序列位置。核甘酸添加、引物延伸、信号采集和洗涤的重复循环导致模板链的核苷酸序列的确定。在SBS的典型实施例中,在任何一个测序反应中同时分析大量的基本相同的模板分子或基本相同的模板分子的群体(例如103、104、105、IO6或IO7个分子),以便获得对于可靠检测而言足够强的信号。对于低信噪比需要在给定反应的群体中与基本所有模板分子相关联的新生分子的所谓的“均匀延伸”。如这里使用的,术语“均匀延伸”一般是指延伸反应的关系或相位,其中上述基本相同的模板分子的群体的每个成员均匀地执行反应中的相同步骤。例如,当模板分子在针对每个相关联的模板分子的相同序列位置执行相同的反应步骤时,可以将与模板分子的群体相关联的每个延伸反应描述为彼此同相(有时也称为相位同步或相位同步性)。不过,相关领域的普通技术人员将认识到,每个群体中的一小部分模板分子与该群体中的其余模板分子失去或脱离相位同步性(即,与该部分模板分子相关联的反应在于该群体上进行的测序反应中超前于或落后于其他模板分子)(在Ronaghi,Μ.的^Pyrosequencing sheds light on DNA sequencing”,Genome Res. 11,3-11 (2001)中描述了一些实例,在此出于所有目的通过引用将其整体地并入本文)。例如,将一个或多个核甘酸种类适当地掺入一个或多个新生分子中以将序列延伸了一个位置的反应的失败导致每个后续反应处于在群体的其余部分的序列位置之后并且与其异相的序列位置。这里将该效应称为“不完全延伸”(IE)。或者,在这里将通过在位于群体的其余部分的序列位置之前并且与其异相的序列位置中掺入一个或多个核甘酸种类而不适当地延伸新生分子称为“推进 (carry forward) ” (CF)。这里将CF和IE的组合效应称为CAFIE。关于不完全延伸的问题,可能存在几种可能的机制,其有助于可能单独地或以某种组合发生的IE。有助于IE的可能的机制的一个实例可以包括缺少被提供给模板/聚合酶复合物的子集的核甘酸种类。有助于IE的可能的机制的另一实例可以包括聚合酶分子的子集未能掺入被适当地提供用于掺入新生分子中的核甘酸种类。有助于IE的可能的机制的另一实例可以包括在模板/聚合酶复合物处没有聚合酶活动。至少部分地说明SBS方法中的IE误差的又一机制的实例可以包括由Metzger评论的所谓的循环可逆终止(CRT) (Genome Res. 2005Dec ;15(12) :1767_76,在此出于所有目的通过引用将其整体地并入本文)。在CRT中,核甘酸种类具有改性的3’-0基团(通常称为帽、保护基团或终止子),其防止在掺入单个核甘酸种类之后新生分子的进一步延伸。这些保护基团被设计成可以通过包括化学处理或光处理的多种方法之一除去。在解除3’ -O位置的保护(并生成3' -OH基团)时,可以用另一核甘酸种类延伸新生分子。不过,在由于解除保护效率不佳(解除保护不完全)导致新生分子的一部分保持被保护时,将发生相位异步。在后续循环中,保持被保护的这部分新生分子将不会得到延伸,从而将落后于群体的其余部分的序列位置并与其异相。不过,后续解除保护步骤可以成功除去至少一些先前被不适当地保持的保护基团,导致重新开始延伸,从新生分子生成信号并继续与群体的其余部分异相。本领域的普通技术人员将认识到可能存在其他有助于IE的因素,并且由此其不限于上文提供的实例。本专利技术目前描述的实施例的系统和方法针对的是校正可能因为任何这种单个或组合的原因或机制造成的IE误差。例如,校正由于耦合不完全解除保护和后续成功解除保护导致的IE误差是本专利技术的一个目的。对于CF的问题,可能存在几种可能的机制,其有助于可能单独地或以某种组合发生的CF。例如,一种可能的机制可以包括从先前循环剩余的过多核甘酸种类。可能发生这种情况,因为在循环结束时执行的洗涤过程将从该循环除去非常大多数的,但未必是全部的核甘酸种类。在本实例中,结果可能包括“G”核甘酸种类循环中存在的一小部分的“A”核甘酸种类,如果在模板分子中的对应序列位置存在互补的“T”核甘酸种类,则导致新生分子的一小部分的延伸。导致推进效应的可能的机制的另一实例可以包括聚合酶误差,例如向不与模板分子上的核甘酸种类互补的新生分子中不适当地掺入核甘酸种类。至少部分地说明SBS方法中的CF的又一机制的实例可以包括由Metzger评论的所谓的循环可逆终止(CRT) (Genome Res。2005 Dec ;15(12) : 1767-7本文档来自技高网...
【技术保护点】
【技术特征摘要】
【国外来华专利技术】2010.03.31 US 61/319,4761.一种用于递归地校正与从模板分子的基本相同的副本的群体产生的序列数据的相位同步相关联的误差的方法,该方法包括 (a)检测响应于测序反应期间引入的多个核甘酸种类而产生的多个信号; (b)针对从每个核甘酸种类检测的信号产生观测的值;(C)利用推进值和不完全延伸值从观测的值定义多个正掺入值和多个负掺入值; (d)利用噪声值修订推进值和不完全延伸值,其中噪声值是从与负掺入值相关联的多个观测的值导出的; (e)利用修订的推进值和修订的不完全延伸值重新定义该多个正掺入值和该多个负掺入值;以及 (f)重复步骤(d)-(e),直到该多个正掺入值和该多个负掺入值收敛为止。2.根据权利要求I所述的方法,其中 所述正掺入值和所述负掺入值是整数,并且优选地,所述正掺入值是I,所述负掺入值是O。3.根据权利要求I所述的方法,其中 利用参数估计模型确定步骤(C)中采用的推进值和不完全延伸值。4.根据权利要求I所述的方法,其中 在步骤(c)之前,利用阈值值分配所述正掺入值和所述负掺入值,其中在所述观测的值高于阈值值时分配正掺入值,在所述观测的值低于阈值值时分配负掺入值。5.根据权利要求4所述的方法,其中 所述阈值值包括在O和I之间的范围内的值,并且优选地,所述阈值值约为O. 2。6.根据权利要求4所述的方法,其中 通过利用参考序列定义阈值值,以预测没有核甘酸种类存在的多个位置。7.根据权利要求I所述的方法,其中 噪声值是与来自引入的多个核甘酸种类的负掺入值相关联的观测的值的平均值,并且优选地,所述引入的多个核甘酸种类包括前48个引入的核甘酸种类。8.根据权利要求I所述的方法,其中 并行执行多个测序反应,其中针对测序反应中的每一个执行步骤(a)-(f)。9.一种用于递归地校正与从模板分子的基本相同的副本的群体产生的序列数据的相位同步相关联的误差的方法,该方法包括以下步骤 (a)检测响应于测序反应期间引入的多个核甘酸种类而产生的多个信号; (b)针对从每个核甘酸种类检测的信号产生观测的值;(C)利用推进值和不完全延伸值从观测的值定义多个正掺入值和多个负掺入值; (d)利...
【专利技术属性】
技术研发人员:YJ·陈,C·T·A·黄,
申请(专利权)人:霍夫曼拉罗奇有限公司,
类型:
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。