一种寡核苷酸序列一致性的检测方法技术

技术编号:37183325 阅读:29 留言:0更新日期:2023-04-20 22:48
本发明专利技术提供了一种寡核苷酸序列一致性的检测方法,所述方法包括:采用带有待检寡核苷酸序列的引物对对已知DNA序列片段进行扩增,得到扩增产物,对扩增产物直接进行测序,根据测序结果确认待检寡核苷酸的序列一致性。通过已知DNA序列进行数据拆分,可以准确、高通量的批量定性分析不同寡核苷酸序列的交叉污染情况和/或合成错误情况。况和/或合成错误情况。

【技术实现步骤摘要】
一种寡核苷酸序列一致性的检测方法


[0001]本专利技术属于高通量基因测序领域,涉及一种质检寡核苷酸序列的方法。

技术介绍

[0002]高通量测序技术(High

throughput sequencing)又称“下一代”测序技术("Next

generation"sequencing technology),以能一次并行对几十万到几百万条DNA分子进行序列测定和一般读长较短等为标志。高通量测序技术可以对数百万个DNA分子同时进行测序,一次平行检测几百甚至上千个样本。在高通量测序中,需要采用大量的标签序来标记不同样本文库,以方便在高通量测序结果中区分不同样本序列。
[0003]在二代测序中,往往采用标签引物用于测序数据拆分的标签。每一个文库对应唯一的一个标签序列,才能保证拆分获得的测序数据中,文库间不存在交叉污染。但实际使用过程中发现,不同引物间,存在交叉污染(A引物中混入B引物),导致不同文库数据间出现交叉污染;另外标签引物合成方法本身的局限性,导致标签引物中存在合成错误现象。若标签引物间存在高比例交叉污染,则可能会导致测序结果准确性下降,出现假阳性、假阴性数据结果报出,影响测序结果准确性。若标签引物中存在高比例合成错误,则会导致下机数据中,未拆分数据比例上升,导致测序成本的高比例上升。
[0004]对于NGS标签引物而言,现有技术中,引物合成公司多通过严格工艺流程来控制,将不同批次隔离生产的方式来降低引物间交叉污染的可能性。在质控方面多采用nanodrop浓度检测、毛细管电泳或质谱检测核苷酸数量的质量控制手段。但是其质控手段,不能有效的对NGS标签引物序列准确度进行标定,难以满足下游实验的实际质控和测序测序需求。

技术实现思路

[0005]针对现有技术的不足和实际生产实验需求,本专利技术提供了一种质检寡核苷酸序列的方法,采用一端与待测寡核苷酸互补的已知寡核苷酸序列作为已知DNA序列与待测寡核苷酸发生PCR扩增反应,扩增产物进行二代测序,通过已知DNA序列进行数据拆分,分析不同寡核苷酸序列的交叉污染情况和/或合成错误情况。
[0006]具体的,本专利技术采用如下技术方案:
[0007]1.一种寡核苷酸序列一致性的检测方法,其特征在于,所述方法包括:
[0008]采用带有待检寡核苷酸序列的引物对,对已知序列DNA片段的进行扩增;
[0009]得到扩增产物,对扩增产物直接上机进行测序,获得测序数据;
[0010]根据测序数据确认待检寡核苷酸的序列一致性;
[0011]其中,所述引物对包括正链引物序列和反链引物序列,所述的两条引物序列,3

端序列分别带有与所述已知序列DNA片段的3

端特异性识别的互补序列;所述的寡核苷酸序列存在于正链引物序列或反链引物序列中任一条序列上,位于所述的5

端序列与3

端序列之间;
[0012]其中,一对带有待检寡核苷酸序列的引物对应一条已知序列DNA片段。
[0013]2.根据项1所述的方法,其特征在于,所述已知序列DNA片段包含一段序列已知的非天然寡核苷酸片段,其特征在于所述非天然寡核苷酸片段与现有任一已知物种基因组上任意位置序列完全不同源。
[0014]3.根据项1中所述的方法,其特征在于,所述的两条引物序列的5

端序列分别带有与测序平台互补配对的接头序列。
[0015]4.根据项1所述的方法,其特征在于,所述待检寡核苷酸的序列一致性是指,所述待检测寡核苷酸序列测得序列与其设计时序列一致和/或所述测序数据中仅含有单一序列数据结果。
[0016]5.根据项1所述的方法,其特征在于,所述根据测序数据确认待检寡核苷酸的序列一致性是指通过已知序列DNA片段的序列数据拆分原始测序数据,将含有相同已知序列DNA片段的数据拆分到同一数据集,并确认数据集内待检寡核苷酸的序列一致性。
[0017]6.根据项1所述的方法,其特征在于,所述的已知序列DNA片段的长度为50~1000bp,优选为150bp~500bp。
[0018]7.根据项1所述的方法,其特征在于,所述的寡核苷酸序列的长度为6~20bp,优选为6~12bp。
[0019]8.根据项3中所述的方法,其特征在于,所述待检寡核苷酸的序列一致性包括待检核苷酸的交叉污率和合成错误率;
[0020]优选地,所述交叉污率和合成错误率,为通过统计原始测序数据测序读长中标签序列的种类和数量,计算寡核苷酸序列的交叉污染率和/或合成错误率。
[0021]9.根据项1所述的方法,其特征在于,所述的已知序列DNA片段的长度为50~1000bp,优选为150bp~500bp。
[0022]10.根据项1所述的方法,其特征在于,所述的寡核苷酸序列的长度为6~20bp,优选为6~12bp。
[0023]11.一种二代测序标签引物质控方法,其特征在于采用项1中所述方法在对标签引物进行质控;
[0024]优选地,对所述标签引物的交叉污率况和合成错误率进行质控。
[0025]专利技术效果
[0026]本项目方法再依托二代测序技术应用时,可建立了一套完整的标签引物序列质检实验、信息分析方法,通过检测已知序列上携带的标签序列,检测待检标签引物的序列准确性。使用人工合成的已知序列作为标签引物检验过程的已知DNA序列,与现有物种已知基因组均不相同,检验过程不会被同批次测序的其他文库污染。
[0027]与现有技术相比,本专利技术可检测多批次寡核苷酸一致性,不受外源DNA同源性影响,可用于建立标准划质控流程。
[0028]在依托二代测序技术,可以准确的分析出寡核苷酸测序结果,高通量的完成质检过程。通过具体序列分析其交叉污染情况和合成错误情况,同时提供符合实际试验应用的高通量的质检方法。
附图说明
[0029]图1为寡核苷酸序列一致性的检测方法原理
具体实施方式
[0030]下面将对本专利技术的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0031]需要说明的是,在说明书及项当中使用了某些词汇来指称特定组件。本领域技术人员应可以理解,技术人员可能会用不同名词来称呼同一个组件。本说明书及项并不以名词的差异作为区分组件的方式,而是以组件在功能上的差异作为区分的准则。如在通篇说明书及项当中所提及的“包含”或“包括”为开放式用语,故应解释成“包含但不限定于”。说明书后续描述为实施本专利技术的较佳实施方式,然而所述描述乃以说明书的一般原则为目的,并非用以限定本专利技术的范围。本专利技术的保护范围当视所附项所界定者为准。
[0032]本专利技术具体包括,
[0033]一种寡核苷酸序列一致性的检测方法,其特征在于,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种寡核苷酸序列一致性的检测方法,其特征在于,所述方法包括:采用带有待检寡核苷酸序列的引物对,对已知序列DNA片段的进行扩增;得到扩增产物,对扩增产物直接上机进行测序,获得测序数据;根据测序数据确认待检寡核苷酸的序列一致性;其中,所述引物对包括正链引物序列和反链引物序列,所述的两条引物序列,3

端序列分别带有与所述已知序列DNA片段的3

端特异性识别的互补序列;所述的寡核苷酸序列存在于正链引物序列或反链引物序列中任一条序列上,位于所述的5

端序列与3

端序列之间;其中,一对带有待检寡核苷酸序列的引物对应一条已知序列DNA片段。2.根据权利要求1所述的方法,其特征在于,所述已知序列DNA片段包含一段序列已知的非天然寡核苷酸片段,其特征在于所述非天然寡核苷酸片段与现有任一已知物种基因组上任意位置序列完全不同源。3.根据权利要求1中所述的方法,其特征在于,所述的两条引物序列的5

端序列分别带有与测序平台互补配对的接头序列。4.根据权利要求1所述的方法,其特征在于,所述待检寡核苷酸的序列一致性是指,所述待检测寡核苷酸序列测得序列与其设计时序列一致和/或所述测序数据中仅含有单一序列数据结果。5.根据权利要求1所述的方法,其特征在于,所述根据测序数据确认待检寡核苷酸的序列一致性是...

【专利技术属性】
技术研发人员:姜锋张介中杜洋王娟李志民
申请(专利权)人:安诺优达基因科技北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1