鉴别长缺失的系统和方法可获得在来自核酸样品的潜在区域之中和周围的多个扩增子的测序信息。所述测序信息可包括可映射到参考序列的多个读数。使用信息,如读数映射到参考序列的何处和所述扩增子的读数的相对丰度,可鉴别结构变异体且可作出所述核酸样品对于所述结构变异体是否为纯合或杂合的判定。
【技术实现步骤摘要】
【国外来华专利技术】
本专利技术总体上涉及包括用于检测结构变异体的系统和方法的核酸测序领域。
技术介绍
在完成人类基因组项目(Human Genome Project)后,测序行业的一个焦点已转移到发现较高通量和/或较低成本核酸测序技术,有时称为“下一代”测序(NGS)技术。在使得测序通量更高和/或更便宜中,目标为使得技术更可获得。这些目标可以通过使用对具有显著复杂度的样品提供样品制备、并行地对较大数目的样品测序(例如通过使用条码和多重分析)和/或有效处理大量信息且以及时方式完成分析的测序平台和方法达到。进化形成各种方法,如合成测序、杂交测序和连接测序来满足这些挑战。并入NGS技术的超高通量核酸测序系统通常产生大量短序列读数。序列处理方法应合意地快速并且有效地装配和/或映射大量读数,以使得计算资源的使用最小化。举例来说,由对哺乳动物基因组测序产生的数据可以产生数千万或数亿读数,所述读数通常需要在其可以进一步经分析以确定其生物、诊断和/或治疗相关性之前经装配。NGS技术的示例性应用包括(但不限于):基因组变异体检测,如插入/缺失、拷贝数变异、单核苷酸多态性等;基因组重测序;基因表达分析;以及基因组剖析。结构变异体(如大规模缺失、插入、倒置、基因组重排、基因融合体等)可与各种基因病症和癌症相关联。举例来说,在囊肿性纤维化患者中已鉴别出CFTR基因中的两个大段缺失,CFTRdele2,3和CFTRdele22,23。其它结构变异体可包括基因融合体,其中第一基因的一部分与第二基因的一部分一起剪接,其可经由染色体重排、大段缺失、部分基因复制等发生。结构变异体与较小序列变异(如单核苷酸多态性)相比可能更难以检测。由于结构变异体的大小可为用于测序的读数长度的许多倍,但单一读数可能不跨越整个结构变异。从前述应了解,对可使用核酸测序数据检测大段缺失的系统和方法存在需求。附图说明为了更加全面地理解本文中所揭示的原理以及其优点,现在参考结合附图获得的以下描述,其中:图1为说明根据各种实施例的示例性计算机系统的框图。图2为根据各种实施例重构核酸序列的示例性系统的示意图。图3为根据各种实施例的示例性基因分析系统的示意图。图4为示出根据各种实施例的示例性缺失的图式。图5为示出根据各种实施例的各种缺失基因型的图式。图6为示出根据各种实施例的在已知断裂点下检测结构变异体的示例性方法的流程图。图7为示出根据各种实施例的计算结构变异体的变异体评分的示例性方法的流程图。图8为示出根据各种实施例的用于鉴别结构变异体的示例性方法的流程图。应理解,图式不一定按比例绘制,图式中的物体也不一定相对于彼此按比例绘制。图式是打算使得对本文所公开的设备、系统以及方法的各种实施例明晰和理解的描绘。在可能的情况下,将贯穿图式使用相同的参考数字来指代相同或类似的部分。此外,应了解,附图并不打算以任何方式限制本专利技术教示的范围。具体实施方式用于检测低频变异体的系统和方法的实施例描述于本文中。本文所用的章节标题仅用于组织目的并且不应理解为以任何方式限制所描述的主题。在各种实施例的这一详细描述中,出于解释的目的,阐述许多特定细节以提供所公开的实施例的透彻理解。然而,所属领域的技术人员将了解,这些各种实施例可以在具有或不具有这些特定细节的情况下实践。在其它情况下,结构和装置以框图形式展示。此外,所属领域的技术人员可以容易地了解的是呈现和进行方法的特定顺序是说明性的并且预期顺序可以改变并且仍保持在本文所公开的各种实施例的精神和范围内。本申请中引用的所有文献和类似材料(包括(但不限于)专利、专利申请、文章、书籍、论文以及因特网网页)出于任何目的明确以全文引用的方式并入。除非另外描述,否则本文所用的所有技术和科学术语具有与本文所描述的各种实施例所属的领域的一般技术人员通常所了解相同的含义。应了解,在本专利技术教示中论述的温度、浓度、时间、碱基数目、覆盖度等之前存在隐含的“约”,使得略微和非实质偏差在本专利技术教示的范围内。在本申请中,除非另外明确陈述,否则单数的使用包括复数。此外,“包含(comprise/comprises/comprising)”、“含有(contain/contains/containing)”以及“包括(include/includes/including)”的使用并不打算是限制性的。应理解,以上一般描述和以下详细描述均仅是示例性和解释性的并且并
不限制本专利技术教示。如本文所用,“一(a/an)”也可指“至少一”或“一或多”。此外,“或”的使用是包括性的,使得当“A”真实、“B”真实,或“A”和“B”都真实时,短语“A或B”真实。此外,除非上下文另外需要,否则单数术语应包括复数并且复数术语应包括单数。一般来说,本文所描述的与细胞和组织培养、分子生物学以及蛋白质和寡核苷酸或多核苷酸化学和杂交结合使用的命名法和技术为所属领域中众所周知并且常用的命名法和技术。标准技术用于例如核酸纯化和制备、化学分析、重组核酸以及寡核苷酸合成。酶促反应和纯化技术根据制造商的说明书或如所属领域中通常所实现或如本文所描述来进行。本文所描述的技术和程序一般根据所属领域中众所周知和如本专利技术的说明书通篇中所引用和论述的各种一般性和较特定的参考文献中所描述的常规方法来执行。参看例如萨姆布鲁克(Sambrook)等人,《分子克隆实验指南(Molecular Cloning:A LaboratoryManual)》(第三版,冷泉港实验室出版社(Cold Spring Harbor Laboratory Press),纽约州冷泉港(Cold Spring Harbor,N.Y.)2000)。结合本文所描述的实验室程序和技术使用的命名法是所属领域中众所周知并且常用的命名法。在各种实施例中,阐述一组组分的术语“系统”(真实或抽象)包含一个整体,其中每一组分与整体内的至少一个其它组分相互作用或与其相关。在各种实施例中,“生物分子”可指由生物有机体产生的任何分子,包括较大聚合分子,如蛋白质、多糖、脂质和核酸(DNA和RNA)以及小分子,如初级代谢物、次级代谢物和其它天然产物。在各种实施例中,短语“下一代测序”或NGS是指相比于传统的基于桑格(Sanger)和毛细电泳法的方法具有增加的通量,例如具有一次产生数十万相对较小序列读数的能力的测序技术。下一代测序技术的一些实例包括(但不限于)合成测序、连接测序以及杂交测序。更确切地说,生命技术公司(Life Technologies Corp.)的个人基因组机器(Personal Genome Machine;PGM)和Proton提供精确性增强的大规模平行测序。PGM和Proton系统和相关工作流、方案、化学物质等更详细地描述在美国专利申请公开第2009/0127589号和第2009/0026082号中,这些申请中的每一个的全部内容以引用的方式并入本文中。在各种实施例中,短语“测序运行”是指经执行以测定涉及至少一种生物分子(例如核酸分子)的一些信息的测序实验的任何步骤或部分。在各种实施例中,相“碱基空间”是指核苷酸序列的表示。相“流动空间”是指特定核苷酸流动的并入事件或非并入事件的表示。举例来说,流动空间可以是表示特定核苷酸\本文档来自技高网...
【技术保护点】
一种检测长缺失的方法,其包含:在引物池存在下扩增核酸样品,以产生多个扩增子,所述引物池包括第一和第二引物对,所述第一引物对包括侧接第一断裂点区域的第一和第二引物,所述第二引物对包括侧接第二断裂点区域的第三引物和第四引物;对所述扩增子进行测序,以产生多个读数;将所述读数映射到参考序列;以及当多个读数部分映射到介于所述第一引物与所述第一断裂点之间和介于所述第二断裂点与所述第四引物之间的参考基因组的区域时,检测所述核酸样品中介于所述第一断裂点到所述第二断裂点之间的结构变异体。
【技术特征摘要】
【国外来华专利技术】2013.10.01 US 61/885,082;2013.12.20 US 61/919,3061.一种检测长缺失的方法,其包含:在引物池存在下扩增核酸样品,以产生多个扩增子,所述引物池包括第一和第二引物对,所述第一引物对包括侧接第一断裂点区域的第一和第二引物,所述第二引物对包括侧接第二断裂点区域的第三引物和第四引物;对所述扩增子进行测序,以产生多个读数;将所述读数映射到参考序列;以及当多个读数部分映射到介于所述第一引物与所述第一断裂点之间和介于所述第二断裂点与所述第四引物之间的参考基因组的区域时,检测所述核酸样品中介于所述第一断裂点到所述第二断裂点之间的结构变异体。2.一种检测长缺失的方法,其包含:在引物池存在下扩增核酸样品,以产生多个扩增子,所述引物池包括第一和第二引物,所述第一引物对应于第一断裂点区域,所述第二引物对应于第二断裂点区域;对所述扩增子进行测序,以产生多个读数;将所述读数映射到参考序列,所述参考序列包括参考等位基因和结构变异体等位基因,且结构变异体介于所述第一断裂点区域与所述第二断裂点区域之间;当存在映射到所述结构变异体等位基因的多个读数时,检测所述核酸样品中介于所述第一断裂点区域到所述第二断裂点区域之间的结构变异体。3.一种检测结构变异体的方法,其包含:在引物池存在下扩增核酸样品,以产生多个扩增子,所述引物池包括第一和第二引物对,所述第一引物对包括侧接第一断裂点区域的第一和第二引物,所述第二引物对包括侧接第二断裂点区域的第三引物和第四引物;对所述扩增子进行测序,以产生多个读数;将所述读数映射到参考序列,所述参考序列包括全长等位基因和截短等位基因,且缺失...
【专利技术属性】
技术研发人员:R·格蒂姆卡拉,F·海兰德,S·乌提拉美勒,J·沙格曼,S·马格达雷诺,
申请(专利权)人:生命技术公司,
类型:发明
国别省市:美国;US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。