从无细胞核酸获得的序列分析数据中生成背景等位基因的频率分布的方法以及使用所述方法从无细胞核酸中检测突变的方法技术

技术编号:23474582 阅读:30 留言:0更新日期:2020-03-06 15:20
本发明专利技术提供一种从无细胞核酸获得的序列分析数据中生成背景等位基因的频率分布的方法、根据所述方法建构的背景等位基因的频率分布矩阵以及使用所述方法从无细胞核酸中检测突变的方法。据此,由于为了消除生殖细胞突变,可以使用从分离自受试个体自身的细胞核酸获得的序列分析数据来从无细胞核酸获得的序列分析数据中生成背景等位基因的频率分布,因此具有可以节省成本和时间的优点。

A method for generating the frequency distribution of background alleles from sequence analysis data obtained from acellular nucleic acids and a method for detecting mutations from acellular nucleic acids using the method

【技术实现步骤摘要】
【国外来华专利技术】从无细胞核酸获得的序列分析数据中生成背景等位基因的频率分布的方法以及使用所述方法从无细胞核酸中检测突变的方法
本专利技术提供一种用于从无细胞核酸获得的序列分析数据中生成背景等位基因的频率分布的方法和装置、根据所述方法的背景等位基因的频率分布矩阵以及使用所述方法从无细胞核酸中检测突变的方法和装置。
技术介绍
基因组(genome)是指生物体拥有的所有遗传信息。为了对任一个体的基因组进行测序(sequencing)或序列分析,正在开发如DNA芯片、下一代测序(NGS,NextGenerationSequencing)和下下一代测序(NNGS,NextNextGenerationSequencing)等的各种技术。NGS被广泛用于研究和诊断的目的。NGS取决于设备的类型,但大致可分为采样、文库制备和核酸序列分析的三个步骤。在核酸序列分析之后,基于生成的序列分析数据检测是否存在遗传突变。由于在聚合酶链反应(PCR,polymerasechainreaction)期间聚合酶所引起的错误和在核酸序列分析期间荧光检测所引起的错误等,目前NGS的序列分析错误率为0.1%至1%,所述错误的问题在于抑制以低于序列分析错误率的频率存在的稀有突变的检测。为了克服所述问题,有必要增加需要在序列分析过程中进行突变分析的试料的数量,或者执行几次序列分析。但所述方法的序列分析费用非常昂贵,并且需要大量试料。另一方面,在文库的制备方法中,通过改善衔接子序列和/或条形码序列而显着增加读段数来检测稀有突变的方法是已知的(大韩民国公开号10-2016-0141680A)。但对于如何减少在文库制备和序列分析步骤以外的其他步骤中可能发生的错误知之甚少。因此,需要一种能够在最小化成本消耗的同时准确地检测稀有突变的方法。
技术实现思路
技术方案本专利技术的一方面提供一种从无细胞核酸获得的序列分析数据中生成背景等位基因的频率分布的方法。所述方法可以包括:从无细胞核酸获得对染色体中至少一个位置的第一序列分析数据;从分离自细胞的核酸获得对所述染色体中至少一个位置的第二序列分析数据;根据所述第二个序列分析数据,生成对所述染色体中至少一个位置的背景等位基因的频率分布;以及将所述背景等位基因的频率分布预测为对第一序列分析数据的背景等位基因的频率分布。所述方法可以包括:从无细胞核酸获得对染色体中至少一个位置的第一序列分析数据;以及从分离自细胞的核酸获得对所述染色体中至少一个位置的第二序列分析数据。所述方法可以包括:从分离自细胞的核酸和无细胞核酸获得对染色体中至少一个位置的第一序列分析数据。可以同时或顺序地执行获得所述第一序列分析数据的步骤和获得所述第二序列分析数据的步骤。所述“测序(sequencing)或序列分析”可以是下一代序列分析(NGS,nextgenerationsequencing)。所述下一代序列分析可以与大规模平行序列分析(massiveparallelsequencing)或第二代序列分析(second-generationsequencing)互换使用。所述NGS是一种对大量片段的核酸同时进行序列分析的技术,可以基于芯片(chip)和基于聚合酶链反应(PCR,polymerasechainreaction)的成对末端(pairedend)的形式对全长基因组进行片段化,并基于杂交反应(hybridization)以超高速度对所述片段进行序列分析。所述NGS可以包括基于NGS的靶向序列分析(targetedsequencing)、靶向深度序列分析(targeteddeepsequencing)或面板序列分析(panelsequencing)。所述NGS可以通过例如454平台(Roche)、GSFLX钛、IlluminaMiSeq、IlluminaHiSeq、IlluminaHiSeq2500、Illumina基因组分析仪、Solexa平台、SOLiD系统(AppliedBiosystems)、IonProton(LifeTechnologies)、CompleteGenomics、HelicosBiosciencesHeliscope、PacificBiosciences的单分子实时(SMRTTM)技术或其组合来进行。所述序列分析数据是指通过所述测序或序列分析而获得的数据,并可以包括对待进行序列分析的染色体中至少一个位置或所有位置的等位基因及其频率。第一序列分析数据是指对从无细胞核酸中染色体内至少一个位置获得的序列分析数据,第二序列分析数据是指对从分离自细胞的核酸中染色体内至少一个位置获得的序列分析数据。所述序列分析数据可以从例如BAM(binaryversionofSAM)格式和/或SAM(SequenceAlignment/Map)格式的数据获得。BAM格式和/或SAM格式通常可以用于描述有关短读段(shortreads)的数据的格式。BAM格式和/或SAM格式的数据可以包括与表示读段(read)的起点、读段的方向(direction)、映射(mapping)质量和对齐(alignment)顺序的FLAG、CIGAR(CompactIdiosyncraticGappedAlignmentReport)串等有关的文本数据。可以通过生成各种比对来确保各种支持读段(supportingreads)。所述核酸可以是基因组(genome)或其片段。术语“基因组(genome)”是指染色体、染色质或基因的整体。所述核酸可以是脱氧核糖核酸(DNA,deoxyribonucleicacid)、核糖核酸(RNA,ribonucleicacid)或其组合。所述从细胞分离的核酸可以是从细胞或细胞系分离的核酸。所述从细胞分离的核酸可以从存在于血液、血清、尿液、唾液、粘膜分泌物、痰、粪便、眼泪或其组合的细胞中分离。所述从细胞分离的核酸可以从血细胞、口腔上皮细胞、毛囊细胞、皮肤成纤维细胞或其组合中分离。所述血细胞可以例如是白细胞、具体地是外周血白细胞(PBL,peripheralbloodleukocyte)、更具体地是包括外周血单核细胞和/或外周血淋巴细胞的外周血单核细胞(PBMC,Peripheralbloodmononuclearcell),和/或多形核白细胞(PML,polymorphonuclearleukocyte)。所述无细胞核酸(cellfreenucleicacid:cfnucleicacid)可以是从细胞中游离的核酸。所述无细胞核酸可以存在于血液、血浆、血清、尿液、唾液、粘膜分泌物、痰、粪便、眼泪或其组合。所述无细胞核酸可以为循环肿瘤核酸(circulatingtumornucleicacid:ctnucleicacid)。所述无细胞核酸可以例如为无细胞DNA(cellfreeDNA:cfDNA)。核酸的提取或分离方法可以通过本领域技术人员已知的方法进行。所述染色体内至少一个位置是指在染色体中用于检测是否存在遗传突变的位置(position)。所述染色体内的位置例如是预期存在突变的位本文档来自技高网
...

【技术保护点】
1.一种从无细胞核酸获得的序列分析数据中生成背景等位基因的频率分布的方法,其特征在于,所述方法包括:/n从无细胞核酸获得对染色体中至少一个位置的第一序列分析数据;/n从分离自细胞的核酸获得对所述染色体中至少一个位置的第二序列分析数据;/n根据所述第二个序列分析数据,生成对所述染色体中至少一个位置的背景等位基因的频率分布;以及/n将所述背景等位基因的频率分布预测为对第一序列分析数据的背景等位基因的频率分布。/n

【技术特征摘要】
【国外来华专利技术】20170524 KR 10-2017-00643871.一种从无细胞核酸获得的序列分析数据中生成背景等位基因的频率分布的方法,其特征在于,所述方法包括:
从无细胞核酸获得对染色体中至少一个位置的第一序列分析数据;
从分离自细胞的核酸获得对所述染色体中至少一个位置的第二序列分析数据;
根据所述第二个序列分析数据,生成对所述染色体中至少一个位置的背景等位基因的频率分布;以及
将所述背景等位基因的频率分布预测为对第一序列分析数据的背景等位基因的频率分布。


2.如权利要求1所述的方法,其特征在于,所述方法包括:
在获得所述第二序列分析数据之前,对从所述细胞分离的核酸进行片段化。


3.如权利要求2所述的方法,其特征在于,
所述片段化通过物理、化学、热、光学、超声波或酶促来切割从细胞分离的核酸。


4.如权利要求3所述的方法,其特征在于,所述超声波切割通过施加50W至160W的超声波10秒至300秒来进行。


5.如权利要求2所述的方法,其特征在于,所述片段化的核酸的大小为200bp以上。


6.如权利要求1所述的方法,其特征在于,所述分离自细胞的核酸和所述无细胞核酸来自相同个体或不同个体。


7.如权利要求1所述的方法,其特征在于,所述分离自细胞的核酸从血细胞、口腔上皮细胞、毛囊细胞、皮肤成纤维细胞或其组合中分离。


8.如权利要求1所述的方法,其特征在于,所述无细胞核酸存在于血液、血浆、血清、尿液、唾液、...

【专利技术属性】
技术研发人员:朴熊洋朴东贤孙大淳
申请(专利权)人:吉尼努斯公司
类型:发明
国别省市:韩国;KR

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1