一种确定核酸序列的方法及系统技术方案

技术编号:13749665 阅读:92 留言:0更新日期:2016-09-24 10:45
本发明专利技术提供一种确定核酸序列的方法,包括,获取待测样本中的核酸,对所述核酸进行测序,获得由多个测序序列构成的测序结果;将所述测序结果进行过滤,所述过滤包括去除不确定碱基比例大于1%的读段和/或碱基质量值不大于5的碱基数的比例不小于50%的读段,获得过滤后的测序结果;将所述过滤后的测序结果与第一数据库进行第一比对,获得第一比对结果;以及将所述第一比对结果与第二数据库进行第二比对,获得第二比对结果;分析所述第二比对结果,确定待测样本的核酸序列。本发明专利技术还提供一种确定核酸序列的系统。本发明专利技术基于生物信息学分析手段与强大的数据库平台来对样本中的微生物种类进行鉴定,具有结果灵敏、特异性强等优点。

【技术实现步骤摘要】

本专利技术涉及生物
,具体的,一种确定核酸序列的方法及系统,以及一种计算核酸序列丰度及相对丰度的方法及系统。
技术介绍
人或动物的血液中寄生有大量的细菌或病毒等微生物,通过对血液中微生物的研究,可以促进对血液中微生物的寄生情况更加了解。目前,对于血液中微生物的检测方法主要有直接涂片法,培养法,细胞或动物接种法。而这些方法阳性率较低,细菌培养阳性率只有30%-50%,细胞或动物病毒接种阳性率更低,并且耗时过长。近一些年来随着PCR技术的逐步发展,也有一些技术应用到微生物的检测,但是由于其检测的单一性及灵敏性等方面存在很多问题,效果不是很好。
技术实现思路
依据本专利技术的一方面,本专利技术提供一种确定核酸序列的方法,包括,(1)获取待测样本中的核酸,对所述核酸进行测序,获得由多个测序序列构成的测序结果;(2)将所述测序结果进行过滤,所述过滤包括去除不确定碱基比例大于1%的读段和/或碱基质量值不大于5的碱基数的比例不小于50%的读段,获得过滤后的测序结果;(3)将所述过滤后的测序结果与第一数据库进行第一比对,获得第一比对结果;以及(4)将所述第一比对结果与第二数据库进行第二比对,获得第二比对结果;(5)分析所述第二比对结果,确定待测样本的核酸序列。本专利技术另一方面提供一种计算核酸序列丰度及相对丰度的方法,包括:利用上述核酸序列的方法获得核酸序列信息;基于所述核酸序列信息,通过公式1计算待测样本中各物种的丰度,所述公式1为:1i为第二数据库中物种;N为比对到第二数据库的全部序列长度;Ni为比对到物种上的序列长度;Li为物种i的基因组长度;bi为丰度;以及,通过公式2计算待测样本中各物种的相对丰度,所述公式2为:2i,j为第二数据库中物种;sbi为相对丰度。本专利技术另一方面还提供一种确定核酸序列的系统,包括:测序结果获得模块,用于获取待测样本中的核酸,对所述核酸进行测序,获得由多个测序序列构成的测序结果;测序结果过滤模块,用于将所述测序结果进行过滤,所述过滤包括去除不确定碱基比例大于1%的读段和/或碱基质量值不大于5的碱基数的比例不小于50%的读段,获得过滤后的测序结果;第一比对模块,用于将所述过滤后的测序结果与第一数据库进行第一比对,获得第一比对结果;以及第二比对模块,用于将所述第一比对结果与第二数据库进行第二比对,获得第二比对结果;核酸序列确定模块,用于分析所述第二比对结果,确定待测样本的核酸序列。本专利技术另一方面还提供一种计算核酸序列丰度及相对丰度的系统,包括:核酸序列获取模块,用于利用前述确定核酸序列的系统获得所述核酸序列信息;计算模块,用于基于所述核酸序列信息,通过公式1计算待测样本中各物种的丰度,所述公式1为:1i为第二数据库中物种;N为比对到第二数据库的全部序列长度;Ni为比对到物种上的序列长度;Li为物种i的基因组长度;bi为丰度;以及,通过公式2计算待测样本中各物种的相对丰度,所述公式2为:2i,j为第二数据库中物种;sbi为相对丰度。本专利技术建立了一种高通量测序技术的用于辅助检测人或动物体内血液系统微生物的方法。该方法基于生物信息学分析手段与强大的数据库平台来对样本中的微生物种类进行鉴定,整个分析流程大约需要3-5天的时间。此方法弥补了常规培养检测方法检测周期长,微生物种类比较局限的缺点,可很好的应用于血液中微生物的检测,并且具有结果灵敏、特异性强等优点。附图说明本专利技术的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:图1 显示了根据本专利技术的一个实施例,确定核酸序列的方法的流程图。具体实施方式本专利技术中的数据库为已知基因组数据库,本专利技术中所使用的“第一”、“第二”等仅为方便描述指代,不能理解为指示或暗示相对重要性,也不能理解为有先后顺序关系。本专利技术的描述中,除非另有说明,“多个”的含义是两个或两个以上。术语“丰度”指的是在限定的位置或群落中一种生物体的常见性或稀有性。例如,可以通过一般地测量样品中该生物体的总存在量来确定所述丰度。术语“相对丰度”指的是在限定的位置或群落中一种生物体相对于其它生物体的常见性或稀有性。例如,可以通过一般地测量样品中与生物体的总存在量相比的特定生物体的存在量来确定所述丰度。本专利技术提供一种确定核酸序列的方法,包括,(1)获取待测样本中的核酸,对所述核酸进行测序,获得由多个测序序列构成的测序结果;(2)将所述测序结果进行过滤,所述过滤包括去除不确定碱基比例大于1%的读段和/或碱基质量值不大于5的碱基数的比例不小于50%的读段,获得过滤后的测序结果;(3)将所述过滤后的测序结果与第一数据库进行第一比对,获得第一比对结果;以及(4)将所述第一比对结果与第二数据库进行第二比对,获得第二比对结果;(5)分析所述第二比对结果,确定待测样本的核酸序列。在本专利技术的一个实施例中,本专利技术的步骤(1)还包括:(a)获取待测样本中的核酸,所述核酸由多个DNA片段组成,所述DNA片段来自断裂的基因组DNA和/或游离的DNA片段,并且所述DNA片段具有平末端;(b)加碱基“A”至所述DNA片段的3’端,获得具有粘性末端A的DNA片段;(c)对所述具有粘性末端A的DNA片段添加接头,获得接头连接片段;(d)将接头连接片段进行PCR扩增,获得扩增产物;(e)将扩增产物进行纯化,获得纯化后的PCR产物;(f)对所述纯化后的PCR产物进行测序。进一步的,所述DNA片段具有平末端是通过末端修复的方法制备。根据本专利技术的一个实施例,在将DNA片段进行末端修复前,可以进一步包括纯化DNA片段的步骤,由此,使得后续的末端修复易于进行。根据本专利技术的实施例,将DNA片段进行末端修复可以利用Klenow片段、T4 DNA聚合酶和T4多核苷酸激酶进行,其中,所述Klenow片段具有5’—3’聚合酶活性和3’ —5’聚合酶活性,但缺少5’ —3’外切酶活性。由此,能够方便准确地对DNA片段进行末端修复。根据本专利技术的实施例,还可以进一步包括对经过末端修复的DNA片段进行纯化的步骤,由此能够方便地进行后续处理。进一步的,在经过末端修复的DNA片段的3’末端添加碱基A,以便获得具有粘性末端A的DNA片段。根据本专利技术的一个实施例,可以利用Klenow(3’ —5’exo-),即具有3’ —5’外切酶活性的Klenow,在经过末端修复的DNA片段的3’末端添加碱基A。由此,能够方便准确地将碱基A添加到经过末端修复的DNA片段的3’末端。根据本专利技术的实施例,还可以进一步包括对具有粘性末端A的DNA片段进行纯化的步骤,由此能够方便地进行后续处理。进一步的,对所述具有粘性末端A的DNA片段添加接头。进一步的,可以使用热启动taq DNA聚合酶对经过转换的目的片段进行PCR扩增。根据本专利技术的实施例,热启动taq DNA聚合酶的种类不受特别限制,根据本专利技术的具体示例,热启动taqDNA聚合酶可以为r-taq聚合酶,由此PCR扩增效率高、用时少。进一步的,测序技术可采用第二代测序技术或第三代测序技术进行。本领域人员可以理解的,所述测序平台可以采用Illumina的Hiseq2000/2500平台、Life Technologies的Ion Torrent平台、单分子测序平台等。在本专利技术的一个实施例本文档来自技高网...

【技术保护点】
一种确定核酸序列的方法,其特征在于,包括,(1)获取待测样本中的核酸,对所述核酸进行测序,获得由多个测序序列构成的测序结果;(2)将所述测序结果进行过滤,所述过滤包括去除不确定碱基比例大于1%的读段和/或碱基质量值不大于5的碱基数的比例不小于50%的读段,获得过滤后的测序结果;(3)将所述过滤后的测序结果与第一数据库进行第一比对,获得第一比对结果;以及(4)将所述第一比对结果与第二数据库进行第二比对,获得第二比对结果;(5)分析所述第二比对结果,确定待测样本的核酸序列。

【技术特征摘要】
1.一种确定核酸序列的方法,其特征在于,包括,(1)获取待测样本中的核酸,对所述核酸进行测序,获得由多个测序序列构成的测序结果;(2)将所述测序结果进行过滤,所述过滤包括去除不确定碱基比例大于1%的读段和/或碱基质量值不大于5的碱基数的比例不小于50%的读段,获得过滤后的测序结果;(3)将所述过滤后的测序结果与第一数据库进行第一比对,获得第一比对结果;以及(4)将所述第一比对结果与第二数据库进行第二比对,获得第二比对结果;(5)分析所述第二比对结果,确定待测样本的核酸序列。2.根据权利要求1所述的方法,其特征在于,所述步骤(1)还包括:(a)获取待测样本中的核酸,所述核酸由多个DNA片段组成,所述DNA片段来自断裂的基因组DNA和/或游离的DNA片段,并且所述DNA片段具有平末端;(b)加碱基“A”至所述DNA片段的3’端,获得具有粘性末端A的DNA片段;(c)对所述具有粘性末端A的DNA片段添加接头,获得接头连接片段;(d)将接头连接片段进行PCR扩增,获得扩增产物;(e)将扩增产物进行纯化,获得纯化后的PCR产物;(f)对所述纯化后的PCR产物进行测序。3.根据权利要求1所述的方法,其特征在于,所述步骤(3)还包括:将所述过滤后的测序结果与第一数据库进行第一比对,去除匹配的测序序列,获得非匹配的测序序列。4.根据权利要求1所述的方法,其特征在于,所述步骤(4)还包括:将所述第一比对结果与第二数据库进行第二比对,获得匹配的测序序列,去除非匹配的测序序列。5.根据权利要求1所述的方法,其特征在于,所述第一数据库为宿主基因数据库;所述第二数据库为细菌数据库或病毒数据库至少之一;所述宿主为人或动物。6.一种计算核酸序列丰度及相对丰度的方法,其特征在于,包括:利用权利要求1所述的方法获得核酸序列信息;基于所述核酸序列信息,通过公式1计算待测样本中各物种的丰度,所述公式1为:1i为第二数据库中物种;N为比对到第二数据库的全部序列...

【专利技术属性】
技术研发人员:张印新韩颖鑫王佳伟高晓峘张春生李胜
申请(专利权)人:广州精科生物技术有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1