System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种16S rRNA基因通用引物的个性化改进方法及系统技术方案_技高网
当前位置: 首页 > 专利查询>浙江大学专利>正文

一种16S rRNA基因通用引物的个性化改进方法及系统技术方案

技术编号:41964583 阅读:6 留言:0更新日期:2024-07-10 16:47
本发明专利技术公开了一种16S rRNA基因通用引物的个性化改进方法及系统。16SrRNA基因的通用引物不能覆盖所有微生物常常导致漏检个性化研究中的目标微生物,改进通用引物以提高对目标微生物的覆盖率可以解决这个问题。该方法将1条通用引物与1条经silva网站评估的未被通用引物覆盖的目标微生物的16SrRNA基因通过本发明专利技术生成1条覆盖该目标序列的新通用引物,将新通用引物与其未覆盖的16S rRNA基因迭代运行就可获得新一轮的引物,从而使通用引物对该目标微生物的覆盖率尽可能的提高。本发明专利技术能够针对不同研究所需覆盖的微生物类别对通用引物进行个性化改进,获得比以往的经典通用引物更高的覆盖率,且改进后的通用引物能比改进前检出更多的目标微生物。

【技术实现步骤摘要】

本专利技术属于微生物领域,生物信息学领域,具体涉及一种16s rrna基因通用引物的个性化改进方法及系统。


技术介绍

1、利用16s rrna基因高通量测序技术是表征微生物群落结构的常见手段,其原理基于该技术所使用的通用引物与目标微生物的16s rrna基因的匹配。当引物不能匹配目标微生物时,则会存在漏检。由于微生物16s rrna基因的多样性,并不存在100%覆盖所有微生物的通用引物,只存在尽可能覆盖更多微生物的通用引物。以parada和apprill设计的经典引物515f-806r

2、(f:gtgycagcmgccgcggtaa;r:ggactacnvgggtwtctaat)为例,它对silva数据库中的细菌和古菌的覆盖率分别高达83.6%和83.5%的数据而被earth microbiome project(https://earthmicrobiome.org/protocols-and-standards/16s/)推荐使用。但是,在引物515f-806r看似很高的覆盖率的背后,它未覆盖的细菌有62406种,古菌有3306种,如果这些未被覆盖的微生物是特定研究所重点关注的目标微生物,通用引物就不适用于该相关研究。因此,为了保障通用引物适用于特定研究,就要改进出匹配目标微生物的引物。

3、通用引物与目标微生物的不匹配是指通用引物存在与目标微生物的16srrna基因不同的碱基,将通用引物中与目标微生物的16s rrna基因不同的碱基更改为简并碱基就可以实现二者的匹配,从而实现通用引物对目标微生物的覆盖。

4、通用引物的改进过程涉及多序列比对,序列的反向互补,碱基的简并等操作,需要联合使用多个软件来实现,这会带来操作流程的繁琐与耗时,也具有也一定的专业门槛,以至于在众多的利用16s rrna基因高通量测序的文章中,16srrna高通量测序的使用者们普遍采用固定的通用引物而很少改进引物。


技术实现思路

1、本专利技术设计出一个集合了序列比对、序列反向互补、碱基简并功能的用于通用引物改进的系统“degenerate primer 111”,辅以结合silva数据库的操作流程,给广泛的16srrna高通量测序使用者以便利进行通用引物的改进,从而尽可能避免漏检目标微生物。

2、本专利技术所采用的具体技术方案如下:

3、第一方面,本专利技术提供了一种16s rrna基因通用引物的个性化改进方法,其包括:

4、s1:针对待改进的目标通用引物,获取其在silva数据库中的引物覆盖率评估结果,若该目标通用引物在目标微生物类别内的覆盖率未达到期望覆盖率,则从引物覆盖率评估结果中获取一条目标微生物类别内未被目标通用引物覆盖的16s rrna基因序列作为正义链序列;将正义链序列进行反向互补操作,获得反义链序列;

5、s2、将正义链序列作为待匹配基因序列,将目标通用引物的正向引物序列作为待匹配引物序列,构成一组匹配序列对;将反义链序列作为待匹配基因序列,将目标通用引物的反向引物序列作为待匹配引物序列,构成另一组匹配序列对;对每一组匹配序列对执行碱基匹配,定位得到待匹配基因序列中与待匹配引物序列长度相同且不匹配碱基数量最少的基因序列段,并记录待匹配引物序列中与所述基因序列段既不符合完全相同也不符合简并相同的不匹配碱基对数量;若所述不匹配碱基对数量超过silva数据库中执行引物覆盖率评估所允许的单条序列简并碱基数量上限,则直接终止引物的改进,否则遍历每一对不匹配碱基对,以完全覆盖这一对不匹配碱基对且简并程度最小的简并碱基替换待匹配引物序列中这一对不匹配碱基对所在位置的碱基,从而更新匹配序列对中的待匹配引物序列;

6、s3、将两组匹配序列对中更新后的待匹配引物序列作为新通用引物的正反向引物序列,从而得到针对所述目标微生物类别的个性化改进结果。

7、作为上述第一方面的优选,上述s1和s2步骤迭代循环,每一轮迭代均以上一轮迭代获得的新通用引物作为待改进的目标通用引物,重新执行s1和s2步骤,直至达到简并碱基数量上限被终止引物改进为止,以迭代过程中最新获得的新通用引物作为最终的个性化改进结果。

8、作为上述第一方面的优选,在利用简并碱基替换碱基过程中,所有可选的简并碱基按照简并程度分为三个优先级,最优先选择的是简并程度为2的6个简并碱基,分别为a/g=r、c/t=y、a/c=m、g/t=k、g/c=s、a/t=w,次优选择的是简并程度为3的4个简并碱基,分别为a/c/t=h,g/c/t=b,g/a/c=v,g/a/t=d,最后选择的是简并程度为4的1个简并碱基,为a/t/c/g=n。

9、作为上述第一方面的优选,所述的期望覆盖率为100%。

10、作为上述第一方面的优选,所述单条序列简并碱基数量上限为5个。

11、作为上述第一方面的优选,所述反向互补操作为对正义链序列采取先互补后反向或者先反向后互补的操作。

12、第二方面,本专利技术提供了一种16s rrna基因通用引物的个性化改进系统,其包括:

13、基因和引物序列获取模块,用于针对待改进的目标通用引物,获取其在silva数据库中的引物覆盖率评估结果,若该目标通用引物在目标微生物类别内的覆盖率未达到期望覆盖率,则从引物覆盖率评估结果中获取一条目标微生物类别内未被目标通用引物覆盖的16s rrna基因序列作为正义链序列;将正义链序列进行反向互补操作,获得反义链序列;

14、引物改进模块,用于将正义链序列作为待匹配基因序列,将目标通用引物的正向引物序列作为待匹配引物序列,构成一组匹配序列对;将反义链序列作为待匹配基因序列,将目标通用引物的反向引物序列作为待匹配引物序列,构成另一组匹配序列对;对每一组匹配序列对执行碱基匹配,定位得到待匹配基因序列中与待匹配引物序列长度相同且不匹配碱基数量最少的基因序列段,并记录待匹配引物序列中与所述基因序列段既不符合完全相同也不符合简并相同的不匹配碱基对数量;若所述不匹配碱基对数量超过silva数据库中执行引物覆盖率评估所允许的单条序列简并碱基数量上限,则直接终止引物的改进,否则遍历每一对不匹配碱基对,以完全覆盖这一对不匹配碱基对且简并程度最小的简并碱基替换待匹配引物序列中这一对不匹配碱基对所在位置的碱基,从而更新匹配序列对中的待匹配引物序列;

15、改进结果输出模块,用于将两组匹配序列对中更新后的待匹配引物序列作为新通用引物的正反向引物序列,从而得到针对所述目标微生物类别的个性化改进结果。

16、第三方面,本专利技术提供了一种计算机程序产品,包括计算机程序/指令,其特征在于,该计算机程序/指令被处理器执行时,能实现如上述第一方面任一项方案所述的16srrna基因通用引物的个性化改进方法。

17、第四方面,本专利技术提供了一种计算机可读存储介质,所述存储介质上存储有计算机程序,当所述计算机程序被处理器执行时,能实现如上述第一方面任一项方案所述的16srrna基因本文档来自技高网...

【技术保护点】

1.一种16S rRNA基因通用引物的个性化改进方法,其特征在于,包括:

2.如权利要求1所述的16S rRNA基因通用引物的个性化改进方法,其特征在于,上述S1和S2步骤迭代循环,每一轮迭代均以上一轮迭代获得的新通用引物作为待改进的目标通用引物,重新执行S1和S2步骤,直至达到简并碱基数量上限被终止引物改进为止,以迭代过程中最新获得的新通用引物作为最终的个性化改进结果。

3.如权利要求1所述的16S rRNA基因通用引物的个性化改进方法,其特征在于,在利用简并碱基替换碱基过程中,所有可选的简并碱基按照简并程度分为三个优先级,最优先选择的是简并程度为2的6个简并碱基,分别为A/G=R、C/T=Y、A/C=M、G/T=K、G/C=S、A/T=W,次优选择的是简并程度为3的4个简并碱基,分别为A/C/T=H,G/C/T=B,G/A/C=V,G/A/T=D,最后选择的是简并程度为4的1个简并碱基,为A/T/C/G=N。

4.如权利要求1所述的16S rRNA基因通用引物的个性化改进方法,其特征在于,所述的期望覆盖率为100%。

5.如权利要求1所述的16S rRNA基因通用引物的个性化改进方法,其特征在于,所述单条序列简并碱基数量上限为5个。

6.如权利要求1所述的16S rRNA基因通用引物的个性化改进方法,其特征在于,所述反向互补操作为对正义链序列采取先互补后反向或者先反向后互补的操作。

7.一种16S rRNA基因通用引物的个性化改进系统,其特征在于,包括:

8.一种计算机程序产品,包括计算机程序/指令,其特征在于,该计算机程序/指令被处理器执行时,能实现如权利要求1~7任一项所述的16S rRNA基因通用引物的个性化改进方法。

9.一种计算机可读存储介质,其特征在于,所述存储介质上存储有计算机程序,当所述计算机程序被处理器执行时,实现如权利要求1~7任一所述的16SrRNA基因通用引物的个性化改进方法。

10.一种计算机电子设备,其特征在于,包括存储器和处理器;

...

【技术特征摘要】

1.一种16s rrna基因通用引物的个性化改进方法,其特征在于,包括:

2.如权利要求1所述的16s rrna基因通用引物的个性化改进方法,其特征在于,上述s1和s2步骤迭代循环,每一轮迭代均以上一轮迭代获得的新通用引物作为待改进的目标通用引物,重新执行s1和s2步骤,直至达到简并碱基数量上限被终止引物改进为止,以迭代过程中最新获得的新通用引物作为最终的个性化改进结果。

3.如权利要求1所述的16s rrna基因通用引物的个性化改进方法,其特征在于,在利用简并碱基替换碱基过程中,所有可选的简并碱基按照简并程度分为三个优先级,最优先选择的是简并程度为2的6个简并碱基,分别为a/g=r、c/t=y、a/c=m、g/t=k、g/c=s、a/t=w,次优选择的是简并程度为3的4个简并碱基,分别为a/c/t=h,g/c/t=b,g/a/c=v,g/a/t=d,最后选择的是简并程度为4的1个简并碱基,为a/t/c/g=n。

4.如权利要求1所述的16s rrna...

【专利技术属性】
技术研发人员:沈超峰秦智慧徐心苏鹏
申请(专利权)人:浙江大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1