一种基于组合原理和PCR建立超大容量基因文库的新方法技术

技术编号:4136753 阅读:259 留言:0更新日期:2012-04-11 18:40
酶的定向进化是改变酶的性质,提高其利用价值的有效途径。但现有的定向进化的方法都依赖已有基因,只能在已发现的基因基础上进行改造。因此,对于自然界中不存在或者新出现的筛选目标无能为力。本发明专利技术利用带有共用接头的随机片段,用PCR的方法将随机片段进行连接、组合和重聚,得到一个随机组合的庞大的基因文库。此文库在理论上包含了任意的基因序列,可以进行任意目标性状的筛选,从而可以创造新基因,突破了原来定向进化方法只能对现有基因进行改造的局限。本发明专利技术(建立超大容量基因文库)将使定向进化和医药体筛选不再受基因文库多样性有限的困扰,为筛选提供了一个巨大的资源库,对现有基因文库难以筛选的一些目标,如新的靶点受体的筛选,非自然条件酶的发现,新的靶标物质的检测等发挥积极的作用。

【技术实现步骤摘要】

本专利技术涉及一种在分子进化中建立基因文库的方法,利用带有共用接头的随机片 段,用PCR的方法将随机片段进行互补、重叠延伸和重聚,得到一个随机组合的庞大基因文 库。
技术介绍
酶作为生物催化剂有催化效率高、专一性强、反应条件温和、环境友好等优势。美 国能源部、商业部等部门预测生物催化剂将成为21世纪化学工业可持续发展的必要工 具。它是工业生物技术的核心,但是天然酶的性质很难适应各种工业生产的条件。酶的定 向进化(Directed Evolution, DE)是为满足这种需求而改变酶的结构和性质的有效途径。 酶(或蛋白质)的定向进化又称酶的体外分子进化(In vitro Molecular Directed Evolution),是在实验室中模拟达尔文进化的过程,以改进的诱变技术结合重组 手段,建立突变体文库,创造分子的多样性,再结合灵敏的高通量筛选技术,可以迅速得到 理想的非天然酶(或循环进入下一轮定向进化中以期得到更为理想的非天然酶)。定向进 化与蛋白质的理性设计不同,它不用事先了解蛋白质的结构、保守位点、催化机制等,并且 与自然进化相比,进化的时间縮减到数月甚至是数周。定向进化技术已被用于上百个酶的 进化,大大提高了生物酶的活性和效率,在工业、农业、药业的生产上产生了巨大影响。 酶的定向进化需要两项重要的支撑技术一是要建立具有足够量的变异体的突变 体文库,为进一步筛选提供丰富的素材;二是要有合适的筛选系统,可以快速的从众多的变 异蛋白质中筛选到符合目标的蛋白质。建立突变体文库的关键是创造基因的多样性,易错 PCR (Error-prone PCR)和DNA重组(DNARecombination)是现有的主要方法。易错PCR是 通过改变反应体系中Mg2+和dNTPs的浓度向相应DNA分子中随机引入错配碱基来获得酶 分子的随机突变体,然后经过多重这样的小步幅迭代变异(每次1-2个氨基酸),以相继式 或组合式累积起来的变异获得理想的酶功能。易错PCR在实际应用中存在一定的局限性 一是变异速度慢;二是仅引入点突变;三是涉及的基因片段太短(小于800bp)。另一种产 生突变的主要方法是体内同源基因的随机拼接或家族重排。目前,DNA重组的方法很多,如 DNA改组(DNA Shuffling)、交错延伸PCR(StEP)、外显子DNA随机重组、随机引物体外重组 (RPR)、渐增切割法产生杂和酶(ITCHY)、随机插入与删除(RID),这些方法与易错PCR不同 的是DNA重组依靠的是混合和连接亲本DNA的众多片段来产生突变体,称作有性PCR。在众 多的DNA重组方法中,DNA改组得到了广泛的应用,其基本原理为首先利用PCR或酶切的 手段获得基因库里的一组同源基因或突变体基因片段,然后用化学(DNasel)或物理(超声 波)的手段将其随机切断成一定长度范围内的小片段,由于这些小片段之间具有一定的同 源性可相互为引物,通过重聚PCR(Re-assembly via PCR)的途径延伸为具有全长的基因片 段。当来自一种基因拷贝的小片段与另一种拷贝的小片段相互为引物时,即可发生模板的 移位。这种方法不仅可以创造将亲本基因群中的突变尽可能组合的机会,获得导致更大变 异的突变体,还能将父本基因的优势集为一体。3 虽然,DNA改组及其衍生技术是获得有益突变体的有力工具,但它们通常不能用 于重组同源性低于70% _80%的序列。自然界中存在很多种蛋白质,其序列不同(同源性 低)而空间结构相似,为了对这些蛋白质进行重组,Benkovic研究组建立渐增切割法产生 杂和酶(ITCHY)方法来产生不依赖于DNA序列同源性的重组文库。Sieber等提出了不依 赖序列同源性的蛋白质重组(SHIPREC)方法,通过琼脂糖凝胶电泳回收单基因长度随机片 段,保证了子代嵌合体长度的保守性,使交叉保持了适当的序列匹配,主要发生在结构上 相关的位点,交叉点处的两个氨基酸仍处于它们在亲本蛋白质结构中的位置,从而提高了 文库中功能杂合子的比例。Liu等提出的非同源随机重组(NRR, nonhomologous random recombination)方法,通过连接酶的随机连接,可以对两个非同源的亲本基因进行随机重 组。 已有的建立突变体文库的方法对酶的进化尤其是对生产适用于医药和工业生产 的生物催化剂起到了巨大的推动作用,但这些方法只能依赖现有的基因进行改造和筛选, 难以开拓新的序列空间(尤其是功能改变较大时),对于在自然界中不存在的筛选目标,如 对于新出现的病毒的预防或者对于非自然的性状的筛选,则很难通过利用原有基因的改造 来实现。 因此,通过设计随机序列,采用组合的原理和PCR方法,本专利技术拟建立一种构建超 大容量基因文库的方法,该文库不依赖于现有基因库并且在理论上能够包含编码任何蛋白 质的序列空间。
技术实现思路
本专利技术的目的是提供一种建立基因文库的方法。 本专利技术所提供的方法,称为基于组合原理和PCR建立基因文库的方法,包括以下 步骤 1设计随机的DNA或者RNA序列,序列的两端有共用接头序列。 2利用共用接头序列的互补,将随机序列在溶液中进行PCR重聚。 3在重聚过程中加入包含1中接头序列的特异性引物控制重聚产物的长度。 4利用PCR手段用特异性引物对重聚产物进行扩增。 5对步骤2或者3或者4的DNA或者RNA产物进行不对称PCR,得到单链核酸片段,并进行筛选,得到与目标物质相识别和特异性结合的DNA分子或者RNA分子。 6对步骤2或者3或者4的DNA产物进行片段回收,通过酶切、连接、转化等手段,筛选得到与与目标物质相识别和特异性结合的蛋白质或有其它任何功能的蛋白质。 本专利技术的原理如图1所示 以进化的目标分子为蛋白质(酶)为例设计长度为20-200个碱基(根据实际选 用)的两条随机序列,作为实验组合的基本模块(本说明以39个碱基为例),随机序列的两 端分别带有九个碱基的共用接头,这九个碱基顺向互补,作为一个通用的连接接口 ,在PCR 重聚时相互作为引物。九个碱基选用可编码形成柔性氨基酸(linker)的碱基序列。随机 序列中间的21个碱基是随机的,编码7个氨基酸,足够形成一个蛋白模序(motif)所需要 的氨基酸数目。因此,随机序列通过PCR重聚就可以得到一个能够编码有随机模序和柔性 连接交替而成的蛋白质。在反复的重聚后,重聚片段可以不断延长。为了防止重聚片段过长,在重聚PCR达到一定的循环数后,在反应体系中加入一定比例的终止序列,由于终止序 列是特异性的序列,在重聚延伸至此序列后,由于不再互补,重聚PCR反应终止。并用特异 性引物进行重聚后序列的扩增,来保证基因文库的多样性。根据筛选目标来确定回收的片 段的大小,并对回收的基因片段进行酶切、连接和转化,最后从转化的克隆中随机挑选阳性 克隆进行测序,检验文库序列的多样性。 如果进化的目标分子是DNA分子或者RNA分子,专利技术原理如下设计长度为9_300个碱基的两条随机序列(根据实际选用),作为实验组合的基本模块,随机序列的两端分别是带有九个碱基的共用接头,这九个碱基顺向互补,作为一个通用的连接接口 ,在PCR重聚时相互作为引物。因此,随机序列通过PCR重聚就可以得到一个共用接头和随机序列本文档来自技高网
...

【技术保护点】
一种基于组合原理和PCR建立超大容量基因文库的新方法。  步骤包括:  (a)设计随机的DNA或者RNA序列,序列的两端有共用接头序列。  (b)利用共用接头序列的互补,将随机序列在溶液中进行PCR重聚。  (c)在重聚过程中或重聚过程后加入包含(a)中接头序列的特异性引物控制重聚产物的长度。  (d)利用PCR手段用特异性引物对重聚产物进行扩增。  (e)对(b)或(c)或(d)的DNA或者RNA产物用不对称PCR得到单链分子后,直接进行筛选,得到与目标物质相识别和特异性结合的DNA分子或者RNA分子。  (f)对(b)或(c)或(d)的DNA产物进行片段回收,通过酶切、连接、转化等手段,筛选得到与目标物质相识别并特异性结合的蛋白质或有其它任何功能的蛋白质。

【技术特征摘要】
一种基于组合原理和PCR建立超大容量基因文库的新方法。步骤包括(a)设计随机的DNA或者RNA序列,序列的两端有共用接头序列。(b)利用共用接头序列的互补,将随机序列在溶液中进行PCR重聚。(c)在重聚过程中或重聚过程后加入包含(a)中接头序列的特异性引物控制重聚产物的长度。(d)利用PCR手段用特异性引物对重聚产物进行扩增。(e)对(b)或(c)或(d)的DNA或者RNA产物用不对称PCR得到单链分子后,直接进行筛选,得到与目标物质相识别和特异性结合的DNA分子或者RNA分子。(f)对(b)或(c)或(d)的DNA产物进行片段回收,通过酶切、连接、转化等手段,筛选得到与目标物质相识别并特异性结合的蛋白质或有其它任何功能的蛋白质。2. 根据权利要求1所述的方法,其特征在于步骤(a)中的DNA随机序列部分为NNN, 或者NNY或者NNR。其中N为C, G, A, T四个碱基之一 ;Y为C或T两个碱基之一 ;R为A或 G两个碱基之一。随机序列的个数为3-300个碱基。3. 根据权利要求l所述的方法,其特征在于步骤(a)中的RNA序列,其随机序列部分 为NNN,或者NNY或者NNR,其中N为C, G, A, U四个碱基之一 ;Y为C或U两个碱基之一 ;R 为A或G两个碱基...

【专利技术属性】
技术研发人员:石超马翠萍黄河青张书圣
申请(专利权)人:青岛科技大学
类型:发明
国别省市:95[中国|青岛]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利