一种同源2型CRISPR/Cas基因编辑系统的构建方法技术方案

技术编号:31609945 阅读:22 留言:0更新日期:2021-12-29 18:37
本发明专利技术涉及一种同源2型CRISPR/Cas基因编辑的构建方法,属于基因编辑技术领域,通过深度分析来自各种环境的宏基因组数据,经过组装短读段序列(100

【技术实现步骤摘要】
一种同源2型CRISPR/Cas基因编辑系统的构建方法


[0001]本专利技术涉及一种同源2型CRISPR/Cas基因编辑系统的构建方法,属于基因编辑


技术介绍

[0002]基因编辑(gene editing)技术使得针对DNA序列特定位点进行改造成为可能,比如第一代基因编辑工具锌指核酸酶(zinc finger nucleases,ZFNs),第二代基因编辑工具类似转录激活的小型核酸酶(transcription activator

like effector nucleases,TALENs),都可以用于改造靶向基因组,但是这些方法设计困难,不易制作,成本昂贵且普适性不强。
[0003]CRISPR(成簇的规律间隔的短回文重复序列,Clustered Regularly Interspaced Short Palindromic Repeat)/Cas(CRISPR

associated protein)系统,是来自古生菌和细菌的天然免疫系统,为第三代基因编辑工具。CRISPR/Cas系统不同于以往基因编辑工具(蛋白质

DNA识别),其利用向导RNA(single guide RNA,sgRNA)基于核酸互补配对原理进行目标DNA碱基序列的识别,引导Cas效应蛋白进行定点切割,适用性强、设计简单、成本低、效率高。Cas蛋白包含多种不同的效应结构域(domain),在核酸识别、稳定复合物结构、水解DNA磷酸二酯键等不同的活动中发挥作用。其中,源自化脓链球菌(Streptococcus pyogene Cas,SpCas9)的II型CRISPR/Cas9系统因其切割效率高,成为目前应用最为广泛的CRISPR/Cas系统。
[0004]大多数现有的CRISPR基因编辑系统是来自Streptococcus pyogenes中的SpCas9系统。这一系统通过识别并切割靶向的多核苷酸上的原间隔序列临近模块(Protospacer Adjacent Motif,PAM)序列,即“NGG”,限制了其进一步的广泛应用,得到更多种具有不同的理化性质并能识别不同PAM的同源CRSIPR/Cas系统成为研究重点。与此同时,在庞大以及各色各样的宏基因组中,隐藏了尚未培养甚至尚未发现的微生物,可能存在大量的未被发现的CRISPR/Cas蛋白编辑系统,这些系统在原核生物、真核生物,以及在体外环境中的活性需要得到证实。

技术实现思路

[0005]本专利技术的目的在于克服现有技术的不足,提供一种同源2型CRISPR/Cas基因编辑系统的构建方法,通过该构建方法预测出5种新的同源CRISPR/Cas基因编辑系统。
[0006]为实现上述目的,本专利技术采取的技术方案为:一种同源2型CRISPR/Cas基因编辑系统的构建方法,包括如下步骤:
[0007](1)对宏基因组测序数据进行处理,筛选得到contig序列和蛋白序列;
[0008](2)将步骤(1)所述的蛋白序列使用软件进行聚类,再使用HMMer软件包扩大聚类;
[0009](3)在步骤(2)扩大的聚类中,用已知的2型CRISPR/Cas系统相关的效应蛋白的隐马尔可夫模型文件搜索与2型CRISPR/Cas系统有关的聚类;
[0010](4)将步骤(3)所述的2型CRISPR/Cas系统有关的聚类,与相关数据库进行比对,筛选得到基因;
[0011](5)将步骤(4)筛选得到的基因所在的contig,进行CRISPR/Cas系统预测,将预测出的2型CRISPR/Cas系统的效应蛋白提取出,然后用软件分析结构域;
[0012](6)将步骤(5)预测出的2型CRISPR/Cas系统的效应蛋白的结构域和2型CRISPR/Cas系统的效应蛋白相关的辅助蛋白做比较基因组学和进化相关分析,即可得到同源2型CRISPR/Cas基因编辑系统。
[0013]本申请的专利技术人通过深度分析来自各种环境的宏基因组数据,经过组装短读段序列(100

300bp)得到长DNA序列(≥4000bp)草图,在长DNA序列中挖掘出新的2型同源CRISPR/Cas基因编辑系统的方法,通过该方法预测的内容包括:Cas效应蛋白(Cas9、Cas12和Cas13)、与Cas效应蛋白发挥作用相关的辅助蛋白、与Cas效应蛋白发挥作用相关的辅助序列、Cas效应蛋白发挥作用的关键序列。基于组装长DNA序列做CRISPR

Cas相关的蛋白质及元件预测,不依赖物种的精准判断;精确判断2型CRISPR/Cas系统的编码蛋白基因、成簇规律间隔的短回文重复序列,crRNA序列及反式激活crRNA序列;进一步挖掘其生物学过程中切割DNA功能的结构预测,包括但不限于crRNA

tracrRNA二级结构预测、Cas效应蛋白功能域预测、Cas

crRNA

tracrRNA/Cas

crRNA复合物结构预测;进一步挖掘Cas9/Cas12效应蛋白识别的多种紧邻靶向序列下游/上游的原间隔序列临近模块(PAM)。
[0014]作为本专利技术所述的构建方法的优选实施方式,步骤(1)中,所述对宏基因组测序数据进行处理具体为:通过对宏基因组的数据进行质控、拼接和基因预测;所述宏基因组测序数据为肠道宏基因组测序数据;所述contig序列的长度为≥4000bp,所述蛋白序列的长度为≥600bp。
[0015]作为本专利技术所述的构建方法的优选实施方式,步骤(2)具体为:所述的蛋白序列使用orthofinder软件进行聚类,再使用HMMer软件包扩大聚类。
[0016]作为本专利技术所述的构建方法的优选实施方式,步骤(4)中,相关数据库为Swiss prot数据库和NCBI nr数据库。
[0017]作为本专利技术所述的构建方法的优选实施方式,步骤(5)中,所述进行CRISPR/Cas系统预测的软件为CRISPRCasFinder,所述分析结构域的软件为HHpred。
[0018]本专利技术的另一目的是采用本专利技术所述的构建方法构建的同源2型CRISPR/Cas基因编辑系统。
[0019]作为本专利技术所述的同源2型CRISPR/Cas基因编辑系统的优选实施方式,所述的同源2型CRISPR/Cas基因编辑系统包括Cas核糖核蛋白复合物和CRISPR RNA。
[0020]作为本专利技术所述的同源2型CRISPR/Cas基因编辑系统的优选实施方式,所述的同源2型CRISPR/Cas基因编辑系统还包括辅助蛋白Cas1、辅助蛋白Cas2、辅助蛋白Cas4、辅助蛋白Csn2、辅助蛋白csx27、辅助蛋白csx28、辅助蛋白WYL或反式激活CRISPR RNA。
[0021]Cas9核酸内切酶是一种多结构域和多功能DNA核酸内切酶,其识别靶向序列需要两个重要因素:一个是结合的guide RNA与靶向序列互补链碱基互补配对;另一本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种同源2型CRISPR/Cas基因编辑系统的构建方法,其特征在于,包括如下步骤:(1)对宏基因组测序数据进行处理,筛选得到contig序列和翻译出的蛋白序列;(2)将步骤(1)所述的蛋白序列使用软件进行聚类,再使用HMMer软件包扩大聚类;(3)在步骤(2)扩大的聚类中,用已知的2型CRISPR/Cas系统相关的效应蛋白的隐马尔可夫模型文件搜索与2型CRISPR/Cas系统有关的聚类;(4)将步骤(3)所述的2型CRISPR/Cas系统有关的聚类,与相关数据库进行比对,筛选过滤得到新的基因;(5)将步骤(4)筛选得到的基因所在的contig序列,进行CRISPR/Cas系统预测,将预测出的2型CRISPR/Cas系统的效应蛋白提取出,然后用软件分析结构域;(6)将步骤(5)预测出的2型CRISPR/Cas系统的效应蛋白的结构域和2型CRISPR/Cas系统的效应蛋白相关的辅助蛋白做比较基因组学和进化相关分析,即可得到新的同源2型CRISPR/Cas基因编辑系统。2.如权利要求1所述的构建方法,其特征在于,步骤(1)中,所述对宏基因组测序数据进行处理具体为:通过对宏基因组的数据进行质控、拼接和基因预测;所述宏基因组测序数据为肠道宏基因组测序数据;所述contig序列的长度为≥4000,所述蛋白序列的长度为≥600。3.如权利要求1所述的构建方法,其特征在于,步骤(2)具体为:所述的蛋白序列使用orthofinder软件进行聚类,再使用HMMer软件包扩大聚类。4.如权利要求1所述的构建方法,其特征在于,步骤(4)中,相关数据库为Swiss prot数据库和NCBI nr数据库。5.如权利要求1所述的构建方法,其特征在于,步骤(5)中,所述进行CRISPR/Cas系统预测的软件为CRISPRCasFinder,所述分析结构域的软件为HHpred。6.采用权利要求1

5任一所述的构建方法构建的同源2型CRISPR/Cas基因编辑系统。7.如权利要求6所述的同源2型CRISPR/Cas基因编辑系统,其特征在于,所述的同源2型CRISPR/Cas基因编辑系统包括效应Cas核糖核蛋白复合物(Cas9,Cas12和Cas13)...

【专利技术属性】
技术研发人员:胡争崔资凤田瑞金庄黄昭玥李梦媛
申请(专利权)人:中山大学附属第一医院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1