一种判断二代测序检测基因编辑结果可信度的方法及应用技术

技术编号:31317401 阅读:21 留言:0更新日期:2021-12-12 23:57
本发明专利技术公开了一种判断二代测序检测基因编辑结果可信度的方法及应用,方法包括:(1)针对单个样本的有效数据和能够匹配上靶基因的数据均大于等于2000条;匹配上靶基因的数据与有效数据的比大于等于50%;(2)在sgRNA序列靶向的23nt中,某个位置检测到区别于参考序列的变异序列,变异序列与参考序列的比大于等于10:1,判断此突变序列为纯合型突变;若未检测到变异序列,则认为未发生编辑;(3)将GQ值设置为大于等于30;(4)有检测到变异序列时,同时满足(1)

【技术实现步骤摘要】
一种判断二代测序检测基因编辑结果可信度的方法及应用


[0001]本专利技术涉及植物基因工程
,特别涉及一种判断二代测序检测基因编辑结果可信度的方法及应用。

技术介绍

[0002]基因编辑技术CRISPR

Cas9是快速实现特定基因突变的有效手段,目前在育种和基因功能研究中得到广泛的研究应用。CRISPR

Cas9是对靶标基因进行编辑,通过靶标基因的变异改变素材的性状、研究靶向基因的功能。经CRISPR

Cas9获得的编辑素材,需要通过基因测序检测靶向基因的编辑位置、编辑类型和基因型。
[0003]编辑素材的单个靶向基因的突变检测,常规采用一代测序进行检测,通过对一代测序得到的峰图进行分析,判定靶基因的编辑位置、编辑类型和基因型,该方法测序成本高、峰图分析工作量大。当规模创制编辑素材,需要检测的靶向基因增多时,仍然采用一代测序会增加测序成本和峰图分析的工作量,因此出现了经PCR后采用二代测序的方式检测靶基因突变的方法。二代测序方法可同时对上千个样本进行测序分析靶向基因的突变,主要经PCR扩增、建库、上机测序、数据拆分和分析判定不同靶基因的编辑位置、编辑类型和基因型。
[0004]目前二代测序通过检测结果变异序列(alt)和参考序列(ref)之间的差异和比值进行统计分析来判定编辑位置、编辑类型;基因型的判断,则是通过变异检测软件根据ref/alt的支持reads数目得到的检测到。这样的判定没有考虑到reads数目以及比例等,会造成靶基因的变异检测结果和非变异检测结果存在假阳性或者假阴性,影响下一代研究样本的选择。

技术实现思路

[0005]本专利技术所要解决的技术问题是提供一种判断二代测序检测基因编辑结果可信度的方法及应用,解决了二代测序结果判定中出现的假阳性或假阴性,提高检测结果判断的可信度,提高了获得纯合编辑素材的效率。
[0006]本专利技术所要解决的技术问题是通过以下技术方案来实现的:
[0007]一种判断二代测序检测基因编辑结果可信度的方法,包括以下步骤:
[0008](1)数据量的限定:针对单个样本的有效数据(Clean Reads)大于等于2000条;能够匹配上靶基因的数据(Mapped Reads)大于等于2000条;匹配上靶基因的Mapped Reads数占比Clean Reads的比值(用于判定PCR 的特异性),Mapped Rate大于等于50%;
[0009](2)在sgRNA序列靶向的23nt中,某个位置检测到区别于参考序列的变异序列,当变异序列(alt)与参考序列(ref)之间的比值DP

Value 大于等于10:1时,判断此突变序列为纯合型突变(Hom),否则判断为杂合型突变(Het);若没有检测到变异序列(alt),则认为没有发生编辑;
[0010](3)数据分析表明,当(2)中有检测到变异序列时,genotype quality (GQ)值大于
等于30时,样本下一代检测结果的稳定性更好,因此,这里将GQ值设置为大于等于30;
[0011](4)有检测到变异序列时,同时满足步骤(1)、步骤(2)和步骤(3) 的则判定该变异结果可信为“Right”,否则不可信为“Wrong”;对于未检测到变异序列的样本,满足步骤(1)则认为该非变异结果可信为“Right”,否则不可信为“Wrong”。
[0012]优选地,还包括以下步骤:
[0013](5)判断发生变异的检测结果为“Right”的样本,则表示该样本靶基因发生编辑的结果可信,可优先进行研究;判断发生非变异的检测结果为“Right”的样本,则表示该样本靶基因未发生编辑的结果可信,不进行下一步研究。
[0014]优选地,还包括以下步骤:
[0015](6)经判断发生变异的或未发生变异的但检测结果为“Wrong”的样本,则表示该样本靶基因发生编辑或者未发生编辑的结果不可信,可再次进行上机测序再判断是否进一步研究。
[0016]优选地,步骤(6)中的可再次进行上机测序再判断是否进一步研究是指重新进行步骤(1)

(4)的方法;或者重新进行步骤(1)

(5)的方法;或者重新进行步骤(1)

(6)的方法。
[0017]一种根据上述的判断二代测序检测基因编辑结果可信度的方法的应用。
[0018]优选地,应用于混池敲除文库创制烟草基因编辑素材的高通量。
[0019]本专利技术上述技术方案,具有如下有益效果:
[0020]本申请经过对检测结果的reads数和比例进行设定,从而对二代变异检测结果和非变异检测结果的可信度进行判断,进一步提高编辑检测结果和非变异检测结果的准确性,为基因编辑素材的突变检测结果的准确判断提供支持,提高检测结果的可信度,同时也提高了获得纯合编辑素材的效率。
附图说明
[0021]被结合在说明书中并构成说明书的一部分的附图示出了本专利技术的实施例,并且连同其说明一起用于解释本专利技术的原理。
[0022]图1为本申请的样本S1在靶点内发生G到GT的纯合插入突变图。
[0023]图2为本申请的样本S4在靶点内未发生变异图。
[0024]图3本申请的样本S7在靶点内未发生变异图。
[0025]图4本申请的样本S8在靶点内未发生变异图。
具体实施方式
[0026]现在将参照附图来详细描述本专利技术的各种示例性实施例。应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本专利技术的范围。
[0027]一种判断二代测序检测基因编辑结果可信度的方法,包括以下步骤:
[0028](1)数据量的限定:针对单个样本的有效数据(Clean Reads)大于等于2000条;能够匹配上靶基因的数据(Mapped Reads)大于等于2000条;匹配上靶基因的Mapped Reads数占比Clean Reads的比值,大于等于50%;
[0029](2)在sgRNA序列靶向的23nt中,某个位置检测到区别于参考序列的变异序列,当变异序列(alt)与参考序列(ref)之间的比值DP

Value 大于等于10:1时,判断此突变序列为纯合型突变(Hom),否则判断为杂合型突变(Het);若没有检测到变异序列(alt),则认为没有发生编辑;
[0030](3)将genotype quality(GQ)值设置为大于等于30;
[0031](4)有检测到变异序列时,同时满足步骤(1)、步骤(2)和步骤(3) 的则判定该变异结果可信为“Right”,否则不可信为“Wrong”;对于未检测到变异序列的样本,满足步骤(1)则认为该非变异结果可信为“Right”,否则不可信为“Wrong”。
[0032](5)判断发生变异的检测结果为“Right”的样本,则表示该样本靶基因本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种判断二代测序检测基因编辑结果可信度的方法,其特征在于,包括以下步骤:(1)数据量的限定:针对单个样本的Clean Reads,大于等于2000条;能够匹配上靶基因的Mapped Reads,大于等于2000条;匹配上靶基因的Mapped Reads数占比Clean Reads的比值,大于等于50%;(2)在sgRNA序列靶向的23nt中,某个位置检测到区别于参考序列的变异序列,当变异序列与参考序列之间的比值DP

Value大于等于10:1时,判断此突变序列为纯合型突变,否则判断为杂合型突变;若没有检测到变异序列,则认为没有发生编辑;(3)将genotype quality值设置为大于等于30;(4)有检测到变异序列时,同时满足步骤(1)、步骤(2)和步骤(3)的则判定该变异结果可信为“Right”,否则不可信为“Wrong”;对于未检测到变异序列的样本,满足步骤(1)则认为该非变异结果可信为“Right”,否则不可信为“Wrong”。2.根据权利要求1所述的判断二代测序检测基因编辑结果可信度的方法,其特征在于,还包括以下步骤:(5)判断发生变异的检测结果为“Righ...

【专利技术属性】
技术研发人员:曾婉俐李雪梅向海英高茜米其利刘欣李晶黄海涛杨光宇蒋佳芮许力杨文武
申请(专利权)人:云南中烟工业有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1