【技术实现步骤摘要】
基于CUT&Tag技术分析DNA和蛋白质互作的方法
[0001]本专利技术涉及表观遗传学领域,具体涉及基于CUT&Tag技术分析DNA和蛋白质互作的方法。
技术介绍
[0002]在几乎所有的细胞生命活动中,例如DNA复制,基因的表达、调控、重组和修复,RNA转录、翻译、修饰等都涉及到DNA与蛋白质之间的相互作用。早在十九世纪后期,科学家就通过显微镜观察到了蛋白质与DNA直接的相互作用,此后,科学家专利技术了许多方法来深入探索蛋白质结合并控制DNA的作用机制:凝胶迁移实验(EMSA)、足迹实验(foot
‑
printing assay)、甲基化干扰实验、染色质免疫共沉淀技术(ChIP)、Southwestern杂交等。其中,ChIP与高通量测序结合的技术ChIP
‑
seq由于能在全基因组范围内真实、完整地检测与组蛋白、转录因子等互作的DNA区段而成为目前全基因组水平研究DNA与蛋白质相互作用的标准实验技术。
[0003]但ChIP
‑
seq及其变异受交联作用影响,信号低、背景高,因为产量低所以需要大量的细胞,且实验重复性差。这些技术上的困难限制了ChIP
‑
seq技术在表观基因组等领域的进一步发展。CUT&Tag技术于2019年发表于Nature Communications杂志(CUT&Tag for efficient epigenomic profiling of small sampl ...
【技术保护点】
【技术特征摘要】
1.一种分析DNA和蛋白质互作的方法,其特征在于,包括:获得基于CUT&Tag技术的待分析样本的高通量测序数据Raw Data,并对Raw Data进行过滤得到高质量的Clean Data;将Clean Data与参考基因组进行比对,获得Reads在基因组上的位置信息,选择双端唯一比对到参考基因组上的Reads并过滤比对到线粒体DNA上的Reads、去除冗余的Reads,得到有效Reads比对结果;基于有效Reads比对结果,统计总体比对效率、唯一比对效率、MT比例、冗余Reads比例,并绘制Read插入片段分布图、Read在基因TSS/TES附近的富集信号图;基于有效Reads比对结果,选用MACS2软件进行Peak富集峰的提取;对提取到的富集峰进行关联基因注释;对注释到基因Promoter区的关联基因进行GO/KEGG富集分析;对提取到的富集峰,进行motif分析。2.根据权利要求1所述的方法,其特征在于,当含有两个以上待分析样本时,基于有效Reads比对结果,统计比对效率、唯一比对效率、MT比例、冗余Reads的比例,并绘制Read插入片段分布图、Read在基因TSS/TES附近的富集信号图、样本之间的相关性图。3.根据权利要求1或2所述的方法,其特征在于,当含有两个以上待分析样本时,所述方法还包括:基于提取到的富集峰,做样本间差异Peak分析,并对得到的差异Peak进行关联基因注释、关联基因富集分析、差异Peak的motif分析。4.根据权利要求1
‑
3中任一项所述的方法,其特征在于,所述对Raw Data进行过滤得到高质量的Clean Data具体包括:利用cutadapt软件去接头,去掉长度小于35bp的reads;去除N的比例大于10%的Reads;去除质量值Q≤10的碱基数占整条Read的50%以上的Reads。5.根据权利要求1
‑
4中任一项所述的方法,其特征在于,所述有效Reads比对结果的获得方法具体包括:选择Bowtie2将Clean Data与参考基因组进行比对,使用严格比对
‑‑
very
‑
sensitive
‑
local,设置双端比对最大片段长度为700;选择sambamba软件选择唯一比对到参考基因组上的Reads,即双端Reads比对到参考基因组上合适的位置,且比对质量值>=30的比对结果;选择sambamba软件过滤比对到线粒体DNA上的Reads;选择sambamba软件的markdup程序去除冗余的Reads;选择sambamba软件对去冗余得到的BAM格式文件进行排序,用于后续分析。6.根据权利要求1
‑
5中任一项所述的方法,其特征在于,所述总体比对效率定义为比对到参考基因组...
【专利技术属性】
技术研发人员:郑洪坤,聂佩瑶,刘敏,张雪川,
申请(专利权)人:北京百迈客生物科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。