基于CUT&Tag技术分析DNA和蛋白质互作的方法技术

技术编号：29226326 阅读：26 留言：0更新日期：2021-07-10 01:11

本发明专利技术涉及表观遗传学领域，具体涉及基于CUT&Tag技术分析DNA和蛋白质互作的方法。本发明专利技术通过将高通量测序后的Raw Data进行处理(过滤接头和低质量的Read)获得高质量的Clean Data，将Clean Data比对到参考基因组获得详细的比对信息，利用MACS2软件检测Peak，并对检测到的Peak进行关联基因注释、关联基因富集分析、motif分析、样本间差异分析(多个样本)等分析，提供了一整套基于CUT&Tag技术的高通量测序分析流程方法，其使用合理的并行设计，可快速实现大样本量的CUT&Tag数据分析。速实现大样本量的CUT&Tag数据分析。速实现大样本量的CUT&Tag数据分析。

全部详细技术资料下载

【技术实现步骤摘要】
基于CUT＆Tag技术分析DNA和蛋白质互作的方法

[0001]本专利技术涉及表观遗传学领域，具体涉及基于CUT&Tag技术分析DNA和蛋白质互作的方法。

技术介绍

[0002]在几乎所有的细胞生命活动中，例如DNA复制，基因的表达、调控、重组和修复，RNA转录、翻译、修饰等都涉及到DNA与蛋白质之间的相互作用。早在十九世纪后期，科学家就通过显微镜观察到了蛋白质与DNA直接的相互作用，此后，科学家专利技术了许多方法来深入探索蛋白质结合并控制DNA的作用机制：凝胶迁移实验(EMSA)、足迹实验(foot
‑
printing assay)、甲基化干扰实验、染色质免疫共沉淀技术(ChIP)、Southwestern杂交等。其中，ChIP与高通量测序结合的技术ChIP
‑
seq由于能在全基因组范围内真实、完整地检测与组蛋白、转录因子等互作的DNA区段而成为目前全基因组水平研究DNA与蛋白质相互作用的标准实验技术。
[0003]但ChIP
‑
seq及其变异受交联作用影响，信号低、背景高，因为产量低所以需要大量的细胞，且实验重复性差。这些技术上的困难限制了ChIP
‑
seq技术在表观基因组等领域的进一步发展。CUT&Tag技术于2019年发表于Nature Communications杂志(CUT&Tag for efficient epigenomic profiling of small sampl...

【技术保护点】

【技术特征摘要】
1.一种分析DNA和蛋白质互作的方法，其特征在于，包括：获得基于CUT&Tag技术的待分析样本的高通量测序数据Raw Data，并对Raw Data进行过滤得到高质量的Clean Data；将Clean Data与参考基因组进行比对，获得Reads在基因组上的位置信息，选择双端唯一比对到参考基因组上的Reads并过滤比对到线粒体DNA上的Reads、去除冗余的Reads，得到有效Reads比对结果；基于有效Reads比对结果，统计总体比对效率、唯一比对效率、MT比例、冗余Reads比例，并绘制Read插入片段分布图、Read在基因TSS/TES附近的富集信号图；基于有效Reads比对结果，选用MACS2软件进行Peak富集峰的提取；对提取到的富集峰进行关联基因注释；对注释到基因Promoter区的关联基因进行GO/KEGG富集分析；对提取到的富集峰，进行motif分析。2.根据权利要求1所述的方法，其特征在于，当含有两个以上待分析样本时，基于有效Reads比对结果，统计比对效率、唯一比对效率、MT比例、冗余Reads的比例，并绘制Read插入片段分布图、Read在基因TSS/TES附近的富集信号图、样本之间的相关性图。3.根据权利要求1或2所述的方法，其特征在于，当含有两个以上待分析样本时，所述方法还包括：基于提取到的富集峰，做样本间差异Peak分析，并对得到的差异Peak进行关联基因注释、关联基因富集分析、差异Peak的motif分析。4.根据权利要求1
‑
3中任一项所述的方法，其特征在于，所述对Raw Data进行过滤得到高质量的Clean Data具体包括：利用cutadapt软件去接头，去掉长度小于35bp的reads；去除N的比例大于10％的Reads；去除质量值Q≤10的碱基数占整条Read的50％以上的Reads。5.根据权利要求1
‑
4中任一项所述的方法，其特征在于，所述有效Reads比对结果的获得方法具体包括：选择Bowtie2将Clean Data与参考基因组进行比对，使用严格比对
‑‑
very
‑
sensitive
‑
local，设置双端比对最大片段长度为700；选择sambamba软件选择唯一比对到参考基因组上的Reads，即双端Reads比对到参考基因组上合适的位置，且比对质量值>＝30的比对结果；选择sambamba软件过滤比对到线粒体DNA上的Reads；选择sambamba软件的markdup程序去除冗余的Reads；选择sambamba软件对去冗余得到的BAM格式文件进行排序，用于后续分析。6.根据权利要求1
‑
5中任一项所述的方法，其特征在于，所述总体比对效率定义为比对到参考基因组...

【专利技术属性】
技术研发人员：郑洪坤，聂佩瑶，刘敏，张雪川，
申请(专利权)人：北京百迈客生物科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人

基于CUT&amp;Tag技术分析DNA和蛋白质互作的方法技术

基于CUT&Tag技术分析DNA和蛋白质互作的方法技术