谱系树中可变剪接模式和染色质状态动态变化的分析方法技术

技术编号:35425024 阅读:16 留言:0更新日期:2022-11-03 11:27
本发明专利技术属于生物技术领域,具体涉及一种谱系树中可变剪接模式和染色质状态动态变化的分析方法,包括:获取谱系树中所有细胞类型的高通量测序数据;建立基于混合高斯模型的概率生成模型,将高通量测序数据数据输入概率生成模型,分析可变剪接模式和染色质状态在谱系树上的动态变化。本发明专利技术整合高通量多组学数据,研究可变剪接模式及染色质状态的动态变化,进而揭示细胞分化过程中与命运决定密切相关的调控因子。调控因子。调控因子。

【技术实现步骤摘要】
谱系树中可变剪接模式和染色质状态动态变化的分析方法


[0001]本专利技术属于生物
,具体涉及一种谱系树中可变剪接模式和染色质状态动态变化的分析方法。

技术介绍

[0002]谱系树(cell lineage tree)是由细胞分化过程及其形成的各子代细胞之间的关系组成的一个树形结构。谱系树作为多细胞生物最重要的表型之一,为追踪细胞分裂分化及细胞状态的时序变化提供了高效的数据表示和分析框架;它不仅是解决生命科学中许多发育有关重大问题的关键,也为发展计算技术和信息学方法来研究生物发育提供了重要手段。其中,干细胞(stem cell)谱系树是研究发育和细胞命运决定的最为重要的工具。
[0003]干细胞是一类多能(pluripotent)细胞,可以分化为形态结构、功能特征各不相同的细胞类群,并进而形成人体组织、器官和系统。干细胞持续的自我更新和多谱系分化是组织器官形成和个体发育的基础。干细胞不但是发育生物学的重要研究对象,更在临床应用领域有着广阔的前景。干细胞如何决定其在分化过程中的命运及其背后的调控机制是干细胞发育与器官再生领域最为关键科的学问题之一。因此,全面、系统、科学地研究干细胞的命运决定机制,将有助于深入理解器官发生和个体发育的生物学过程,并为细胞工程、再生医学及其临床应用提供理论基础。
[0004]伴随着细胞谱系树测定技术日新月异的发展,特别是近年基因编辑技术与单细胞测序技术的联合应用,细胞谱系树的数据呈现出快速积累的态势,基于谱系树的细胞状态建模与动态转移分析尤为重要,因为它是研究细胞命运决定机制的关键,且与发育生物学研究及临床应用直接关联。多组学的高通量测序技术,尤其是近年来不断发展的单细胞测序技术,为利用信息技术来研究细胞分化和命运决定提供了宝贵的资源,威斯康星大学研究人员率先基于他们之前提出的系统发生树(phylogenetic tree)模型(Roy S,Wapinski I,Pfiffner J,French C,Socha A,Konieczka J,Habib N,Kellis M,Thompson D,Regev A:Arboretum:Reconstruction and analysis of the evolutionary history of condition

specific transcriptional modules.Genome Research 2013,23(6):1039

1050.)来研究谱系树中细胞的染色质状态(表示为多种组蛋白修饰)的动态转换(Roy S,Sridharan R:Chromatin module inference on cellular trajectories identifies key transition points and poised epigenetic states in diverse developmental processes.Genome research 2017,27(7):1250

1262)。虽然基于高通量测序的转录组和表观组学数据已在以上研究中被用于建模和分析谱系树中细胞状态,但是以上研究仅仅揭示了成对细胞间的不同状态,而未定量分析在谱系树中不同细胞状态之间的定向转移(分化)概率,不清楚染色质状态动态变化。
[0005]另外,可变剪接是最重要的mRNA前体加工过程,它以组织和发育特异性的方式增加转录组和蛋白质组的多样性。可变剪接普遍存在于真核生物细胞中,基于RNA测序(RNA

seq)数据估算,人体约超过90%的基因会经历不同的可变剪接过程,研究表明,可变剪接对
于干细胞分化和命运决定也起到了至关重要的作用,然而,以往研究都仅仅关注某一孤立的可变剪接事件及其调控机制。
[0006]综上,针对复杂的海量的多组学的高通量测序数据,缺乏一种有效的方法来分析干细胞分化过程中的可变剪接模式以及染色质状态动态变化。

技术实现思路

[0007]为了解决上述技术问题,本专利技术提供了一种谱系树中可变剪接模式和染色质状态动态变化的分析方法。
[0008]本专利技术的目的是提供一种谱系树中可变剪接模式和染色质状态动态变化的分析方法,包括:
[0009]获取谱系树中所有细胞类型的高通量测序数据;
[0010]建立基于混合高斯模型(gaussian mixture model,GMM)的概率生成模型,将高通量测序数据数据输入概率生成模型,分析可变剪接模式和染色质状态在谱系树上的动态变化。
[0011]优选的,上述谱系树中可变剪接模式和染色质状态动态变化的分析方法,所述概率生成模型由两部分组成:一是描述每种细胞状态的表观剪接模块;二是描述表观剪接模块在细胞代际间的状态转移的转移概率矩阵。
[0012]优选的,上述谱系树中可变剪接模式和染色质状态动态变化的分析方法,所述概率生成模型用于检测剪接特异性和可供实验验证的表观遗传调控机制。
[0013]优选的,上述谱系树中可变剪接模式和染色质状态动态变化的分析方法,所述谱系树为人类胚胎干细胞分化谱系树、造血干细胞分化谱系树或者诱导多能干细胞分化谱系树。
[0014]优选的,上述谱系树中可变剪接模式和染色质状态动态变化的分析方法,所述高通量测序数据包括基因组、转录组和表观遗传组的高通量测序数据。
[0015]优选的,上述谱系树中可变剪接模式和染色质状态动态变化的分析方法,将所述高通量测序数据先进行预处理,然后再建立所述概率生成模型。
[0016]优选的,上述谱系树中可变剪接模式和染色质状态动态变化的分析方法,所述高通量测序数据预处理方式如下:获取谱系树中每种细胞类型的已比对到转录组的RNA

seq数据,使用rMATs软件检测谱系树中每个细胞类型的可变剪接事件,记录每个可变剪接区域的剪入百分比(percent spliced in,PSI),合并所有细胞类型鉴定的可变剪接事件,使得谱系树中每种细胞类型都共用一组完全一样的可变剪接事件列表。
[0017]优选的,上述谱系树中可变剪接模式和染色质状态动态变化的分析方法,所述高通量测序数据预处理方式如下:获取谱系树中每种细胞类型的已比对到基因组的组蛋白修饰的ChIP

seq数据,使用MACS2软件检测谱系树中每个细胞类型的组蛋白修饰信号峰,针对每种组蛋白修饰,合并所有细胞类型中检测的信号峰,从而得到统一的一组组蛋白修饰信号峰列表;
[0018]基于信号峰与5

端剪接位点的距离d及峰的高度h,定义组蛋白修饰在可变剪接区间的强度为HM=h/d,对每一细胞类型的ChIP

seq数据进行相同处理后,将各自获得一个数据表,其中“行”表示可变剪接事件,“列”表示组蛋白修饰种类,“值”表示某一可变组蛋白修
饰在某一可变剪接区域的信号峰强度。
[0019]优选的,上述谱系树中可变剪接模式和染本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.谱系树中可变剪接模式和染色质状态动态变化的分析方法,其特征在于,包括:获取谱系树中所有细胞类型的高通量测序数据;建立基于混合高斯模型的概率生成模型,将高通量测序数据数据输入概率生成模型,分析可变剪接模式和染色质状态在谱系树上的动态变化。2.根据权利要求1所述的谱系树中可变剪接模式和染色质状态动态变化的分析方法,其特征在于,所述概率生成模型由两部分组成:一是描述每种细胞状态的表观剪接模块;二是描述表观剪接模块在细胞代际间的状态转移的转移概率矩阵。3.根据权利要求1所述的谱系树中可变剪接模式和染色质状态动态变化的分析方法,其特征在于,所述概率生成模型用于检测剪接特异性和可供实验验证的表观遗传调控机制。4.根据权利要求1所述的谱系树中可变剪接模式和染色质状态动态变化的分析方法,其特征在于,所述谱系树为人类胚胎干细胞分化谱系树、造血干细胞分化谱系树或者诱导多能干细胞分化谱系树。5.根据权利要求1所述的谱系树中可变剪接模式和染色质状态动态变化的分析方法,其特征在于,所述高通量测序数据包括基因组、转录组和表观遗传组的高通量测序数据。6.根据权利要求5所述的谱系树中可变剪接模式和染色质状态动态变化的分析方法,其特征在于,将所述高通量测序数据先进行预处理,然后再建立所述概率生成模型。7.根据权利要求6所述的谱系树中可变剪接模式和染色质状态动态变化的分析方法,其特征在于,所述高通量测序数据预处理方式如下:获取谱系树中每种细胞类型的已比对到转录组的RNA

seq数据,使用rMATs软件检测谱系树中每个细胞类型的可变剪...

【专利技术属性】
技术研发人员:徐云刚张保军杨娟邹权刘薇郭琛姚宇飞李康李月森张栩瑞
申请(专利权)人:西安交通大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1