鉴定谱系树中分支点细胞命运决定的关键调控因子的方法技术

技术编号:35653057 阅读:8 留言:0更新日期:2022-11-19 16:48
本发明专利技术属于生物技术领域,具体涉及一种鉴定谱系树中分支点细胞命运决定的关键调控因子的方法,包括:获取谱系树中所有细胞类型的高维数据;建立基于流形学习的计算模型REFIT,所述REFIT用于映射树形结构中多种细胞类型的高维数据到低维空间;将高通量测序数据数据输入REFIT模型,鉴别谱系树中分支点细胞命运决定的关键调控因子。本发明专利技术创新性地将细胞类型表示成可变剪接事件在多种表观修饰和RNA序列特征构成的高维空间中的点,然后借助于流形学习的降维作用,鉴定谱系树中分支点细胞命运决定的关键调控因子。定的关键调控因子。定的关键调控因子。

【技术实现步骤摘要】
鉴定谱系树中分支点细胞命运决定的关键调控因子的方法


[0001]本专利技术属于生物
,具体涉及一种鉴定谱系树中分支点细胞命运决定的关键调控因子的方法。

技术介绍

[0002]谱系树(cell lineage tree)是由细胞分化过程及其形成的各子代细胞之间的关系组成的一个树形结构。谱系树作为多细胞生物最重要的表型之一,为追踪细胞分裂分化及细胞状态的时序变化提供了高效的数据表示和分析框架;它不仅是解决生命科学中许多发育有关重大问题的关键,也为发展计算技术和信息学方法来研究生物发育提供了重要手段。其中,干细胞(stem cell)谱系树是研究发育和细胞命运决定的最为重要的工具。
[0003]干细胞是一类多能(pluripotent)细胞,可以分化为形态结构、功能特征各不相同的细胞类群,并进而形成人体组织、器官和系统。干细胞持续的自我更新和多谱系分化是组织器官形成和个体发育的基础。干细胞不但是发育生物学的重要研究对象,更在临床应用领域有着广阔的前景。干细胞如何决定其在分化过程中的命运及其背后的调控机制是干细胞发育与器官再生领域最为关键科的学问题之一。因此,全面、系统、科学地研究干细胞的命运决定机制,将有助于深入理解器官发生和个体发育的生物学过程,并为细胞工程、再生医学及其临床应用提供理论基础。
[0004]伴随着细胞谱系树测定技术日新月异的发展,特别是近年基因编辑技术与单细胞测序技术的联合应用,细胞谱系树的数据呈现出快速积累的态势,基于谱系树的细胞状态建模与动态转移分析尤为重要,因为它是研究细胞命运决定机制的关键,且与发育生物学研究及临床应用直接关联。多组学的高通量测序技术,尤其是近年来不断发展的单细胞测序技术,为利用信息技术来研究细胞分化和命运决定提供了宝贵的资源。
[0005]鉴于可变剪接在干细胞自我更新、定向分化中的重要作用,阐释其精准调控机制将有助于进一步揭示干细胞的命运决定,并为细胞和组织工程以及再生医学提供理论基础。表观遗传修饰为剪接模式提供了表观遗传记忆,使剪接模式在干细胞自我更新过程中能够得以传递;同时,当干细胞定向分化而需要新的剪接模式时,该记忆又可被修改而无需建立新的剪接规则,便可得到特异性的剪接结果。
[0006]研究谱系树中细胞分化命运决定机制的关键在于揭示决定其定向分化命运(分支选择)的关键调控因子。传统研究的细胞命运决定,多侧重于细胞在自我更新和定向分化之间的命运预测,但是这仅仅适用于简单的谱系树,针对复杂的海量的多组学的高通量测序数据,以及更复杂的谱系树,如何从高维的多组学数据中学习其低维空间的表示,并基于此来得到分支点细胞命运决定的关键调控因子成为需要解决的技术问题。

技术实现思路

[0007]为了解决上述技术问题,本专利技术提供了一种鉴定谱系树中分支点细胞命运决定的关键调控因子的方法。
[0008]本专利技术的目的是提供一种鉴定谱系树中分支点细胞命运决定的关键调控因子的方法,包括:
[0009]获取谱系树中所有细胞类型的高维数据,所述高维数据是细胞的高通量测序数据;
[0010]建立基于流形学习的计算模型REFIT,所述REFIT用于映射树形结构中多种细胞类型的高维数据到低维空间;
[0011]将高通量测序数据数据输入REFIT模型,鉴别谱系树中分支点细胞命运决定的关键调控因子。
[0012]优选的,上述鉴定谱系树中分支点细胞命运决定的关键调控因子的方法,所述REFIT用于得到由可变剪接事件为点构成的树状流形图,其中每一个点对应一个可变剪接事件,而空间位置则反映了其关键表观调控因子。
[0013]优选的,上述鉴定谱系树中分支点细胞命运决定的关键调控因子的方法,根据所述树状流形图,找到任意两亲子代细胞间的经过可变剪接事件的分化路径,并确定对细胞分化命运决定起关键作用的点(关键调控因子)。
[0014]优选的,上述鉴定谱系树中分支点细胞命运决定的关键调控因子的方法,所述谱系树为人类胚胎干细胞分化谱系树、造血干细胞分化谱系树或者诱导多能干细胞分化谱系树。
[0015]优选的,上述鉴定谱系树中分支点细胞命运决定的关键调控因子的方法,所述高通量测序数据包括基因组、转录组和表观遗传组的高通量测序数据。
[0016]优选的,上述鉴定谱系树中分支点细胞命运决定的关键调控因子的方法,所述高维数据是组蛋白修饰和RNA序列的高通量测序数据。
[0017]优选的,上述鉴定谱系树中分支点细胞命运决定的关键调控因子的方法,将所述高通量测序数据先进行预处理,然后再建立计算模型REFIT。
[0018]优选的,上述鉴定谱系树中分支点细胞命运决定的关键调控因子的方法,所述高通量测序数据预处理方式如下:获取谱系树中每种细胞类型的已比对到转录组的RNA

seq数据,使用rMATs软件检测谱系树中每个细胞类型的可变剪接事件,记录每个可变剪接区域的剪入百分比(percent spliced in,PSI),合并所有细胞类型鉴定的可变剪接事件,使得谱系树中每种细胞类型都共用一组完全一样的可变剪接事件列表。
[0019]优选的,上述鉴定谱系树中分支点细胞命运决定的关键调控因子的方法,所述高通量测序数据预处理方式如下:获取谱系树中每种细胞类型的已比对到基因组的组蛋白修饰的ChIP

seq数据,使用MACS2软件检测谱系树中每个细胞类型的组蛋白修饰信号峰,针对每种组蛋白修饰,合并所有细胞类型中检测的信号峰,从而得到统一的一组组蛋白修饰信号峰列表;
[0020]基于信号峰与5

端剪接位点的距离d及峰的高度h,定义组蛋白修饰在可变剪接区间的强度为HM=h/d,对每一细胞类型的ChIP

seq数据进行相同处理后,将各自获得一个数据表,其中“行”表示可变剪接事件,“列”表示组蛋白修饰种类,“值”表示某一可变组蛋白修饰在某一可变剪接区域的信号峰强度。
[0021]优选的,上述鉴定谱系树中分支点细胞命运决定的关键调控因子的方法,所述高通量测序数据预处理方式如下:选取可变剪接位点及其上下游各150bp区间,然后从基因组
FASTA文件中提取该区间的碱基序列,并使用独热编码方法将碱基序列转换成二进制的4
×
n的二维向量,其中n表示序列的长度。
[0022]与现有技术相比,本专利技术具有以下有益效果:
[0023]为了对干细胞多代分化过程进行完整刻画,考虑蕴藏于谱系树中的结构信息,本专利技术围绕人类胚胎干细胞谱系树、造血干细胞谱系树和iPSC分化成神经细胞的谱系树,充分考虑“树”的结构信息,开发系统的生物信息学计算方法,研究干细胞多代分化的谱系树中高维的多组学数据的低维空间的表示,并基于此来鉴定分支点细胞命运决定的关键调控因子,进而揭示关键节点上参与细胞命运决定的可变剪接调控机制。
[0024]我们提出以下假设:鉴于剪接模块及其调控密码在分化过程中的动态变化和谱系树结构,以及更重要的是这些信息都是以高维观测值来表示本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.鉴定谱系树中分支点细胞命运决定的关键调控因子的方法,其特征在于,包括:获取谱系树中所有细胞类型的高维数据,所述高维数据是细胞的高通量测序数据;建立基于流形学习的计算模型REFIT,所述REFIT用于映射树形结构中多种细胞类型的高维数据到低维空间;将高通量测序数据数据输入REFIT模型,鉴别谱系树中分支点细胞命运决定的关键调控因子。2.根据权利要求1所述的鉴定谱系树中分支点细胞命运决定的关键调控因子的方法,其特征在于,所述REFIT用于得到由可变剪接事件为点构成的树状流形图,其中每一个点对应一个可变剪接事件,而空间位置则反映了其关键表观调控因子。3.根据权利要求2所述的鉴定谱系树中分支点细胞命运决定的关键调控因子的方法,其特征在于,根据所述树状流形图,找到任意两亲子代细胞间的经过可变剪接事件的分化路径,并确定对细胞分化命运决定起关键作用的关键调控因子。4.根据权利要求1所述的鉴定谱系树中分支点细胞命运决定的关键调控因子的方法,其特征在于,所述谱系树为人类胚胎干细胞分化谱系树、造血干细胞分化谱系树或者诱导多能干细胞分化谱系树。5.根据权利要求1所述的鉴定谱系树中分支点细胞命运决定的关键调控因子的方法,其特征在于,所述高通量测序数据包括基因组、转录组和表观遗传组的高通量测序数据。6.根据权利要求5所述的鉴定谱系树中分支点细胞命运决定的关键调控因子的方法,其特征在于,所述高维数据是组蛋白修饰和RNA序列的高通量测序数据。7.根据权利要求6所述的鉴定谱系树中分支点细胞命运决定的关键调控因子的方法,其特征在于,将所述高通量测序数据先进行预处理,然后再建立计算模型REFIT。8.根据权利要求7所述的鉴定谱系树中分...

【专利技术属性】
技术研发人员:徐云刚郭茂祖杨娟邹权郭琛李如风姚宇飞李亚晨李月森邵锦瑞
申请(专利权)人:西安交通大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1