System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基因调控网络的构建方法及相关装置制造方法及图纸_技高网
当前位置: 首页 > 专利查询>内蒙古大学专利>正文

一种基因调控网络的构建方法及相关装置制造方法及图纸

技术编号:44949031 阅读:3 留言:0更新日期:2025-04-12 01:22
本申请公开了一种基因调控网络的构建方法及相关装置,涉及基因调控网络构建技术领域,该方法包括:从SCREEN数据库中下载得到候选调控元件的位置数据,结合基因组注释文件和scATAC‑seq数据,对启动子和增强子进行精确定位,引入变分自编码器,准确确定存在潜在互作的增强子‑启动子对,将增强子与靶基因相关联,基于待检测对象的每一个转录因子在增强子上的潜在结合位点、存在潜在互作的增强子‑启动子对和每一个启动子对应的靶基因,对共表达基因网络进行处理,得到基因调控网络。本申请能够解决未能精确定位启动子和增强子、难以将增强子和靶基因关联、直接间接关系难以区分和假阳性调控关系过多等问题。

【技术实现步骤摘要】

本申请涉及基因调控网络构建,特别是涉及一种基于enhancernet构建增强子驱动的基因调控网络的构建方法及相关装置


技术介绍

1、基因调控网络(gene regulatory network,grn)记录了转录因子(transcriptionfactors,tfs)及其调控的靶基因之间的关系,揭示了细胞内部的基因表达调控机制,可以帮助理解细胞及组织行为的分子基础,深入了解基因调控网络对于揭示控制细胞行为的分子机制极为重要。

2、目前,常通过染色质免疫共沉淀测序技术、特定转录因子的干扰实验结合转录组测序等实验方法来推断基因调控网络,但是仍然难以大规模推断基因调控网络。单细胞rna测序(single-cell rnasequencing,scrna-seq)的出现提供了前所未有的转录组动态分辨率,这也为基因调控网络的推断提供了新的思路,促进了基于单细胞测序数据推断基因调控网络的算法模型的产生和发展。尽管目前已经开发出一系列的基于单细胞测序数据推断基因调控网络的算法模型,例如tenet、scenic、dictys等,但是未能精确定位启动子和增强子、难以将增强子和靶基因关联、直接间接关系难以区分和假阳性调控关系过多等问题依然是用于推断基因调控网络的算法模型所面临的严峻挑战。


技术实现思路

1、本申请的目的是提供一种基因调控网络的构建方法及相关装置,能够解决未能精确定位启动子和增强子、难以将增强子和靶基因关联、直接间接关系难以区分和假阳性调控关系过多等问题。

2、为实现上述目的,本申请提供了如下方案:

3、第一方面,本申请提供了一种基因调控网络的构建方法,所述基因调控网络的构建方法包括:

4、获取待检测对象的scatac-seq数据、scrna-seq数据、候选调控元件的位置数据和基因组注释文件;所述待检测对象为待检测生物体的组织;所述候选调控元件包括候选启动子和候选增强子,候选调控元件的位置数据是从screen数据库中下载得到的,候选调控元件的位置数据包括候选调控元件所在染色体的编号、候选调控元件在其所在染色体上的起始位点和候选调控元件在其所在染色体上的终止位点;

5、基于候选调控元件的位置数据和所述基因组注释文件,对所述候选启动子进行注释,确定所述候选启动子对应的靶基因,得到候选调控元件的注释数据;候选调控元件的注释数据包括每一个候选启动子的位置数据和对应的靶基因以及每一个候选增强子的位置数据;

6、基于scatac-seq数据和候选调控元件的注释数据,确定调控元件,并计算所述调控元件在待检测对象的每一个细胞中的读数,得到调控元件的注释数据;所述调控元件为开放的候选调控元件,所述调控元件包括启动子和增强子,调控元件的注释数据包括每一个启动子的位置数据、对应的靶基因和在待检测对象的每一个细胞中的读数以及每一个增强子的位置数据和在待检测对象的每一个细胞中的读数;

7、以读数矩阵作为输入,利用变分自编码器计算得到潜在变量矩阵,并基于所述潜在变量矩阵确定存在潜在互作的增强子-启动子对;所述读数矩阵包括每一个调控元件在待检测对象的每一个细胞中的读数;所述潜在变量矩阵包括每一个调控元件的嵌入表示;

8、基于基序数据库,对每一个增强子的位置数据和在待检测对象的每一个细胞中的读数进行基序扫描,确定待检测对象的每一个转录因子在增强子上的潜在结合位点;

9、基于待检测对象的每一个转录因子在增强子上的潜在结合位点、存在潜在互作的增强子-启动子对和每一个启动子对应的靶基因,生成转录因子-增强子-启动子-靶基因调控网络,并对所述转录因子-增强子-启动子-靶基因调控网络进行简化,得到转录因子-靶基因调控网络;

10、基于scrna-seq数据计算得到基因之间的互信息,并基于基因之间的互信息构建共表达基因网络;所述基因包括转录因子的编码基因和靶基因;

11、计算所述转录因子-靶基因调控网络和所述共表达基因网络的交集,并基于待检测对象的每一个转录因子在增强子上的潜在结合位点、存在潜在互作的增强子-启动子对和每一个启动子对应的靶基因来对所述交集进行扩展,得到转录因子-增强子-启动子-靶基因的基因调控网络。

12、第二方面,本申请提供了一种计算机设备,包括:存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序以实现上述的基因调控网络的构建方法。

13、第三方面,本申请提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述的基因调控网络的构建方法。

14、第四方面,本申请提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述的基因调控网络的构建方法。

15、根据本申请提供的具体实施例,本申请具有以下技术效果:

16、本申请提供了一种基因调控网络的构建方法及相关装置,从screen数据库中下载得到候选调控元件的位置数据,进一步结合基因组注释文件和scatac-seq数据,能够对启动子和增强子进行精确定位,解决未能精确定位启动子和增强子的问题。引入变分自编码器,能够准确确定存在潜在互作的增强子-启动子对,由于启动子已与靶基因相关联,故可以进一步将增强子与靶基因相关联,解决难以将增强子和靶基因关联的问题。基于待检测对象的每一个转录因子在增强子上的潜在结合位点、存在潜在互作的增强子-启动子对和每一个启动子对应的靶基因,生成转录因子-增强子-启动子-靶基因调控网络,进一步简化得到转录因子-靶基因调控网络,计算转录因子-靶基因调控网络和共表达基因网络的交集,进一步扩展得到转录因子-增强子-启动子-靶基因的基因调控网络,解决直接间接关系难以区分和假阳性调控关系过多的问题。本申请能够解决未能精确定位启动子和增强子、难以将增强子和靶基因关联、直接间接关系难以区分和假阳性调控关系过多等问题。

本文档来自技高网...

【技术保护点】

1.一种基因调控网络的构建方法,其特征在于,所述基因调控网络的构建方法包括:

2.根据权利要求1所述的基因调控网络的构建方法,其特征在于,基于候选调控元件的位置数据和所述基因组注释文件,对所述候选启动子进行注释,确定所述候选启动子对应的靶基因,具体包括:

3.根据权利要求1所述的基因调控网络的构建方法,其特征在于,以读数矩阵作为输入,利用变分自编码器计算得到潜在变量矩阵,具体包括:

4.根据权利要求1所述的基因调控网络的构建方法,其特征在于,基于所述潜在变量矩阵确定存在潜在互作的增强子-启动子对,具体包括:

5.根据权利要求1所述的基因调控网络的构建方法,其特征在于,基于基序数据库,对每一个增强子的位置数据和在待检测对象的每一个细胞中的读数进行基序扫描,确定待检测对象的每一个转录因子在增强子上的潜在结合位点,具体包括:

6.根据权利要求1所述的基因调控网络的构建方法,其特征在于,基于待检测对象的每一个转录因子在增强子上的潜在结合位点、存在潜在互作的增强子-启动子对和每一个启动子对应的靶基因,生成转录因子-增强子-启动子-靶基因调控网络,并对所述转录因子-增强子-启动子-靶基因调控网络进行简化,得到转录因子-靶基因调控网络,具体包括:

7.根据权利要求1所述的基因调控网络的构建方法,其特征在于,scRNA-seq数据包括每一个基因在待检测对象的每一个细胞中的表达量,则基于scRNA-seq数据计算得到基因之间的互信息,并基于基因之间的互信息构建共表达基因网络,具体包括:

8.一种计算机设备,包括:存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序以实现权利要求1-7中任一项所述的基因调控网络的构建方法。

9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1-7中任一项所述的基因调控网络的构建方法。

10.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1-7中任一项所述的基因调控网络的构建方法。

...

【技术特征摘要】

1.一种基因调控网络的构建方法,其特征在于,所述基因调控网络的构建方法包括:

2.根据权利要求1所述的基因调控网络的构建方法,其特征在于,基于候选调控元件的位置数据和所述基因组注释文件,对所述候选启动子进行注释,确定所述候选启动子对应的靶基因,具体包括:

3.根据权利要求1所述的基因调控网络的构建方法,其特征在于,以读数矩阵作为输入,利用变分自编码器计算得到潜在变量矩阵,具体包括:

4.根据权利要求1所述的基因调控网络的构建方法,其特征在于,基于所述潜在变量矩阵确定存在潜在互作的增强子-启动子对,具体包括:

5.根据权利要求1所述的基因调控网络的构建方法,其特征在于,基于基序数据库,对每一个增强子的位置数据和在待检测对象的每一个细胞中的读数进行基序扫描,确定待检测对象的每一个转录因子在增强子上的潜在结合位点,具体包括:

6.根据权利要求1所述的基因调控网络的构建方法,其特征在于,基于待检测对象的每一个转录因子在增强子上的潜在结合位点、存在潜在互作的增强子-启动子对...

【专利技术属性】
技术研发人员:龙春伸左永春李寒霜黎择标胡鹏伟杨斯奇
申请(专利权)人:内蒙古大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1