System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种桂花多组学数据库及其构建方法技术_技高网

一种桂花多组学数据库及其构建方法技术

技术编号:41952992 阅读:9 留言:0更新日期:2024-07-10 16:39
本发明专利技术涉及一种桂花多组学数据库构建方法,包括以下步骤:(1)收集整合桂花多组学数据;(2)对桂花多组学数据进行整合,构建桂花基因组、转录组、遗传变异、表型和表观基因组数据集和分析平台;(3)搜集鉴定桂花群体形态特征,提供桂花种质资源存储和鉴定分析平台;(4)基于转录组数据进行多层次的基因调控网络构建。本发明专利技术涉及一种桂花多组学数据库。本发明专利技术能够整合大量包括基因组、转录组学、变异组和表观组等多组学数据,以模式物种的同源基因作为媒介,利用全基因组关联分析策略对不同数据进行了关联与整合,通过交互式分析快速挖掘到关键功能变异和基因。

【技术实现步骤摘要】

本专利技术涉及一种数据库及其构建和分析方法,具体涉及一种桂花多组学数据库及其构建方法


技术介绍

1、桂花是一种著名的观赏芳香植物,因其独特的花香和生物活性化合物而被广泛用作食品配料或中药。多组学方法,如全基因组重测序、转录组学,表观基因组,蛋白质组学和代谢组学,已被用于研究桂花的进化和基因功能。这些数据极大地促进了桂花功能基因的全基因组研究,并增强了本专利技术对桂花进化的理解。

2、然而,随着可获得的多组学数据量的增加,由于缺乏集中的数据存储和分析平台,限制了桂花种质资源的利用和遗传改良。


技术实现思路

1、本专利技术的目的之一是提供一种桂花多组学数据库构建方法,其能够整合大量包括基因组、转录组学、变异组和表观组等多组学数据,以模式物种的同源基因作为媒介,利用全基因组关联分析策略对不同数据进行了关联与整合,通过交互式分析快速挖掘到关键功能变异和基因。本专利技术的目的之二是提供一种桂花多组学数据库,其构建桂花多层次的变异和功能基因调控网络以及种质资源鉴定和分析平台。

2、为实现上述目的,本专利技术提供如下技术方案:

3、一种桂花多组学数据库构建方法,包括以下步骤:

4、(1)收集整合桂花多组学数据;

5、(2)对桂花多组学数据进行整合,构建桂花基因组、转录组、遗传变异、表型和表观基因组数据集和分析平台;

6、(3)搜集鉴定桂花群体形态特征,提供桂花种质资源存储和鉴定分析平台;

7、(4)基于转录组数据进行多层次的基因调控网络构建;

8、(5)利用关联分析策略对表型相关的遗传变异进行关联与整合,挖掘功能变异和基因;

9、(6)基于所述桂花多组学数据集,整合多种分析工具,包括go和kegg富集分析、blast、多序列比对(msa)、序列提取、变异注释、引物设计和电子pcr,构建桂花多组学数据挖掘和联合分析工具。

10、具体地,在所述步骤(1)中,包括以下步骤:

11、(1.1)从ncbi公共数据库中获取不同桂花品种基因组数据信息;

12、(1.2)从ncbi公共数据库中获取不同桂花品种、不同组织器官、不同开花阶段、不同处理条件的转录组学数据信息;

13、(1.3)从ncbi公共数据库中获取桂花不同开花阶段表观组学信息。

14、具体地,在完成步骤(6)后,包括以下步骤:

15、(7)将上述数据库间的信息进行整合,去除数据库中错误和冗余的信息;

16、(8)分析获得基因组与模式物种基因组对应的同源基因;

17、(9)分析获得上述转录组数据中每个基因的测序读段数目;

18、(10)分别对特定数据集计算差异表达基因;

19、(11)以模式物种同源基因为桥梁,对差异表达基因进行比较分析,获得关键候选基因。

20、具体地,在所述步骤(8)中,桂花基因组与模式物种基因组对应的同源基因为蛋白编码基因,通过蛋白编码序列与模式物种基因组蛋白编码序列进行大规模同源序列比对获得。

21、具体地,转录组学数据和表观组学数据来源于公共数据平台的数据库,选自geneexpression omnibus数据库、national center for biotechnology information数据库和national genomics data center数据库。

22、一种桂花多组学数据库,包括:

23、数据存储模块,用于存放桂花不同组织器官、不同发育时期及不同处理条件下的转录组学数据中每个基因的测序读段数据、表观组学中每个基因修饰程度数据、以及模式物种参考基因组对应的同源基因数据;

24、用户选择模块,用于用户指定待比较分析基因集;

25、数据处理模块,用于计算用户指定基因集间的差异表达基因,并对基因对应的模式物种同源基因进行注释;用于用户指定的物种间差异表达基因的比较分析,以及用户指定上调或下调基因间的比较分析;对用户选定基因集进行后续基因本体论或代谢通路分析;

26、结果输出模块:以列表形式、韦恩图、热图和柱形图形式输出上述数据矩阵的匹配结果。

27、与现有技术相比,本专利技术的有益效果:

28、本专利技术公开了一种桂花多组学数据库构建方法,该方法通过整合桂花基因组、转录组、变异组、表观组和群体种质资源等多组学数据,借助同一分析流程生成后台数据进行标准化管理,利用关联分析策略对不同组学数据进行关联与整合,通过用户个性化交互式分析可快速挖掘到桂花表型相关的功能变异和基因。借助本专利技术提供的多组学数据搜索和分析工具为桂花表型变异挖掘和分子调控机制解析提供重要平台。

29、本专利技术公开了一种基于多组学数据整合的桂花全基因组生物学调控网络的方法,该方法通过整合桂花表型资源、基因组、重测序、转录组、表观基因组数据,完成了桂花多层次生物学调控网络的构建,从而构建出目前数据水平上最为完整的高质量的桂花多组学尺度的生物调控网络分析,为桂花多层次生物调控网络的构建提供一种新的思路,构建的桂花多组学数据库实现了多层次调控网络的可视化。

本文档来自技高网...

【技术保护点】

1.一种桂花多组学数据库构建方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的桂花多组学数据库构建方法,其特征在于,在所述步骤(1)中,包括以下步骤:

3.根据权利要求1所述的桂花多组学数据库构建方法,其特征在于,在完成步骤(6)后,包括以下步骤:

4.根据权利要求3所述的桂花多组学数据库构建方法,其特征在于,在所述步骤(8)中,桂花基因组与模式物种基因组对应的同源基因为蛋白编码基因,通过蛋白编码序列与模式物种基因组蛋白编码序列进行大规模同源序列比对获得。

5.根据权利要求2所述的桂花多组学数据库构建方法,其特征在于,转录组学数据和表观组学数据来源于公共数据平台的数据库,选自Gene Expression Omnibus数据库、National Center for Biotechnology Information数据库和National Genomics DataCenter数据库。

6.一种桂花多组学数据库,其特征在于,包括:

【技术特征摘要】

1.一种桂花多组学数据库构建方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的桂花多组学数据库构建方法,其特征在于,在所述步骤(1)中,包括以下步骤:

3.根据权利要求1所述的桂花多组学数据库构建方法,其特征在于,在完成步骤(6)后,包括以下步骤:

4.根据权利要求3所述的桂花多组学数据库构建方法,其特征在于,在所述步骤(8)中,桂花基因组与模式物种基因组对应的同源基因为蛋白编码基因,通过蛋白编码序列与模式物...

【专利技术属性】
技术研发人员:邹晶晶陈洪国曾祥玲杨洁蔡璇曾进张倩李泽卿
申请(专利权)人:湖北科技学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1