一种挖掘油松年龄相关基因的方法技术

技术编号:37348136 阅读:12 留言:0更新日期:2023-04-22 21:44
本发明专利技术提供了一种挖掘油松年龄相关基因的方法,属于基因工程技术领域,包括:构建不同年龄的油松茎段的转录组数据集,获得原始数据;分析差异表达基因;利用差异表达基因确定皮尔逊相关系数的分界值,通过PCC的分界值构建多个基因表达网络;对基因表达网络中的TF表达量进行单调性测绘,以确定种子基因;将种子基因进行BFS算法运算,获得多个时序层级基因表达网络模型;根据获得的时序层级基因表达网络模型中出现的核心连接点基因,作为油松年龄相关基因。本发明专利技术成功挖掘出与年龄性状密切相关的基因DAL35,为分析油松老化分子机制奠定了基础,也为改善油松老化现象提供了遗传资源和技术支持。和技术支持。和技术支持。

【技术实现步骤摘要】
一种挖掘油松年龄相关基因的方法


[0001]本专利技术属于基因工程
,尤其涉及一种挖掘油松年龄相关基因的方法。

技术介绍

[0002]油松(Pinus tabuliformis Carr.)为松科(Pinaceae)松属(Pinus Linn)的针叶常绿乔木,为阳性树种,深根性,喜光、抗瘠薄、抗风,在土层深厚、排水良好的酸性、中性或钙质黄土上,

25℃的气温下均能生长。油松心材淡黄红褐色,边材淡黄白色,纹理直,结构较细密,材质较硬,耐久用,可供建筑、电杆、矿柱、造船、器具、家具及木纤维工业等用材。同时油松树姿苍劲古雅,枝叶繁茂,四季常青,寿命可在千年以上,在华北地区的园林、风景区极为常见,具有重要的观赏、生态、历史文化、经济和生命科学研究价值。但由于自然因素和人为因素的共同作用,使得油松有不同程度衰弱、衰老甚至死亡。建立古树名木档案是开展古树保护的前提和基础,古树的年龄是古树最主要的属性之一,挖掘油松年龄相关基因有助于分析油松老化分子机制。
[0003]目前,计算方法的飞速发展,使得以网络为中心的方法更适合于获取复杂的信息,例如基因基因表达网络、基因调控网络,蛋白质

蛋白质相互作用网络、信号转导网络和代谢网络等。其中,时序层级基因表达网络分析(TO

GCN)是一种全新的高效、全面的高维数据分析方法,已被用于植物转录组和医学组织转录组数据分析中。

技术实现思路

[0004]有鉴于此,本专利技术的目的在于提供一种挖掘油松年龄相关基因的方法,该方法成功构建出了多个油松的转录组数据库,并挖掘与年龄性状密切相关的关键候选基因,为分析油松老化分子机制奠定了基础,也为利用基因工程技术改善油松老化现象提供了遗传资源和技术支持。
[0005]为了实现上述专利技术目的,本专利技术提供了以下技术方案:
[0006]本专利技术提供了一种挖掘油松年龄相关基因的方法,包括以下步骤:
[0007](1)构建不同年龄的油松茎段的转录组数据集,获得原始数据;
[0008](2)分析差异表达的基因;
[0009](3)利用步骤(2)获得的差异表达基因确定皮尔逊相关系数的分界值,通过皮尔逊相关系数的分界值构建多个基因表达网络;
[0010](4)对基因表达网络中的转录因子表达量进行单调性测绘,以确定种子基因;
[0011](5)将步骤(4)得到的种子基因,进行BFS算法运算,获得多个时序层级基因表达网络模型;
[0012](6)根据步骤(5)获得的时序层级基因表达网络模型中出现的核心连接点基因,作为油松年龄相关基因。
[0013]优选的,所述皮尔逊相关系数的分界值的运算方法为计算每个转录因子基因对在每个测序结果下的所有PCC值,然后利用所有的PCC值生成概率密度函数和累积密度函数的
分布,根据累积密度函数,通过Cutoff程序可以确定在p<0.05下的正负分界值。
[0014]优选的,步骤(3)中所述基因表达网络个数为八个,分别为C1+C2+、C1+C20、C1+C2

、C10C2+、C1

C2+、C1

C2

、C1

C20和C10C2

,其中+、

、0分别表示基因表达模式与生物性状正、负和不相关,C1表示生物性状条件1,C2表示生物性状条件2。
[0015]优选的,所述单调性测绘的方式为使用R包MFSelector批量获得在第一个时间点高表达,在接下来的时间点低表达的单调下调基因作为种子基因。
[0016]优选的,步骤(2)中,所述差异表达的基因的获得方式包括将步骤(1)获得的原始数据过滤得到干净数据,然后进行基因表达定量,从获得的基因表达量中分析差异表达的基因。
[0017]优选的,还包括对得到的油松年龄相关基因进行qRT

PCR验证。
[0018]优选的,采用Kallisto软件进行基因表达定量;采用DESeq2软件分析差异表达的基因。
[0019]本专利技术还提供了一种油松年龄相关基因DAL35,所述DAL35的核苷酸序列如SEQ ID No.1所示。
[0020]本专利技术还提供了一种上述油松年龄相关基因DAL35在检测油松年龄中的应用。
[0021]本专利技术提供了一种计算机存储介质,存储介质存储有计算机程序,所述计算机程序在被处理器运行时执行如上述的掘油松年龄相关基因的方法的步骤。
[0022]相对于现有技术,本专利技术具有如下有益效果:
[0023]本专利技术提供了一种挖掘油松年龄相关基因的方法,本专利技术基于转录组测序和时序层级基因表达网络分析挖掘油松年龄相关基因,成功构建出了多个油松的转录组数据库,并挖掘与年龄性状密切相关的关键候选基因。本专利技术的方法得到的油松年龄相关基因准确可靠,为分析油松老化分子机制奠定了基础,也为利用基因工程技术改善油松老化现象提供了遗传资源和技术支持。
附图说明
[0024]图1是时序层级基因表达网络模型构建的流程图;
[0025]图2是时序分层后基因表达网络图;
[0026]图3是qRT

PCR验证hub基因DAL35表达量的结果图。
具体实施方式
[0027]本专利技术提供了本专利技术提供了一种挖掘油松年龄相关基因的方法,包括以下步骤:
[0028](1)构建不同年龄的油松茎段的转录组数据集,获得原始数据;
[0029](2)分析差异表达的基因;
[0030](3)利用步骤(2)获得的差异表达基因确定皮尔逊相关系数的分界值,通过皮尔逊相关系数的分界值构建多个基因表达网络;
[0031](4)对基因表达网络中的转录因子表达量进行单调性测绘,以确定种子基因;
[0032](5)将步骤(4)得到的种子基因,进行BFS算法运算,获得多个时序层级基因表达网络模型;
[0033](6)根据步骤(5)获得的时序层级基因表达网络模型中出现的核心连接点基因,作
为油松年龄相关基因。
[0034]在本专利技术中,构建不同年龄的油松茎段的转录组数据集,获得原始数据。所述茎段优选为同一高度的茎段,所述高度优选为离地间距为树高30%以上。本专利技术分别提取不同年龄的油松茎段的总RNA,分别测序,即得转录组数据集。本专利技术对提取油松茎段的总RNA的方法没有特殊限定,采用本领域公知的方法即可,例如Trizol法提取。
[0035]在本专利技术中,分析差异表达的基因。所述差异表达的基因的获得方式优选的包括将上述获得的原始数据过滤得到干净数据,然后进行基因表达定量,从获得的基因表达量中分析差异表达的基因。作为一优选的实施方式,采用Kallisto软件进行基因表达定量。作为一优选的实施方式,采用DESeq2软件分析差异表达的基因。本专利技术对原始数据进行过滤,以去除rRNA重复的、含接头的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种挖掘油松年龄相关基因的方法,其特征在于,包括以下步骤:(1)构建不同年龄的油松茎段的转录组数据集,获得原始数据;(2)分析差异表达的基因;(3)利用步骤(2)获得的差异表达基因确定皮尔逊相关系数的分界值,通过皮尔逊相关系数的分界值构建多个基因表达网络;(4)对基因表达网络中的转录因子表达量进行单调性测绘,以确定种子基因;(5)将步骤(4)得到的种子基因,进行BFS算法运算,获得多个时序层级基因表达网络模型;(6)根据步骤(5)获得的时序层级基因表达网络模型中出现的核心连接点基因,作为油松年龄相关基因。2.根据权利要求1所述的方法,其特征在于,所述皮尔逊相关系数的分界值的运算方法为计算每个转录因子基因对在每个测序结果下的所有PCC值,然后利用所有的PCC值生成概率密度函数和累积密度函数的分布,根据累积密度函数,通过Cutoff程序可以确定在p<0.05下的正负分界值。3.根据权利要求1所述的方法,其特征在于,步骤(3)中所述基因表达网络个数为八个,分别为C1+C2+、C1+C20、C1+C2

、C10C2+、C1

C2+、C1

C2

、C1

C20和C10...

【专利技术属性】
技术研发人员:林金星洪岩铭张莹莹沈诗雅张曦钮世辉沈应柏崔亚宁
申请(专利权)人:北京林业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1