The present invention provides a system and associated factor identification method based on function modules, the method comprises the following steps: 1) in human co regulation network identification includes function modules of transcription factors, miRNA and target gene; 2) gene expression differences of P obtained value value, according to the module combination in identifying differentially expressed genes the disease association function module; 3) non difference disease association in functional module, and the expression of transcription factor miRNA gene as the target candidate disease associated factor; 4) correlation disease association factor and disease candidate values, and according to the correlation value of candidate disease associated factors. The method of identifying disease associated factors with interaction between variety, even without knowing the transcription factor miRNA and gene function, by applying the method of the invention can identify disease related factors, and the prediction of disease associated factor accuracy rate is very high.
【技术实现步骤摘要】
一种基于功能模块的疾病关联因子识别方法及系统
本专利技术属于生物信息学领域,涉及一种基于功能模块的疾病关联因子识别方法及系统。
技术介绍
疾病相关miRNA、转录因子和基因的识别对于从分子水平上研究和揭示复杂疾病发病机制具有显著的意义。测序技术极大的促进了人们对miRNA、转录因子和基因的功能的研究,基因信息和基因表达谱阵列也越来越多的被用来辅助分析复杂疾病。科学界广泛认为病人的关键因子的综合分子特征,比如基因表达,是研究复杂疾病治疗的关键。细胞面对环境压力时,主要通过改变基因表达产生需要的蛋白质,因此面对环境压力产生正确的蛋白质至关重要。而异常表达的miRNA和基因则可能导致疾病的发生。比如一些miRNA表现出致病的特性,异常表达就会促进疾病的发生。还有一些miRNA具有抑制疾病的作用,降低致病基因的生成,异常表达时将会使致病基因快速增长,最终导致疾病的产生。当前研究人员提出许多生物信息学方法通过分析公共和私有基因组数据来寻找疾病相关的miRNA、转录因子和基因。这些生物信息学技术最早关注疾病样本和控制样本中候选基因的重新排序,在多基因中辅助识别致病基因。除了位置上的致病基因排序,也提出了从多种基因列表中识别可能的候选基因的方法,如从微阵列或者蛋白质组实验中获得差异表达基因。为候选基因进行排序时需要输入一列需要进行排序的候选基因和排列标准,如包括在特定疾病或者细胞过程中。这些排列标准主要以生物关键词的形式出现或者是一系列与疾病或者生物过程关联的种子基因(即训练基因)。基因排序的方法是基于因有关联而被认为有罪(guiltbyassociation)的思想。 ...
【技术保护点】
一种基于功能模块的疾病关联因子识别方法,其特征在于,包括以下步骤:步骤一:构建人类共调控网络,利用功能模块识别方法从人类共调控网络中识别miRNA、转录因子和基因的功能模块,并计算每个功能模块的疾病关联值;步骤二:依据每个功能模块的疾病关联值,筛选出疾病关联模块;步骤三:将每个疾病关联模块中的非差异表达的miRNA、转录因子和基因作为候选疾病关联因子;步骤四:根据候选疾病关联因子在各个功能模块内与差异表达基因的距离分布,计算候选疾病关联因子与疾病的关联值,并根据候选疾病关联因子与疾病的关联值大小对候选疾病关联因子从大到小排序,识别出疾病关键因子。
【技术特征摘要】
1.一种基于功能模块的疾病关联因子识别方法,其特征在于,包括以下步骤:步骤一:构建人类共调控网络,利用功能模块识别方法从人类共调控网络中识别miRNA、转录因子和基因的功能模块,并计算每个功能模块的疾病关联值;步骤二:依据每个功能模块的疾病关联值,筛选出疾病关联模块;步骤三:将每个疾病关联模块中的非差异表达的miRNA、转录因子和基因作为候选疾病关联因子;步骤四:根据候选疾病关联因子在各个功能模块内与差异表达基因的距离分布,计算候选疾病关联因子与疾病的关联值,并根据候选疾病关联因子与疾病的关联值大小对候选疾病关联因子从大到小排序,识别出疾病关键因子。2.根据权利要求1所述的方法,其特征在于,所述功能模块的疾病关联值Rj按照以下公式计算获得:其中,n为功能模块Mj内部节点个数,表示功能模块Mj内部节点中的第i个目标基因Mji的z-score值,通过对目标基因Mji的差异表达基因的p-value值进行逆正态累积分布转换获得;k为功能模块Mj内部节点中的目标基因个数;目标基因的差异表达基因的p-value值是根据疾病样本和正常样本的基因表达谱获得。3.根据权利要求2所述的方法,其特征在于,所述依据每个功能模块的疾病关联值,筛选出疾病关联模块是指首先对功能模块的疾病关联值进行归一化处理,然后对归一化处理后的结果进行逆正太累积分布转换成p-value值,若p-value值小于0.05,则对应的功能模块为疾病关联模块;归一化处理公式为:其中,μj为功能模块Mj对应的10000个随机模块rmij的疾病关联值的平均值,σj为10000个随机模块rmij的疾病关联值的标准方差;功能模块Mj对应的随机模块rmij的内部节点从共调控网络中随机选择,0≤i<10000,且规模与模块Mj规模一致...
【专利技术属性】
技术研发人员:骆嘉伟,宋丹,蔡洁,王伟胜,刘智明,
申请(专利权)人:湖南大学,
类型:发明
国别省市:湖南,43
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。