一种miRNA调控蛋白质相互作用网络的miRNA靶蛋白预测方法技术

技术编号:14884382 阅读:446 留言:0更新日期:2017-03-24 23:36
本发明专利技术公开了一种miRNA调控蛋白质相互作用网络的miRNA靶蛋白预测方法,包括如下步骤:首先构建三个子网络:基于HIPPIE的人类蛋白质‑蛋白质相互作用网络、基于mirTARbase的miRNA‑靶蛋白网络和基于靶蛋白重叠构造的miRNA‑miRNA网络;然后根据蛋白质的获得号和miRNA分子在miRbase数据库中的ID号,合并三个子网络,构建融合的miRNA‑靶蛋白关联关系网络;最后基于牵连犯罪原则,表征miRNA‑靶蛋白的关联特征,使用随机森林构建分类预测模型,预测潜在miRNA与靶蛋白相互作用关联关系。本发明专利技术方法能更好地研究miRNA调控靶蛋白的多对多关系,具有较好的应用价值。

【技术实现步骤摘要】

本专利技术属于生物信息学及分子生物学
更具体地,涉及一种miRNA调控蛋白质相互作用网络的miRNA靶蛋白预测方法
技术介绍
microRNA(miRNA)是一种长度仅为20~24nt的非编码单链小分子RNA,具有高度保守性,时序性和组织特异性。成熟的miRNA5′端有一个磷酸基团,3′端为羟基,由具有发夹状结构的约70~90nt的单链RNA前体经过Dicer酶加工后形成。成熟的miRNA形成RNA诱导的基因沉默复合体(RNA-inducedsilencingcomplex,RISC)作用于靶点mRNA,通过对靶mRNA剪切或抑制其翻译过程而调控基因的表达。miRNA功能的获得或缺失,与各种疾病的发生、发展都有着密切的关系。蛋白质功能既可以直接、也可以间接地受miRNA分子的调控。miRNA网络较于其它生物网络有以下几个优势:miRNA位于基因信号传导的上游,因而miRNA的表达变化更灵敏,且发生在蛋白质的表达变化之前。此外,miRNA可以较方便地在血液循环中检测到,因而适合于作为疾病诊断的灵敏指标,具有现实意义。因此,在miRNA调控蛋白质互作网络层面上识别miRNA和蛋白质之间关系,有助于我们更好地理解致病机理。miRNA与靶蛋白的关联性,可以采用以下实验方法,包括:基于交联免疫沉淀的高通量测序分析交联免疫沉淀(HITS-CLIP)技术、光活性增强的核糖核苷交联免疫沉淀(PAR-CLIP)技术和CLASH(crosslinkingligationandsequencingofhybrids)技术,这些方法能得出miRNA-mRNA结合位点及与已知miRNA相互作用的mRNA。生物信息学的预测方法是分析miRNA的靶标mRNA的热力学参数及进化保守性,达到预测miRNA靶标目的,如TargetScan、PicTar、PITA、miRanda、DIANA-microT-CDS等。这些方法各有各的优缺点。实验方法可以给出miRNA与靶mRNA的调控关系,但实验价格昂贵且只能得出单个分子与单个分子的相互作用。计算方法快速且便宜,可提供大量可能的相互作用,但假阳性高且缺乏miRNA在特定的细胞或组织中对靶mRNA动态调控关系。
技术实现思路
本专利技术要解决的技术问题是克服上述现有技术的缺陷和不足,为了更好地理解miRNA与靶蛋白的“多对多”关系,从生物网络的层面,通过构建miRNA-miRNA网络、miRNA-蛋白质网络和蛋白质-蛋白质互作网络三个网络,预测miRNA的靶蛋白。本专利技术的目的是提供一种miRNA调控蛋白质相互作用网络的miRNA靶蛋白预测方法。本专利技术上述目的通过以下技术方案实现:在miRNA-蛋白质互作关系的预测模型的构建当中,如何判定miRNA与蛋白质的关联关系是关键。本专利技术提出了预测miRNA与蛋白质潜在关联关系的方法,基于拓扑特征和牵连犯罪(guilt-by-association)构建人类蛋白质-蛋白质互作网络、miRNA-miRNA网络、miRNA-蛋白质网络这三个互作网络,结合随机森林算法,建立模型对特征属性进行分类判别,预测潜在的miRNA与蛋白质的关联关系。即本专利技术提出了一种miRNA调控蛋白质相互作用网络的miRNA靶蛋白预测方法,该方法的具体步骤如下:S1.分别构建以下三个子网络:基于HIPPIE的人类蛋白质-蛋白质相互作用网络(PPIN)、基于mirTARbase的miRNA-靶蛋白网络(miRNATarN)和基于靶蛋白重叠构造的miRNA-miRNA网络(miRNAIN);S2.构建融合的miRNA-靶蛋白关联关系网络:根据蛋白质的获得号和miRNA分子在miRbase数据库中的ID号,合并三个子网络,构建融合的miRNA-靶蛋白关联关系网络,包含163739条边和14265个节点;其中,153749条边表示蛋白质-蛋白质相互作用,4634条边表示miRNA-miRNA关系,5356条边表示miRNA-靶蛋白相互作用;在所有的节点中,14086个是蛋白质,179个是miRNA;S3.表征miRNA-靶蛋白的关联特征,预测潜在miRNA与靶蛋白相互作用关联关系(使用牵连犯罪原则来描述miRNA与蛋白质的关联情况)S31.基于牵连犯罪原则,计算miRNA与人类蛋白的网络拓扑特征采用公式(1)计算miRNA(r)的网络拓扑结构特征、采用公式(2)计算靶蛋白p的网络拓扑结构特征、通过公式(3)得到一个1960(193+1767)维的网络拓扑特征向量来描述miRNA和其靶蛋白的关联关系:S32.使用随机森林(RF)构建分类预测模型,预测潜在的miRNA与人类蛋白的相互作用关系。具体所述牵连犯罪原则如图3所示,牵连犯罪原则表明,若蛋白质的邻居蛋白质大部分都与某种miRNA相互作用,那么该蛋白质更倾向于与该miRNA相互作用。在图3的PPIN中,P2蛋白质的邻居P1和P3均与mir-3相互作用(黄色实线表示),那么根据牵连犯罪原则,P2蛋白质很可能与mir-3相互作用(蓝色虚线表示)。miRNAIN代表miRNA-miRNA网络,红色实线表示miRNA间的相互作用。miRNATarN代表miRNA-靶蛋白网络,黄色实线表示实验验证的miRNA与靶蛋白之间的相互作用。另外,优选地,步骤S1中所述基于HIPPIE的人类蛋白质-蛋白质相互作用网络(PPIN)的构建方法如下:从HIPPIE数据库下载整个人类蛋白质-蛋白质相互作用数据,去除自相互作用、重复相互作用以及相互作用得分为0的相互作用;根据蛋白质获得号,从UniprotKB/Swiss-Prot数据库获取蛋白质序列信息(序列信息即一级结构数据),计算氨基酸组成(20维)、二肽组成(400维)、自相关描述符和组成(1221维)、转变(21维)和分布(105维)等共1767维蛋白质一级结构描述符(一级结构描述符即一级结构特征);基于收集的信息,构建节点和边加权的人类蛋白质-蛋白质相互作用子网络;蛋白质网络中节点权重是蛋白质1767维蛋白质一级结构描述符,边权重是蛋白质相互作用信任得分;其中相互作用信任得分是蛋白质之间相互作用程度,数值介于0~1之间,数值越大,作用程度越高,数值越小,作用程度越小。优选地,步骤S1中所述基于mirTARbase的miRNA-靶蛋白网络(miRNATarN)的构建方法如下:从mirTARbase中搜集并整理miRNA-靶蛋白相互作用数据,根据miRNA的序列和结构信息,计算核酸序列的组成(4维)、二核苷酸序列组成(16维)、三核苷酸序列组成(64维)、基于K-mer分类的组成(90维)和伪二核苷酸组成(19维),得到193个miRNA序列结构描述符;基于收集的数据构建miRNA-靶蛋白互作网络;在miRNA-靶蛋白互作网络中,miRNA节点权重是193维miRNA序列的结构描述符,靶蛋白节点权重是1767维蛋白质一级结构描述符;如果miRNA和靶蛋白发生相互作用,则用一条边连接,且边的权重为1。优选地,步骤S1中所述基于靶蛋白重叠构造的miRNA-miRNA网络(miRNAIN)的构建方法如下:大量研究表明,miRNA之间有协同调控作用,如mir-375、mir-124、let-7b共同调控本文档来自技高网
...
一种miRNA调控蛋白质相互作用网络的miRNA靶蛋白预测方法

【技术保护点】
一种miRNA调控蛋白质相互作用网络的miRNA靶蛋白预测方法,其特征在于,包括如下步骤:S1.分别构建以下三个子网络:基于HIPPIE的人类蛋白质‑蛋白质相互作用网络、基于mirTARbase的miRNA‑靶蛋白网络和基于靶蛋白重叠构造的miRNA‑miRNA网络;S2.构建融合的miRNA‑靶蛋白关联关系网络:根据蛋白质的获得号和miRNA分子在miRbase数据库中的ID号,合并三个子网络,构建融合的miRNA‑靶蛋白关联关系网络,包含163739条边和14265个节点;其中,153749条边表示蛋白质‑蛋白质相互作用,4634条边表示miRNA‑miRNA关系,5356条边表示miRNA‑靶蛋白相互作用;在所有的节点中,14086个是蛋白质,179个是miRNA;S3.表征miRNA‑靶蛋白的关联特征,预测潜在miRNA与靶蛋白相互作用关联关系S31.基于牵连犯罪原则,计算miRNA与人类蛋白的网络拓扑特征采用公式(1)计算miRNA(r)的网络拓扑结构特征、采用公式(2)计算靶蛋白p的网络拓扑结构特征、通过公式(3)得到一个1960维的网络拓扑特征向量来描述miRNA和其靶蛋白的关联关系:RNTFr=1NΣj=1NRr(i)×Er,j×Rj(i),(i=1,2,......,193)---(1)]]>PNTFp=1NΣj=1NPp(i)×Ep,j×Pj(i),(i=1,2,......,1767)---(2)]]>RPNTFr,p=RNTFr⊕PNTFp---(3);]]>S32.使用随机森林构建分类预测模型,预测潜在的miRNA与人类蛋白的相互作用关系。...

【技术特征摘要】
1.一种miRNA调控蛋白质相互作用网络的miRNA靶蛋白预测方法,其特征在于,包括如下步骤:S1.分别构建以下三个子网络:基于HIPPIE的人类蛋白质-蛋白质相互作用网络、基于mirTARbase的miRNA-靶蛋白网络和基于靶蛋白重叠构造的miRNA-miRNA网络;S2.构建融合的miRNA-靶蛋白关联关系网络:根据蛋白质的获得号和miRNA分子在miRbase数据库中的ID号,合并三个子网络,构建融合的miRNA-靶蛋白关联关系网络,包含163739条边和14265个节点;其中,153749条边表示蛋白质-蛋白质相互作用,4634条边表示miRNA-miRNA关系,5356条边表示miRNA-靶蛋白相互作用;在所有的节点中,14086个是蛋白质,179个是miRNA;S3.表征miRNA-靶蛋白的关联特征,预测潜在miRNA与靶蛋白相互作用关联关系S31.基于牵连犯罪原则,计算miRNA与人类蛋白的网络拓扑特征采用公式(1)计算miRNA(r)的网络拓扑结构特征、采用公式(2)计算靶蛋白p的网络拓扑结构特征、通过公式(3)得到一个1960维的网络拓扑特征向量来描述miRNA和其靶蛋白的关联关系:RNTFr=1NΣj=1NRr(i)×Er,j×Rj(i),(i=1,2,......,193)---(1)]]>PNTFp=1NΣj=1NPp(i)×Ep,j×Pj(i),(i=1,2,......,1767)---(2)]]>RPNTFr,p=RNTFr⊕PNTFp---(3);]]>S32.使用随机森林构建分类预测模型,预测潜在的miRNA与人类蛋白的相互作用关系。2.根据权利要求1所述的方法,其特征在于,步骤S1中所述基于HIPPIE的人类蛋白质-蛋白质相互作用网络的构建方法如下:从HIPPIE数据库下载整个人类蛋白质-蛋白质相互作用数据,去除自相互作用、重复相互作用以及相互作用得分为0的相互作用;根据蛋白质获得号,从UniprotKB/Swiss-Prot数据库获取蛋白质序列信息,计算氨基酸组成、二肽组成、自相关描述符和组成、转变和分布共1767维蛋白质一级结构描述符;基于收集的信息,构建节点和边加权的人类蛋白质-蛋白质相互作用子网络;蛋白质网络中节点权重是蛋白质1767维蛋白质一级结构描述符,边权重是蛋白质相互作用信任得分;其中相互作用信任得分是蛋白质之间相互作用程度,数值介于0~1之间,数值越大,作用程度越高,数值越小,作用程度越小。3.根据权利要求1所述的方法,其特征在于,步骤S1中所述基于mirTARbase的miRNA-靶蛋白网络的构建方法如下:从mirTARbase中搜集并整...

【专利技术属性】
技术研发人员:邹小勇钟文倩李占潮戴宗
申请(专利权)人:广东顺德中山大学卡内基梅隆大学国际联合研究院中山大学广东药科大学
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1