基于蛋白质相互作用网络和蛋白质组学的蛋白质鉴定方法技术

技术编号：10659655 阅读：313 留言：0更新日期：2014-11-19 19:25

本发明专利技术公开了一种基于蛋白质相互作用网络和蛋白质组学的蛋白质鉴定方法。该方法基于相互作用蛋白质间的存在概率亦相互影响的现象，在鸟枪法蛋白质组学数据上融合蛋白质相互作用网络信息，定义了新的蛋白质鉴定图模型，利用图模型中蛋白质的存在概率及其所获得的邻居蛋白质结点的支持度来调整肽映射到蛋白质的概率，从而调整蛋白质的存在概率。该方法能识别大部分的蛋白质，与其它鉴定方法比较，具有较的高的精确度。为生物学家通过蛋白质组学数据推断和鉴定蛋白质的实验以及进一步研究提供有价值的参考信息。

全部详细技术资料下载

【技术实现步骤摘要】
基于蛋白质相互作用网络和蛋白质组学的蛋白质鉴定方法
本专利技术属于系统生物学领域，尤其涉及一种基于蛋白质相互作用网络和蛋白质组学的蛋白质鉴定方法。
技术介绍
人类基因组测序的完成标志着后基因组时代的来临，而蛋白质组学是后基因组时代中最重要的领域之一。蛋白质组学的目的是通过系统地、定量地研究蛋白质在细胞组织中的表达情况，来揭示基因的功能、蛋白质之间的关系以及生命过程的运行机制。其主要任务包括：蛋白质序列鉴定、蛋白质修饰鉴定、蛋白质定量分析、蛋白质结构预测和蛋白质功能预测等问题，而确定出某种细胞器官或组织在一定条件下表达出了哪些蛋白质是其最基本任务之一。目前，蛋白质鉴定主要是采用鸟枪法蛋白质组学研究方法，其步骤是先将标识生物样本中的蛋白质混合物经过简单或不经过分离就被酶解为肽段混合物，肽段混合物经色谱分离和离子化后，经串联质谱仪产生质谱数据用于肽段鉴定，最后再从鉴定的肽段推导可能的蛋白质。该方法可在短时间内获得大量质谱数据并鉴定出蛋白质。目前，用于鸟枪法蛋白质组学中鉴定蛋白质的方法包括基于图模型、基于统计模型、基于优化模型、基于节俭模型、基于多信息集成的分析方法。基于统计模型鉴定方法主要包括ProteinProphet、PANORAMICS、MSBayesPro、Fido、Qscore等方法。其主要思想是用肽鉴定软件得出的肽得分和相关信息，通过统计方法估算出给定蛋白质存在的概率。基于统计模型方法可以分为非参数统计模型和参数统计模型。非参数统计模式未考虑肽样本的概率分布，较参数统计模型而言，非参数统计模型具有更高的鲁棒性。ProteinProphet是应用最广泛...
基于蛋白质相互作用网络和蛋白质组学的蛋白质鉴定方法

【技术保护点】
一种基于蛋白质相互作用网络和蛋白质组学的蛋白质鉴定方法，其特征在于，包括以下步骤：步骤一：通过质谱识别软件比较理论质谱图和实验质谱图，得到肽的存在概率Probpep_i，过滤概率小于0.05的肽；步骤二：根据过滤后的肽建立肽映射蛋白质的二分图Gv(Ni,Mj,E)，其中Ni为肽结点集合，Mj为蛋白质结点集合，E为表示肽和蛋白质映射关系的边的集合；输入一组蛋白质相互作用数据，过滤掉其中的重复相互作用和自相互作用数据，在二分图上蛋白质侧建立蛋白质相互作用无向图Gu(Nu,E’)，其中Nu为蛋白质结点集合，Nu结点集合与二分图中Mj结点集合相同，E’为表示蛋白质相互作用信息的边的集合；步骤三：计算Gv中蛋白质的存在概率Probpro_j：Probpro_j=[1-Πi∈Gv;(i,j)∈E(1-Probi_j)]-log(Deg(pro_j)Theory(pro_j))]]>其中，Probpro_j表示蛋白质j的存在概率，Probi_j表示肽i映射到蛋白质j的概率，根据公式计算得到，其中Probpep_i表示肽i的存在概率，Deg(pep_i)表示二分图...

【技术特征摘要】
1.一种基于蛋白质相互作用网络和蛋白质组学的蛋白质鉴定方法，其特征在于，包括以下步骤：步骤一：通过质谱识别软件比较理论质谱图和实验质谱图，得到肽的存在概率Probpep_i，过滤概率小于0.05的肽；步骤二：根据过滤后的肽建立肽映射蛋白质的二分图Gv(Ni,Mj,E)，其中Ni为肽结点集合，Mj为蛋白质结点集合，E为表示肽和蛋白质映射关系的边的集合；输入一组蛋白质相互作用数据，过滤掉其中的重复相互作用和自相互作用数据，在二分图上蛋白质侧建立蛋白质相互作用无向图Gu(Nu,E′)，其中Nu为蛋白质结点集合，Nu结点集合与二分图中Mj结点集合相同，E′为表示蛋白质相互作用信息的边的集合；步骤三：计算Gv中蛋白质的存在概率Probpro_j：其中，Probpro_j表示蛋白质j的存在概率，Probi_j表示肽i映射到蛋白质j的概率，根据公式计算得到，其中Probpep_i表示肽i的存在概率，Deg(pep_i)表示二分图Gv中i结点的度；Deg(pro_j)表示蛋白质j所包含的实际肽的匹配数，即为二分图Gv中j结点的度；Theory(pro_j)表示按某种酶切方式，蛋白质j所包含的理论肽的匹配数；所述度是指和该结点相关联的边的条数；步骤四：计算蛋白质j所获得的邻居蛋白质结点的支持度Supportpro_j：其中Probpro_k表示在Gu上蛋白质j的邻居蛋白质结点k的存在概率，Weight(k,j)表示蛋白质k与蛋白质j的相互作用权值；如果步...

【专利技术属性】
技术研发人员：王建新，钟坚成，李敏，
申请(专利权)人：中南大学，
类型：发明
国别省市：湖南;43

全部详细技术资料下载我是这个专利的主人