本发明专利技术公开了一种用于预测癌症病人预后相关的蛋白质对的方法,属于癌症预后及治疗领域。本发明专利技术的步骤为:(1)从GEO数据库中下载与癌症对应的基因芯片数据,同时找出该数据的原始文件中的生存相关的数据;(2)预测与癌症病人预后相关的基因;(3)利用该基因从蛋白质互作对数据库中过滤出与癌症病人预后相关的蛋白质互作对。本发明专利技术方法的应用:利用预测与癌症预后相关的蛋白质互作对设计治疗该癌症的药物,该药物在蛋白质互作对中产生竞争性作用,从而破坏原有的蛋白质互作对。本发明专利技术的方法是一种更为精确的预测癌症的预后相关的蛋白质对的方法,且其更有助于从细胞内干扰蛋白质相互作用的角度设计癌症治疗的药物。
【技术实现步骤摘要】
本专利技术属于癌症预后及治疗领域,更具体地说,涉及一种用于预测癌症病人预后相关的蛋白质对的方法。
技术介绍
GEO数据库是存放大量基因芯片的一个公共数据库,这些芯片数据中,有不少研究涉及到癌症病人的基因表达和病人预后状况等方面内容。这些数据可以用于进一步分析癌症病人的生存时间与特定相关基因的关系,并进一步筛查预后相关基因。如GEO数据库中的一个乳腺癌数据集GDS2034[1],该数据集除了具有不同的疾病样本外,还具有样本病人的生存时间和最终的状态。在预测预后相关基因时,生存分析方法用于评估一个基因表达值与临床预后的关系。给定一个数据集,对每个基因,计算生存分析常涉及的2个p值:(1)基于单个基因的表达水平,利用K-means算法[2],将数据集的所有样本分成2类,利用生存分析方法估计(Kaplan-Meierestimator)[3]获得两个生存相关的函数(对应两条生存曲线),然后利用log-ranktest检验这两个函数间的差异性,获得差异性的p值,此为第一种p值求解方法;(2)而比例风险模型[4](Proportionalhazardmodel,又称COX模型,Coxmodel)被用于检验单个基因的表达水平与生存时间的关系,利用z检验(z-test)对回归结果进行分析,获得第二个p值求解的结果。参考文献:[1]WangY,KlijnJG,ZhangY,SieuwertsAM,LookMP,YangF,etal.Gene-expressionprofilestopredictdistantmetastasisoflymph-node-negativeprimarybreastcancer[J].Lancet.2005,365(9460):671-9.[2]KrishnaK,NarasimhaMurtyM.GeneticK-meansalgorithm[J].IEEEtransactionsonsystems,man,andcyberneticsPartB,Cybernetics:apublicationoftheIEEESystems,Man,andCyberneticsSociety.1999,29(3):433-9.[3]ShwartzM,PliskinJS,GrondahlHG,BoffaJ.UseoftheKaplan-Meierestimatetoreducebiasesinestimatingtherateofcariesprogression[J].Communitydentistryandoralepidemiology.1984,12(2):103-8.[4]VekicJ,ZeljkovicA,Bogavac-StanojevicN,Jelic-IvanovicZ,Spasojevic-KalimanovskaV,Simic-OgrizovicS,etal.Coxproportionalhazardmodelanalysisofsurvivalinend-stagerenaldiseasepatientswithsmall-sizedhigh-densitylipoproteinparticles[J].Clinicalbiochemistry.2011,44(8-9):635-41.现行的研究方法获得的预后相关基因往往只依靠上述两种求p值得方法(log-ranktest检验或是COX模型分析)之一,即在其中一种情况下,求当p<0.05的基因则被定义为预后相关基因。然而,(1)这种获得的预后相关基因准确性并不是很高,因为它受到很多因素的影响,如芯片数据自身的技术问题导致基因表达水平的假阳性率很高,样本数目的多少,生存时间数据长短的界定等;(2)以往预测癌症预后相关基因主要针对单个基因或是单个基因组成的集合,没有考虑蛋白质间的互作对,事实上,蛋白质互作对在细胞内常常发生相互作用,蛋白质互作对的相互作用可能是导致癌症病人预后的生存期长短的一个重要因素。如能将癌症预后引入蛋白质互作对的层面上,将会对癌症的治疗产生积极的作用,因此,急需一种可以准确预测与癌症预后相关的基因并且进一步应用的方法。
技术实现思路
1.专利技术要解决的技术问题本专利技术为了解决上述问题的不足之处,提出了一种用于预测癌症病人预后相关的蛋白质对的方法。本专利技术将log-ranktest检验与COX模型分析两种方法中的P值共同考虑,得到一种使预测获得基因与癌症的预后关系更为密切的方法,并且还利用了人类蛋白质互作对数据库(HPRD)进一步过滤出与预后相关的蛋白质互作对,从蛋白质互作对在细胞间的相互作用层面为癌症的治疗提供药物开发的新思路。2.技术方案本专利技术的一种用于预测癌症病人预后相关的蛋白质对的方法,在预测癌症病人预后相关的基因后,再利用人类蛋白质互作数据库(HPRD数据库)信息,定义预后相关蛋白质对为蛋白质对中的两个基因同时属于此预后相关基因。由此,进一步过滤出预后相关的蛋白质互作对。作为本专利技术的进一步改进,其步骤为:(1)从GEO数据库中下载与癌症对应的基因芯片数据,同时找出该数据的原始文件中的生存相关的数据;(2)预测与癌症病人预后相关的基因;(3)基于HPRD数据库,进一步过滤出与癌症病人预后相关的蛋白质互作对。作为本专利技术的进一步改进,步骤(2)中预测与癌症病人预后相关的基因的方法为,定义利用log-ranktest检验方法计算获得的P值为P1,P1是由卡方检验获得,模型拟合之后可以算出卡方统计量,服从卡方分布,P1值就是卡方分布大于这个卡方统计量的概率;定义利用COX模型分析方法计算获得的P值为P2,P2是由z检验获得,该检验可获得z值,而P2值就是标准正态大于这个z值的概率。当P′≤0.05时,认为该基因与癌症预后有关。对本专利技术的一种用于预测癌症病人预后相关的蛋白质对的方法的应用,利用预测的与癌症预后相关的蛋白质互作对设计治疗该癌症的药物,该药物与互作对的蛋白质产生竞争性的相互作用,从而破坏原有的蛋白质互作对或蛋白质复合物的形成。3.有益效果采用本专利技术提供的技术方案,与现有技术相比,具有如下显著效果:(1)本专利技术的一种用于预测癌症病人预后相关的蛋白质对的方法,将log-ranktest检验与COX模型分析两种方法中的P值综合考虑,提出一种新的获得癌症预后相关基因的方法,提高了癌症预后相关基因预测的准确率。(2)本专利技术的一种用于预测癌症病人预后相关的蛋白质对的方法,获得与癌症预后相关的基因后,进一步筛选出与预后相关的蛋白质互本文档来自技高网...
【技术保护点】
一种用于预测癌症病人预后相关的蛋白质对的方法,其特征在于:预测癌症病人预后相关的基因后,利用该基因从蛋白质互作对数据库中进一步过滤出与癌症病人预后相关的蛋白质互作对。
【技术特征摘要】
1.一种用于预测癌症病人预后相关的蛋白质对的方法,其特征在于:预测癌症病人预后
相关的基因后,利用该基因从蛋白质互作对数据库中进一步过滤出与癌症病人预后相关的蛋
白质互作对。
2.根据权利要求1所述的一种用于预测癌症病人预后相关的蛋白质对的方法,其特征在
于:其步骤为:
(1)从GEO数据库中下载与癌症对应的基因芯片数据,同时找出该数据的原始文件中
的生存相关的数据;
(2)预测与癌症病人预后相关的基因;
(3)利用该基因从蛋白质互作对数据库中过滤出与癌症病人预后相关的蛋白质互作对。
3.根据权利要求2所述的一种用...
【专利技术属性】
技术研发人员:张际峰,芮存芳,
申请(专利权)人:淮南师范学院,
类型:发明
国别省市:安徽;34
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。