一种基于多基因表达特征谱的宫颈癌个性化预后评估方法技术

技术编号:19091744 阅读:80 留言:0更新日期:2018-10-03 00:03
本发明专利技术公开了一种基于多基因表达特征谱的宫颈癌个性化预后评估方法,包括以下步骤:获取宫颈癌预后风险基因列表与基因权重;利用宫颈癌患者肿瘤组织转录组和生存数据构建预后评估模型;根据宫颈癌患者肿瘤组织的基因表达谱计算患者的风险得分;根据患者的风险得分计算患者每年的生存概率。本发明专利技术的方法得出的宫颈癌患者每年的生存概率与实际每年存活比率高度一致(线性相关R2=0.988,P值=5.04E‑38)。证实了该方法具有很高的预测准确性,与实际生存状态高度吻合。同时,对于每个肿瘤患者,本发明专利技术可以给出该患者特有的生存概率曲线。

A personalized prognostic assessment method for cervical cancer based on multi gene expression profile

The invention discloses a personalized prognostic evaluation method for cervical cancer based on multi-gene expression profiles, which comprises the following steps: obtaining the prognostic risk gene list and gene weight of cervical cancer; constructing a prognostic evaluation model using the transcription group and survival data of cervical cancer patients; and constructing a prognostic evaluation model based on the tumor tissue base of cervical cancer patients. Patients'risk scores were calculated by expression profiles and their annual survival probability was calculated by their risk scores. The annual survival probability of cervical cancer patients obtained by the method of the invention is highly consistent with the actual annual survival rate (linear correlation R2 = 0.988, P value = 5.04E_38). It is proved that the method has high prediction accuracy and is highly consistent with the actual survival state. At the same time, for each tumor patient, the present invention can give the patient's unique survival probability curve.

【技术实现步骤摘要】
一种基于多基因表达特征谱的宫颈癌个性化预后评估方法
本专利技术属于生物技术和医学领域,具体地说,涉及一种基于多基因表达特征谱的宫颈癌个性化预后评估方法。
技术介绍
宫颈癌是中国及全球女性高发的恶性肿瘤。全球范围内发展中国家宫颈癌的发病率和死亡率高于发达国家,宫颈癌在发展中国家的发病率仅次于乳腺癌。全球疾病负担(GlobalBurdenofDisease,GBD)数据显示,2016年全球患有宫颈癌的人数达到194万,其中中国患病人数为35万。2016年全球宫颈癌患者的死亡人数为25万,占总死亡人数的0.45%。中国2016年死亡患者数为3.8万,占总死亡人数的0.40%。统计结果显示,从1990年到2016年全球宫颈癌患病率相对稳定,死亡率持续增长。中国宫颈癌患病率和死亡率近几年迅速增加,2016年中国宫颈癌患病率达到全球平均水平。目前国际上通用的的肿瘤分期方法是TNM分期系统,该系统是美国癌症联合委员会(AmericanJointCommitteeonCancer,AJCC)提出的一种恶性肿瘤分类方法。美国国家癌症研究所(NationalCancerInstitute,NCI)对TNM分期的描述为:T指主要肿瘤的大小和范围,主要肿瘤通常被称为原发性肿瘤。N指患有癌症的附近淋巴结的数目。M指癌症是否已经转移,即从原发性肿瘤扩散到身体的其他部位。根据以上指标可将恶性肿瘤大致分为I期,II期,III期和IV期,其中分期越高表示肿瘤的恶性程度越高。TNM分期系统对肿瘤患者的治疗和预后评估有一定帮助。但是,由于不同个体中肿瘤的发生机制及体内微环境的不同,导致不同患者的生存时间差异巨大,TNM分期系统不能很好地反映出患者的预后状况。研究发现,对于某些诊断为I期的患者可能只有较短的生存期(1-2年),然而对于一些诊断为IV期的患者可能具有较长的生存期(5年及以上)。因此,TNM分期系统可能更倾向于描述一个癌症患者群体的平均水平,对个性化的诊断和治疗适用性较差。另一方面,对于诊断为晚期(III期、IV期)的患者,会给患者及医务人员造成一定的治疗方案选择困难,导致很多本来可以长时间生存的肿瘤患者由于过度医疗或医疗失当而提前死亡;而另一些本应进行适当治疗可以延长生存的患者由于放弃治疗或治疗不当同样导致肿瘤患者提前死亡。目前,有报道提出利用基因表达谱可以对肿瘤患者进行预后评估。但是,绝大多数报道只是使用单个或数个基因,只能对一个群体进行分类,对个体生存期只能进行定性的划分(如预后好、预后差两个指标)。因此,需要建立更精细的个性化肿瘤预后评估模型来评估患者的生存时间从而选择合适的治疗方案。
技术实现思路
有鉴于此,本专利技术提供了一种基于多基因表达特征谱的宫颈癌个性化预后评估方法,能够准确预测患者每年的存活概率。为了解决上述技术问题,本专利技术公开了一种基于多基因表达特征谱的宫颈癌个性化预后评估方法,包括以下步骤:步骤1、获取宫颈癌预后风险基因列表与基因权重;步骤2、利用宫颈癌患者肿瘤组织转录组和生存数据构建预后评估模型;步骤3、根据宫颈癌患者肿瘤组织的基因表达谱计算患者的风险得分;步骤4、根据患者的风险得分计算患者每年的生存概率。可选地,所述步骤1中的获取宫颈癌预后风险基因列表与基因权重具体按照以下步骤实施:步骤1.1、从GenomicDataCommonsDataPortal数据库中下载宫颈癌患者肿瘤组织和癌旁组织转录组数据以及临床数据,获得宫颈癌患者肿瘤组织基因表达谱FPKM数值,进行对数转换;步骤1.2、设总样本数为m,将所有样本根据其基因表达值的三分位数分为三组,其中,基因表达值是指步骤1.1中获得的FPKM数值,用V表示,对第i个基因记为Vi,利用Cox比例风险模型计算第三分组相比第一分组的生存风险,得出第i个基因的风险比HRi和P值,即得出每一个基因的风险比;定义P值<0.05具有显著性,筛选具有显著性的生存风险基因,记为n1;此外,计算每个基因与患者生存天数的相关性,得出每个基因的相关系数r和P值;定义P值<0.05具有显著性,筛选具有显著性的生存相关基因,记为n2;将生存风险基因和生存相关基因的交集定义为预后风险基因,记为n,则有:n=n1∩n2(1)步骤1.3、根据第i个基因的风险比计算第i个基因的权重Wi,计算公式为:这样就得到每一个基因的权重,最终得到的宫颈癌预后风险基因列表与基因权重。可选地,所述的宫颈癌预后风险基因列表与基因权重如下表所示:可选地,所述步骤2中的利用宫颈癌患者肿瘤组织转录组和生存数据构建预后评估模型具体按照以下步骤实施:步骤2.1、定义基因表达值为V,定义基因表达值为V,根据第i个基因在第j个样本中的表达值和权重计算第i个患者的风险得分Sj;计算公式为:步骤2.2、将所有宫颈癌患者样本按照风险得分从低到高排序,使用滑动窗口模型对每50个样本计算平均风险得分计算公式为:其中,j表示样本编号,m表示样本总数,Vij表示第i个基因在第j个样本中的表达值;j+49表示从样本j开始计数的后50个样本;步骤2.3、使用Weibull分布对50个样本的生存数据进行曲线拟合,Weibull分布的概率密度函数为:其中k>0是形状参数,λ>0是分布的比例参数;步骤2.4、对每50个样本计算出所对应的kj和λj;根据经验,kj为一个相对固定的数值,均值为:其中,kj为第j个样本到第j+49个样本生存曲线Weibull分布的形状参数;比例参数λj的变化范围较大,定义λj与的函数关系为:其中,λj表示第j个样本到第j+49个样本生存曲线Weibull分布的比例参数;e为自然对数的底,α、β为函数的参数,对上式取对数得:其中logλj与为线性关系,通过线性拟合求解;根据平均风险得分与Weibull分布参数λj的拟合曲线,得出的函数关系为:将代入该函数得出预测的λj′,λj′为用该函数计算出的预期分布参数,计算λj与λj′的相关性得相关系数R2=0.981,P值=5.56E-44。可选地,所述步骤3中的根据宫颈癌患者肿瘤组织的基因表达谱计算患者的风险得分具体按照以下步骤实施:获取宫颈癌患者肿瘤组织的第i个基因表达谱的FPKM数值,记为:Vi;第i个基因对应的权重记为:Wi;患者风险得分记为:S;计算公式为:其中i为基因编号,n为表1中列出的基因个数。可选地,所述步骤4中的根据患者的风险得分计算患者每年的生存概率按照以下步骤实施:将患者的风险得分S带入Weibull分布的累积分布函数得出该患者的存活概率函数为:其中t为时间,α、β、S、均为固定参数。与现有技术相比,本专利技术可以获得包括以下技术效果:1)连续:本专利技术能预测肿瘤患者连续时间的生存概率。例如可以给出患者每个月的生存概率、患者每年的生存概率等。而目前临床采用的分型方法只能给出一个定性的判断。2)更精确:本专利技术基于多基因表达特征谱的宫颈癌个性化预后评估方法相比传统TNM分期能够更精确地反映患者的生存状态。3)个性化。对于每个肿瘤患者,本专利技术可以给出该患者特有的生存概率曲线,这是一般肿瘤预后评估模型所不具备的。当然,实施本专利技术的任一产品并不一定需要同时达到以上所述的所有技术效果。附图说明此处所说明的附图用来提供对本专利技术的进一步理解,构本文档来自技高网
...

【技术保护点】
1.一种基于多基因表达特征谱的宫颈癌个性化预后评估方法,其特征在于,包括以下步骤:步骤1、获取宫颈癌预后风险基因列表与基因权重;步骤2、利用宫颈癌患者肿瘤组织转录组和生存数据构建预后评估模型;步骤3、根据宫颈癌患者肿瘤组织的基因表达谱计算患者的风险得分;步骤4、根据患者的风险得分计算患者每年的生存概率。

【技术特征摘要】
1.一种基于多基因表达特征谱的宫颈癌个性化预后评估方法,其特征在于,包括以下步骤:步骤1、获取宫颈癌预后风险基因列表与基因权重;步骤2、利用宫颈癌患者肿瘤组织转录组和生存数据构建预后评估模型;步骤3、根据宫颈癌患者肿瘤组织的基因表达谱计算患者的风险得分;步骤4、根据患者的风险得分计算患者每年的生存概率。2.根据权利要求1所述的预后评估方法,其特征在于,所述步骤1中的获取宫颈癌预后风险基因列表与基因权重具体按照以下步骤实施:步骤1.1、从GenomicDataCommonsDataPortal数据库中下载宫颈癌患者肿瘤组织和癌旁组织转录组数据以及临床数据,获得宫颈癌患者肿瘤组织基因表达谱FPKM数值,进行对数转换;步骤1.2、设总样本数为m,将所有样本根据其基因表达值的三分位数分为三组,其中,基因表达值是指步骤1.1中获得的FPKM数值,用V表示,对第i个基因记为Vi,利用Cox比例风险模型计算第三分组相比第一分组的生存风险,得出第i个基因的风险比HRi和P值,即得出每一个基因的风险比;定义P值<0.05具有显著性,筛选具有显著性的生存风险基因,记为n1;此外,计算每个基因与患者生存天数的相关性,得出每个基因的相关系数r和P值;定义P值<0.05具有显著性,筛选具有显著性的生存相关基因,记为n2;将生存风险基因和生存相关基因的交集定义为预后风险基因,记为n,则有:n-n1∩n2(1)步骤1.3、根据第i个基因的风险比计算第i个基因的权重Wi,计算公式为:这样就得到每一个基因的权重,最终得到的宫颈癌预后风险基因列表与基因权重。3.根据权利要求1所述的预后评估方法,其特征在于,所述的宫颈癌预后风险基因列表与基因权重如下表所示:4.根据权利要求1所述的预后评估方法,其特征在于,所述步骤2中的利用宫颈癌患者肿瘤组织转录组和生存数据构建预后评估模型具体按照以下步骤实施:步骤2.1、定义基因表达值为V,定义基因表达值为V...

【专利技术属性】
技术研发人员:李文兴李功华黄京飞赵旭东代绍兴
申请(专利权)人:中国科学院昆明动物研究所
类型:发明
国别省市:云南,53

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1