一种基于PUS家族基因的肝细胞癌预后评分系统及其应用技术方案

技术编号:34281495 阅读:20 留言:0更新日期:2022-07-24 18:26
本发明专利技术提供了一种基于PUS家族基因的肝细胞癌预后评分系统及其应用。所述基于PUS家族基因的肝细胞癌预后评分系统的输入变量包括所述PUS家族基因在数据集中的表达状态系数、基尼系数和整合风险系数;所述表达状态系数根据PUS家族基因的mRNA表达水平与平均测值的大小关系确定。所述基于PUS家族基因的肝细胞癌预后评分系统将5个HCC相关性PUS家族基因的重要性与HCC患者的预后及临床特征相联系,在不同的HCC数据集中,得分不同的患者存在显著的总体生存率差异,得分越高其总体生存率越低,所述肝细胞癌预后评分系统能够有效用于HCC患者预后的评估,在临床上具有一定的特异性和敏感性。感性。感性。

A prognostic scoring system for hepatocellular carcinoma based on pus family genes and its application

【技术实现步骤摘要】
一种基于PUS家族基因的肝细胞癌预后评分系统及其应用


[0001]本专利技术属于肿瘤学
,具体涉及一种基于PUS家族基因的肝细胞癌预后评分系统及其应用。

技术介绍

[0002]肝癌是全球发病率第六位的恶性肿瘤,同时也是全球排名第四位的癌症致死病因。原发性肝癌的85%

95%是肝细胞癌(Hepatocellular carcinoma,HCC),由于起病隐匿加之早期诊断措施不够完善,80%的HCC患者确诊时已经处于中晚期,因而丧失了手术机会。HCC中晚期患者的死亡率高达80%,中位生存期不足1年,5年生存率不足20%。手术技术、放化疗技术、靶向治疗药物及免疫治疗技术近年来取得了进展,这些进展给中晚期HCC患者带来了新希望,但不可否认的是目前中晚期HCC的疗效仍然是让人失望的。
[0003]预后评估是HCC患者治疗的关键步骤。医学界提出了好几种分期系统,包括巴塞罗那临床肝癌(BCLC)系统、TNM分期系统、日本综合分期系统等。这些分期系统在临床使用上都有其局限性。为了更准确的预测肝癌患者预后(生存),除了考虑患者的肝功能、肿瘤分期和身体状况,还必须同时考虑患者的分子生物学特征,基于分子生物学特征的新型预后评估系统将有助于HCC患者的个体化治疗和精准医疗。
[0004]假尿嘧啶是对rRNA、snRNA和tRNA上的重要RNA修饰,对于RNA的加工、翻译以及剪切具有重要的调控功能。假尿嘧啶修饰在恶性肿瘤的发生发展中扮演重要角色。假尿嘧啶化修饰的过程是由假尿嘧啶合成酶 (pseudouridine synthases,PUS)进行催化,让尿嘧啶核苷酸(U)的化学结构发生改变,形成假尿嘧啶核苷。因此PUS家族的相关基因在恶性肿瘤的诊断、监测和疗效评估应用中具有指导意义。
[0005]目前尚不清楚肝癌中PUS相关基因的变化特征及临床意义,也尚无相关基于PUS家族基因的技术和试剂盒等产品对肝癌患者进行诊断和预后评估。因此,创建一种基于PUS家族基因的肝细胞癌预后评分系统,具有重要的临床上应用价值。

技术实现思路

[0006]针对现有技术存在的不足,本专利技术的目的在于提供一种基于PUS家族基因的肝细胞癌预后评分系统及其应用。专利技术人基于多个肝癌患者的数据队列及其 mRNA表达数据,利用大数据挖掘筛选出5个HCC相关的PUS家族基因,利用这5个PUS家族基因,在人工智能算法(随机森林算法)的基础上,创建了一种命名为“PUS

score”的积分系统,所述积分系统能够有效用于HCC患者预后的评估,在临床上具有一定的特异性和敏感性,具有重要的应用价值。
[0007]为达到此专利技术目的,本专利技术采用以下技术方案:
[0008]第一方面,本专利技术提供一种基于PUS家族基因的肝细胞癌预后评分系统,所述基于PUS家族基因的肝细胞癌预后评分系统的输入变量包括所述PUS家族基因在数据集中的表达状态系数(Expression)、基尼系数(Importance)和整合风险系数(Integrated HR);
[0009]所述表达状态系数根据PUS家族基因的mRNA表达水平与平均测值的大小关系确定。
[0010]本专利技术中,基于COX生存分析和随机森林模型的结果,利用关键的5个 HCC相关性PUS家族基因的mRNA表达值构建了肝细胞癌预后评分系统PUS
‑ꢀ
score,PUS

score将5个HCC相关性PUS家族基因的重要性与HCC患者的预后及临床特征相联系,在不同HCC数据集中,PUS

score不同的患者存在显著的总体生存率差异,PUS

score越高其总体生存率越低,所述肝细胞癌预后评分系统PUS

score能够有效用于HCC患者预后的评估,在临床上具有一定的特异性和敏感性。
[0011]优选地,所述PUS家族基因包括PUS1、PUS3、PUS7、PUS7L和 RPUSD2。
[0012]优选地,所述数据集包括肝细胞癌队列基因表达综合数据库、肝细胞癌基因组图谱、国际癌症基因组联盟日本肝癌数据和CNHPP。
[0013]优选地,所述肝细胞癌队列基因表达综合数据库包括GSE14520、 GSE22058、GSE25097、GSE36376、GSE45436、GSE54236、GSE63898、 GSE64041、GSE76427、GSE102079、GSE104310、GSE107170、GSE11819、 GSE14323、GSE15654、GSE17548、GSE17856、GSE19665、GSE22405、 GSE29721、GSE31370、GSE33006、GSE33294、GSE36411、GSE38226、 GSE39791、GSE41160、GSE41804、GSE45050、GSE45267、GSE46408、 GSE51401、GSE54238、GSE55048、GSE56545、GSE57555、GSE57957、 GSE62232、GSE63863、GSE65484、GSE65485、GSE67764、GSE69164、 GSE7473、GSE77314、GSE84402、GSE84598、GSE87630、GSE89377、 GSE94660、GSE95698或GSE98383中任意一种或至少两种的组合。
[0014]在本专利技术中从Gene Expression Omnibus(https://www.ncbi.nlm.nih.gov/geo/) 数据库获取52个HCC队列的mRNA的数据(肝细胞癌队列基因表达综合数据库);从the Cancer Genome Atlas Liver Hepatocellular Carcinoma(TCGA

LIHC) data collection(https://www.cancer.gov/about

nci/organization/ccg/research /structural

genomics/tcga)、International Cancer Genome Consortium (https://dcc.icgc.org/)和CNHPP Data Portal(cnhpp.ncpsb.org.cn)获取TCGA

LIHC (肝细胞癌基因组图谱)、ICGC

LIRI

JP(国际癌症基因组联盟日本肝癌数据)和CNHPP的HCC队列的RNA表达数据。
[0015]优选地,所述数据集包括GSE14520、肝细胞癌基因组图谱和国际癌症基因组联盟日本肝癌数据。
[0016]优选地,所述PUS家族基因在数据集中的表达状态系数为0或1,所述 PUS家族基因的mRNA表达水平大于平均测值,所述表达状态系数记为1;否则记为0。
[0017]优选地,所述基尼系数本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于PUS家族基因的肝细胞癌预后评分系统,其特征在于,所述基于PUS家族基因的肝细胞癌预后评分系统的输入变量包括所述PUS家族基因在数据集中的表达状态系数、基尼系数和整合风险系数;所述表达状态系数根据PUS家族基因的mRNA表达水平与平均测值的大小关系确定。2.根据权利要求1所述的基于PUS家族基因的肝细胞癌预后评分系统,其特征在于,所述PUS家族基因包括PUS1、PUS3、PUS7、PUS7L和RPUSD2。3.根据权利要求1或2所述的基于PUS家族基因的肝细胞癌预后评分系统,其特征在于,所述数据集包括肝细胞癌队列基因表达综合数据库、肝细胞癌基因组图谱、国际癌症基因组联盟日本肝癌数据和CNHPP;优选地,所述肝细胞癌队列基因表达综合数据库包括GSE14520、GSE22058、GSE25097、GSE36376、GSE45436、GSE54236、GSE63898、GSE64041、GSE76427、GSE102079、GSE104310、GSE107170、GSE11819、GSE14323、GSE15654、GSE17548、GSE17856、GSE19665、GSE22405、GSE29721、GSE31370、GSE33006、GSE33294、GSE36411、GSE38226、GSE39791、GSE41160、GSE41804、GSE45050、GSE45267、GSE46408、GSE51401、GSE54238、GSE55048、GSE56545、GSE57555、GSE57957、GSE62232、GSE63863、GSE65484、GSE65485、GSE67764、GSE69164、GSE7473、GSE77314、GSE84402、GSE84598、GSE87630、GSE89377、GSE94660、GSE95698或GSE98383中任意一种或至少两种的组合;优选地,所述数据集包括GSE14520、肝细胞癌基因组图谱和国际癌症基因组联盟日本肝癌数据。4.根据权利要求1

3任一项所述的基于PUS家族基因的肝细胞癌预后评分系统,其特征在于,所述PUS家族基因在数据集中的表达状态系数为0或1,所述PUS家族基因的mRNA表达水平大于平均测值,所述表达状态系数记为1;否则记为0;优选地,所述基尼系数代表所述PUS家族基因作为用于评估肝细胞癌患者预后的重要系数,所述基尼系数由随机森林算法确定;所述PUS1的基尼系数为9.12,所述PUS3的基尼系数为8.63,所述PUS7的基尼系数为7.56,所述PUS7L的基尼系数为7.26,所述RPUSD2的基系数为6.58。5.根据权利要求1

4任一项所述的基于PUS家族基因的肝细胞癌预后评分系统,其特征在于,所述整合风险系数根据所述PUS家族基因在数据集中的基于单变量COX比例模型的风险系数进行整合确定;优选地,所述PUS家族基因分为危险因素和保护性因素,所述PUS家族基因中PUS1、PUS7、PUS7L和RPUSD2为危险因素,所述PUS家族基因中PUS3为保护性因素;所述PUS家族基因中危险因素的整合风险系数为...

【专利技术属性】
技术研发人员:张强弩刘利平魏腾熊凌风严巧婷余洁玲
申请(专利权)人:深圳市人民医院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1