一种乳腺癌预后风险预测的基因标志组合物及应用制造技术

技术编号:39807216 阅读:8 留言:0更新日期:2023-12-22 02:41
本发明专利技术公开一种乳腺癌预后风险预测的基因标志组合物及应用

【技术实现步骤摘要】
一种乳腺癌预后风险预测的基因标志组合物及应用


[0001]本专利技术属于肿瘤分子生物学领域,涉及乳腺癌新的风险评估及预后预测,具体涉及与乳腺癌患者预后相关的5个基因及在此基础上构建的5基因临床预测模型在乳腺癌中的应用


技术介绍

[0002]乳腺癌是威胁女性健康的最常见恶性肿瘤

尽管随着医疗技术的发展,更多的抗肿瘤药物及治疗方式被应用,但乳腺癌仍是导致女性癌症死亡的主要原因

因此仍需寻找新的用于早期预测乳腺癌患者预后以及治疗靶点的生物标志物

[0003]上皮间质转化
(epithelial

to

mesenchymal transition,EMT)
是上皮细胞获得间充质特征并转化为间充质细胞的细胞过程,也是导致肿瘤侵袭

转移的最常见机制之一

[0004]目前尚缺乏一种基于
EMT
机制的,并结合基因组学的乳腺癌预后预测模型的建立及评估的相关方法和应用


技术实现思路

[0005]针对上述技术问题,本专利技术的目的在于提供能够准确预测乳腺癌患者无复发生存的肿瘤标志组合物,筛选出5个参与
EMT
并与乳腺癌患者预后相关基因,以该5个基因的模型为基础计算乳腺癌患者的风险评分,将高风险和低风险患者区分开来,预测患者预后并指导临床治疗

同时,将模型与其他临床指标结合可构建新的列线图r/>。
[0006]本专利技术基于
GEO
数据库转录组数据和
EMT
数据库中的
EMT
基因集发掘与乳腺癌预后相关的
EMT
基因,通过生存分析根据基因表达量构建5基因风险评分模型

再联合临床病理信息构建基因

临床预测模型,该模型能准确预测乳腺癌患者的预后,且能为乳腺癌治疗提供潜在治疗靶点

[0007]为实现上述目的,本专利技术采用下述技术方案:
[0008]第一方面,本专利技术提供一种乳腺癌预后风险预测的基因标志组合物,其特征在于:所述的标志组合物由雄性激素受体
(AR)、
脂质运载蛋白
2(LCN2)、
冷诱导
RNA
结合蛋白
(CIRBP)、KIT

SIAH2
基因组成

[0009]第二方面,本专利技术提供用于第一方面所述的乳腺癌预后风险预测标志组合物的表达水平的试剂在制备乳腺癌预后风险预测和
/
或诊断产品中的应用

[0010]第三方面,本专利技术提供第二方面所述的应用的方法,步骤如下:
[0011](1)
收集乳腺癌组织样本原始基因表达测序数据和对应患者的生存数据,对测序数据进行标准化处理得到基因表达矩阵;
[0012](2)
收集
EMT
相关基因,并在乳腺癌表达矩阵中提取
EMT
相关基因表达矩阵;
[0013](3)

EMT
基因中筛选用于构建预测模型的基因,获取预测基因的生存分析回归系数作为参数,并构建基于参数和基因表达量的预测模型;
[0014](4)
结合模型计算的风险评分和临床指标构建列线图

[0015]进一步,所述步骤
(1)
中,测序数据和生存数据源自
GEO
数据库乳腺癌数据
GSE25055
,使用
log2(x)
的方式对原始数据中每个基因的表达量进行标准化,
x
为基因表达量

[0016]进一步,所述步骤
(2)
中,
EMT
的相关基因从数据库
dbEMT
中获取

[0017]进一步,所述步骤
(3)
包括以下子步骤:
[0018]3.1.
利用
R
语言
ConsensuClusterPlus
程序包依据一致性聚类的方法根据
EMT
相关基因表达特征对乳腺癌样本进行聚类,得到
EMT
亚组;
[0019]3.2.
利用
R
语言
limma
程序包对亚组进行
EMT
相关基因的差异分析,取调整后
p

<0.05
以及
log2|FC|≥1
的基因识别显著差异基因;
[0020]3.3.
利用显著差异基因表达量结合患者生存数据进行多因素
Cox
回归分析得到具有生存预后价值的5个与乳腺癌患者预后相关的基因
AR、LCN2、CIRBP、KIT

SIAH2

[0021]3.4.
根据每个基因的多因素
Cox
回归系数,构建基于5个基因表达量的风险评分公式;
[0022]3.5.
基于该风险评分,将乳腺癌患者分为高低风险组,且高风险组患者无复发生存时间明显短于低风险组患者;
[0023]3.6.
在不同分子分型

不同分期的患者中利用
km
生存分析验证预测模型的预测价值;
[0024]3.7.
利用
ROC
曲线结合患者1年
、3
年和5年的无复发生存数据验证模型预测价值;将风险评分作为独立因素利用多因素
Cox
回归验证风险模型的独立预测能力

[0025]更进一步,所述步骤
3.1
中,聚类的方法如下:首先选择
k
值作为聚类的数量,并设置迭代次数;对于每一个
k
,在每次迭代中选择
80
%的子集,在每一个子集中运行
k

means
算法;每次迭代后,每个
k
值都有一个对应的一致性矩阵,再根据分布一致性选择最佳矩阵

[0026]更进一步,所述步骤
3.4
中,风险评分公式如下:
[0027]风险评分=

0.350
×
AR
的表达量
+0.181
×
LCN2
的表达量

0.431
×
CIRBP
的表达量

0.298
×
KIT
的表达量

0.295
×
SIAH2
的表达量

[0028]进本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.
一种乳腺癌预后风险预测的基因标志组合物,其特征在于:所述的标志组合物由
AR、LCN2、CIRBP、KIT

SIAH2
基因组成
。2.
一种用于检测权利要求1所述的乳腺癌预后风险预测标志组合物的表达水平的试剂在制备乳腺癌预后风险预测和
/
或诊断产品中的应用
。3.
根据权利要求2所述的应用,其特征在于,所述的乳腺癌预后风险预测通过如下步骤实现:
(1)
收集乳腺癌组织样本原始基因表达测序数据和对应患者的生存数据,对测序数据进行标准化处理得到基因表达矩阵;
(2)
收集
EMT
相关基因,并在乳腺癌表达矩阵中提取
EMT
相关基因表达矩阵;
(3)

EMT
基因中筛选用于构建预测模型的基因,获取预测基因的生存分析回归系数作为参数,并构建基于参数和基因表达量的预测模型;
(4)
结合模型计算的风险评分和临床指标构建列线图
。4.
根据权利要求3所述的应用,其特征在于,所述步骤
(1)
中,测序数据和生存数据源自
GEO
数据库乳腺癌数据
GSE25055
,使用
log2(x)
的方式对原始数据中每个基因的表达量进行标准化,
x
为基因表达量
。5.
根据权利要求3所述的应用,其特征在于,所述步骤
(2)
中,
EMT
的相关基因从数据库
dbEMT
中获取
。6.
根据权利要求3所述的应用,其特征在于,所述步骤
(3)
包括以下子步骤:
3.1.
利用
R
语言
ConsensuClusterPlus
程序包依据一致性聚类的方法根据
EMT
相关基因表达特征对乳腺癌样本进行聚类,得到
EMT
亚组;
3.2.
利用
R
语言
limma
程序包对亚组进行
EMT
相关基因的差异分析,取调整后
p

<0.05
以及
log2|FC|≥1
的基因识别显著差异基因;
3.3.
利用显著差异基因表达量结合患者生存数据进行多因素
Cox
回归分析得到具有生存预后价值的5个与乳腺癌患者预后相关的基因雄性激素受体
AR、
脂质运载蛋白
2、
冷诱导
RNA
结合蛋白
、KIT
和...

【专利技术属性】
技术研发人员:张京伟曾祎凡魏蕾陈芳芳田毅浩李俊万慧芳
申请(专利权)人:武汉大学中南医院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1