【技术实现步骤摘要】
多模态临界边生物标志物识别方法
[0001]本专利技术涉及癌症个体生物标志物识别
,具体涉及一种多模态临界边生物标志物识别方法
。
技术介绍
[0002]随着我国人口老龄化
、
工业化
、
城镇化的进程逐渐加快,伴随着不健康生活方式
、
环境暴露等一系列原因,癌症已成为近年来我国居民的主要死亡原因之一
。
癌症的发展过程可大致分为正常状态
、
关键状态和疾病状态
。
其中,关键状态也称为临界状态或者疾病前状态,广泛的存在各种系统中
。
大量的研究表明,在复杂疾病的进展过程中,恶化不是平滑反而是非常突然的,并且可能导致在临界点处的系统从一个状态突变到另一个状态
。
传统分子生物标志物
(
一组基因或者蛋白质
)
通常基于基因在正常样本和疾病样本上的差异性表达来检测患者处于正常状态或者疾病状态,忽略了临界状态的检测
。
癌症发展临界状态检测是必要的主要原因是:一旦癌细胞的发展趋近于一个临界点或者处于临界点之后,通常会造成癌细胞的扩散和转移
。
同时,预测癌症临界状态是非常困难的,因为从基因表达层面看,癌症组织由正常状态逐步过渡到达临界阈值前,组织的变化是缓慢且微弱的
。
因此识别出用于检测癌症病人临界状态早期诊疗的标志物具有重要的临床意义
。
医学研究表明,癌症个体异质性是目前癌症治疗无
【技术保护点】
【技术特征摘要】
1.
多模态临界边生物标志物识别方法,其特征在于,包括以下步骤:
S1
,构建癌症个体病人的
PEN
;
S2
,设计优化目标函数;
S3
,利用多模态优化算法寻找
PDENB
集
。2.
根据权利要求1所述的多模态临界边生物标志物识别方法,其特征在于,步骤
S1
中,构建癌症个体病人的
PEN
的方法为:
S11
,由癌症个体病人正常样本和肿瘤样本的基因表达数据和参考样本正常组织的基因表达数据以及体细胞突变数据,使用配对单样本网络构建
PGIN
;
S12
,选择
PGIN
中相关性强的基因对作为候选边来构建
PEN
;将选取基因间
pPCC
大于整个网络平均
pPCC
的基因作为候选基因对来构建边缘网络;
S13
,计算在
PGIN
中存在连接的候选基因对
(<x
i
,x
j
>,<x
k
,x
l
>)
之间的个体化高阶皮尔逊相关系数
(Personalized high
‑
order Pearson Correlation Coefficient
,
phPCC)
::其中,
shPCC
是单样本高阶皮尔逊相关系数,是基因
i
在参考样本上的表达高阶平均值,
V
r
(x
i
)
是基因
i
在参考样本上的表达高阶方差;
shPCC
Normal
是正常组织的单样本高阶皮尔逊相关系数,
shPCC
Tumor
是肿瘤组织的单样本高阶皮尔逊相关系数;
S14
,将候选基因对作为边网络中的“节点”,候选基因对间的
phPCC
作为边网络中的“边”来构建癌症个体病人在不同癌症阶段的
PEN。3.
根据权利要求1所述的多模态临界边生物标志物识别方法,其特征在于,步骤
S2
中,优化目标函数为:优化目标函数为:其中,解
X
=
(x1,x2,...,x
n
,)
是二进制决策向量,
n
代表
PEN
中的基因对个数;
X...
【专利技术属性】
技术研发人员:李霞,郭伟峰,孙泽宁,李宗玮,曾涛,梁静,程涵,
申请(专利权)人:郑州大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。