当前位置: 首页 > 专利查询>郑州大学专利>正文

多模态临界边生物标志物识别方法技术

技术编号:39896281 阅读:4 留言:0更新日期:2023-12-30 13:09
本发明专利技术公开了一种多模态临界边生物标志物识别方法,将个体癌症病人看作动态网络系统,结合动态网络理生物标志物理论以及多模态进化算法,在

【技术实现步骤摘要】
多模态临界边生物标志物识别方法


[0001]本专利技术涉及癌症个体生物标志物识别
,具体涉及一种多模态临界边生物标志物识别方法


技术介绍

[0002]随着我国人口老龄化

工业化

城镇化的进程逐渐加快,伴随着不健康生活方式

环境暴露等一系列原因,癌症已成为近年来我国居民的主要死亡原因之一

癌症的发展过程可大致分为正常状态

关键状态和疾病状态

其中,关键状态也称为临界状态或者疾病前状态,广泛的存在各种系统中

大量的研究表明,在复杂疾病的进展过程中,恶化不是平滑反而是非常突然的,并且可能导致在临界点处的系统从一个状态突变到另一个状态

传统分子生物标志物
(
一组基因或者蛋白质
)
通常基于基因在正常样本和疾病样本上的差异性表达来检测患者处于正常状态或者疾病状态,忽略了临界状态的检测

癌症发展临界状态检测是必要的主要原因是:一旦癌细胞的发展趋近于一个临界点或者处于临界点之后,通常会造成癌细胞的扩散和转移

同时,预测癌症临界状态是非常困难的,因为从基因表达层面看,癌症组织由正常状态逐步过渡到达临界阈值前,组织的变化是缓慢且微弱的

因此识别出用于检测癌症病人临界状态早期诊疗的标志物具有重要的临床意义

医学研究表明,癌症个体异质性是目前癌症治疗无法取得实质性突破重要原因之一,即同种癌症在处于相同时期不同个体病人,癌症突变基因的表达程度也有所不同,作为生物标志物的基因会不同

因此,对于癌症个体病人生物标志物的挖掘和分析有助于理解癌症疾病的个体异质性,为癌症精准医疗提供技术支持

[0003]目前,许多研究将癌症个体病人的网络生物标志物作为个体病人疾病判断的依据,并量化病人样本的生物网络标志物来检测癌症发展过程中的关键状态

相关研究已经证明,多模态问题广泛的存在生物医学领域,多模态网络生物标志物的存在,可以为决策者提供更多的选择

[0004]近年来,研究人员认识到癌症是一类由许多至关重要的基因共同突变引起的复杂疾病,并开始关注边生物标志物
(
即两个基因的相互作用
)
识别

特别是,边生物标志物的合成致死性不仅有助于个体化癌症治疗,还有助于探索其他疾病药物的抗癌潜力

合成致死性边生物标记物
(Synthetic lethality edge biomarkers)
作为一种边生物标记物,定义为两个非致死性基因,它们在一个细胞中同时突变或不表达将导致细胞死亡

由于对含有特定基因突变的癌细胞具有选择性致死作用,与细胞毒性化疗相比,靶向合成致死基因有望拓宽精准医疗的途径

因此,有必要更加重视个体化动态边网络生物标志物
(Personalized Dynamic Edge

Network Biomarker,PDENB)
的识别,以检测个体患者临界状态的早期预警信号,并促进癌症精准医疗在系统层面上对肿瘤异质性的认识

然而,对于复杂的生物网络,边网络的规模一般要比节点网络大得多,这将导致现有的多模态优化算法在没有大规模优化策略的情况下,处理大规模问题容易陷入局部最优

因此,如何引入合适的大规模处理技术,设计合适的多模态优化算法来解决多模态
PDENB
的识别问题,对促进
复杂疾病的早期诊断和个体化治疗具有重要意义


技术实现思路

[0005]为了解决以上多模态
PDENB
识别问题,本专利技术提供了一种多模态临界边生物标志物识别方法

[0006]本专利技术采用的技术方案为:
[0007]多模态临界边生物标志物识别方法,包括以下步骤:
[0008]S1
,构建癌症个体病人的
PEN

[0009]S2
,设计优化目标函数;
[0010]S3
,利用多模态优化算法寻找
PDENB


[0011]进一步,步骤
S1
中,构建癌症个体病人的
PEN
的方法为:
[0012]S11
,由癌症个体病人正常样本和肿瘤样本的基因表达数据和参考样本正常组织的基因表达数据以及体细胞突变数据,使用配对单样本网络构建
PGIN

[0013]S12
,选择
PGIN
中相关性强的基因对作为候选边来构建
PEN
;将选取基因间
pPCC
大于整个网络平均
pPCC
的基因作为候选基因对来构建边缘网络;
[0014]S13
,计算在
PGIN
中存在连接的候选基因对
(<x
i
,x
j
>,<x
k
,x
l
>)
之间的个体化高阶皮尔逊相关系数
(Personalized high

order Pearson Correlation Coefficient

phPCC)

[0015][0016][0017]其中,
shPCC
是单样本高阶皮尔逊相关系数,是基因
i
在参考样本上的表达高阶平均值,
V
r
(x
i
)
是基因
i
在参考样本上的表达高阶方差;
shPCC
Normal
是正常组织的单样本高阶皮尔逊相关系数,
shPCC
Tumor
是肿瘤组织的单样本高阶皮尔逊相关系数;
[0018]S14
,将候选基因对作为边网络中的“节点”,候选基因对间的
phPCC
作为边网络中的“边”来构建癌症个体病人在不同癌症阶段的
PEN。
[0019]进一步,步骤
S2
中,优化目标函数为:
[0020][0021][0022]其中,解
X

(x1,x2,...,x
n
,)
是二进制决策向量,
n
代表
PEN
中的基因对个数;
X
可以表示哪些基因对被选中作为模块中的分子或者没被选中,如果基因对
i
被选中称为模块中的分子,那么
x
i...

【技术保护点】

【技术特征摘要】
1.
多模态临界边生物标志物识别方法,其特征在于,包括以下步骤:
S1
,构建癌症个体病人的
PEN

S2
,设计优化目标函数;
S3
,利用多模态优化算法寻找
PDENB

。2.
根据权利要求1所述的多模态临界边生物标志物识别方法,其特征在于,步骤
S1
中,构建癌症个体病人的
PEN
的方法为:
S11
,由癌症个体病人正常样本和肿瘤样本的基因表达数据和参考样本正常组织的基因表达数据以及体细胞突变数据,使用配对单样本网络构建
PGIN

S12
,选择
PGIN
中相关性强的基因对作为候选边来构建
PEN
;将选取基因间
pPCC
大于整个网络平均
pPCC
的基因作为候选基因对来构建边缘网络;
S13
,计算在
PGIN
中存在连接的候选基因对
(<x
i
,x
j
>,<x
k
,x
l
>)
之间的个体化高阶皮尔逊相关系数
(Personalized high

order Pearson Correlation Coefficient

phPCC)
::其中,
shPCC
是单样本高阶皮尔逊相关系数,是基因
i
在参考样本上的表达高阶平均值,
V
r
(x
i
)
是基因
i
在参考样本上的表达高阶方差;
shPCC
Normal
是正常组织的单样本高阶皮尔逊相关系数,
shPCC
Tumor
是肿瘤组织的单样本高阶皮尔逊相关系数;
S14
,将候选基因对作为边网络中的“节点”,候选基因对间的
phPCC
作为边网络中的“边”来构建癌症个体病人在不同癌症阶段的
PEN。3.
根据权利要求1所述的多模态临界边生物标志物识别方法,其特征在于,步骤
S2
中,优化目标函数为:优化目标函数为:其中,解
X

(x1,x2,...,x
n
,)
是二进制决策向量,
n
代表
PEN
中的基因对个数;
X...

【专利技术属性】
技术研发人员:李霞郭伟峰孙泽宁李宗玮曾涛梁静程涵
申请(专利权)人:郑州大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1