基于细胞增殖标志物的TC患病风险预测建模方法技术

技术编号:36644830 阅读:21 留言:0更新日期:2023-02-18 13:03
本申请涉及一种基于细胞增殖标志物的TC患病风险预测建模方法,包括:采集样本数据;将医学影像学检查结果转换为量化的TI

【技术实现步骤摘要】
基于细胞增殖标志物的TC患病风险预测建模方法


[0001]本申请涉及患病风险预测建模领域,尤其是涉及一种基于细胞增殖标志物的TC患病风险预测建模方法。

技术介绍

[0002]甲状腺癌症(Thyroid Carcinoma,TC)是十大常见癌种之一,其成因复杂,早期多无明显自觉症状。据2021年统计结果,2015年我国甲状腺癌患者共计20.1万人;预计2020年我国甲状腺癌男性患者53389人,女性患者167704人,分别占世界甲状腺癌患者的38.89%和37.36%,2020年发病人数较2015年增加约2万人,逐渐呈现年轻化和偏女性化特征,且同期发病率均高于甲状腺癌世界人口均化发病率。从1980

2015年间,我国甲状腺癌发病率持续升高,一方面是由于现代生活节奏和压力增大,环境因素影响增强,另一方面也因为医学检测技术的不断升级。
[0003]为实现对乳头状TC、滤泡状TC、源于滤泡上皮细胞的未分化TC以及主要来源于滤泡旁细胞的髓样TC的早期筛选,在普通外科检查之外,还需要血液检查甲状腺激素、甲状腺自身免疫抗体以及肿瘤标志物作为辅助,对高风险人群需进一步进行细针穿刺抽吸细胞学检查(FNA检查),以确诊肿瘤类型和分化进展分期。由于甲状腺外科触摸检查高度依赖医师经验,主观性影响较大,超声检测仅从外部探测组织结构,血液检查标志物的敏感性和特异性不足以实现早筛目的,而FNA检测的过度应用,更会造成较多患者不必要的痛苦。开发一种基于循环系统肿瘤风险因子、无损且可持续监测的甲状腺癌肿瘤风险评估方法,以减少非必需病理学检测的实施,具有重要的现实意义。
[0004]近年来甲状腺癌患病风险预测模型,可归纳为三种主要模式:1)基于“医学影像学检测(特别是超声技术)的征象结果”,如组成成分、回声、形态、边界、钙化情况等信息,构建受试者工作特征曲线(receiver operating characteristic curve,ROC)对甲状腺癌风险进行预测评估,可参考文献如“陈俊慧,张曼,刘水澎,et al.基于超声征象多因素logistic回归β值积分法的甲状腺癌风险预测研究[J].中国癌症杂志,2019,29(004):289

293.”;2)基于“桥本氏甲状腺炎症、甲状腺功能以及血清甲状腺自身免疫抗体”,对甲状腺癌风险进行评估,可参考文献如“Kadam S,Ghadhban B,AbduljabbarsalehM.Hashimoto's Thyroiditis Increases Risk for Differentiated Thyroid Carcinoma[J].Annals of the Romanian Society for Cell Biology,2021,25:5952

5961.”;3)基于“TGGA等癌症基因组图谱数据库的RNAseq数据、KEGG通路富集分析”,构建基于变异路径的风险评估及甲状腺癌人工神经网络模型,可参考文献如“Zhao Y,Zhao L,Mao T,et al.Assessment of risk based on variant pathways and establishment of an artificial neural network model of thyroid cancer[J].BMC Medical Genetics,2019,20.”。
[0005]针对上述中的相关技术,专利技术人认为存在以下缺陷:超声检查易受主观因素影响,对早期病灶不够敏感;甲状腺激素与肿瘤标志物AFP、CEA等绝大多数对早期TC的敏感性和特异性效果不佳;肿瘤特征核酸特征鉴定方法由于出现时间较晚,临床转化进展尚早,需积
累更多数据对方法有效性进行验证支持。现有的TC风险评估体系的样本获取成本高、难度大、样本积累效率偏低,导致现有TC风险评估模型的迭代升级难度较高。

技术实现思路

[0006]为了解决现有的TC风险评估体系不能适用于健康群体进行甲状腺癌的患病风险监测,且样本获取成本高、难度大、样本积累效率低,导致风险评估模型的迭代升级难度大的问题,本申请提供一种基于细胞增殖标志物的TC患病风险预测建模方法。
[0007]本申请提供的一种基于细胞增殖标志物的TC患病风险预测建模方法,采用如下技术方案:一种基于细胞增殖标志物的TC患病风险预测建模方法,包括:采集样本数据;将医学影像学检查结果转换为量化的TI

RADS分级,并设定TR

3及以上的TI

RADS分级作为终点事件;将细胞增殖标志物血清胸苷激酶1即TK1检测结果为主的多种体检指标项目作为自变量;通过回归法进行建模,从而获得甲状腺癌TC患病风险预测模型。
[0008]本申请通过设定在体检样本中即可获取的TC中间状态(该TC中间状态作为TC病理进程中必然经过的中间状态,具有确定级别的恶化风险特征)作为终点事件(即将具有确定TC风险的影像学检查结果集合设定为风险预测终点事件(设定TR

3、TR

4和TR

5作为阳性结果)),多种体检指标项目作为自变量,由于自变量和因变量都设定在体检阶段,仅需提供体检结果就可进行风险预测模型的开发,无需为了收集临床结果进行大量低效的回访工作,从而降低了阳性结果样本的获取成本和难度,阳性样本的稳定积累成为可能,在相同时间段内,该系统获得的风险预测模型的迭代升级可行性更高。另外,通过结合将细胞增殖标志物血清胸苷激酶1即TK1检测结果为主的多种体检指标项目作为自变量,从而建模获得的预测模型可以更好的适用于TC患病风险的预测;而且本申请中以多种体检指标项目作为自变量,因而所建立的TC患病风险预测模型可以普遍适用于一般的健康人群,比如用于体检机构中用于对普通的体检人群进行TC患病风险预测,可以适应普遍筛查的高频度和高通量需求。
[0009]优选的,所述的通过回归法进行建模,从而获得甲状腺癌TC患病风险预测模型,具体包括以下步骤:S1,使用三折交叉验证法随机抽样将原始样本数据拆分为训练集与验证集;S2,针对不同的训练集,通过重复使用不平衡回归ILKL算法进行建模,获得多个预测模型;对应同一个训练集所获得的多个预测模型形成一个预测模型库;S3,对各个预测模型库中的预测模型进行筛选,若预测模型公式中含有TK1项目自变量,则将该所述的预测模型纳入初筛预测模型组中;S4,对于初筛预测模型组中的预测模型,使用对应的验证集样本进行受试者工作特征曲线(即ROC曲线)验证并计算曲线下面积AUC值;S5,若AUC值大于等于0.7,则将对应的初筛预测模型组中的预测模型纳入最终的预测模型组中;S6,对最终的预测模型组中的各个预测模型,按照参数综合方式进行模型优化,从而得到TC风险预测模型。
[0010]通过采用以上方案,尤其是通过利用TK1项目自变量及受试者工作特征曲线对预
测模型进行筛选,TK1检测结果可指示细胞增殖水平,可本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于细胞增殖标志物的TC患病风险预测建模方法,其特征在于,包括:采集样本数据;将医学影像学检查结果转换为量化的TI

RADS分级,并设定TR

3及以上的TI

RADS分级作为终点事件;将细胞增殖标志物血清胸苷激酶1即TK1检测结果为主的多种体检指标项目作为自变量;通过回归法进行建模,从而获得甲状腺癌TC患病风险预测模型。2.根据权利要求1所述的基于细胞增殖标志物的TC患病风险预测建模方法,其特征在于,所述的通过回归法进行建模,从而获得甲状腺癌TC患病风险预测模型,具体包括以下步骤:S1,使用三折交叉验证法随机抽样将原始样本数据拆分为训练集与验证集;S2,针对不同的训练集,通过重复使用不平衡回归ILKL算法进行建模,获得多个预测模型;对应同一个训练集所获得的多个预测模型形成一个预测模型库;S3,对各个预测模型库中的预测模型进行筛选,若预测模型公式中含有TK1项目自变量,则将该所述的预测模型纳入初筛预测模型组中;S4,对于初筛预测模型组中的预测模型,使用对应的验证集样本进行受试者工作特征曲线验证并计算曲线下面积AUC值;S5,若AUC值大于等于0.7,则将对应的初筛预测模型组中的预测模型纳入最终的预测模型组中;S6,对最终的预测模型组中的各个预测模型,按照参数综合方式进行模型优化,从而得到TC风险预测模型。3.根据权利要求2所述的基于细胞增殖标志物的TC患病风险预测建模方法,其特征在于,步骤S2所述的使用不平衡回归ILKL算法进行建模具体包括以下步骤:S21,将样本根据终点事件状态分为两组,其中,终点事件为一般风险的样本为多数组,阳性样本组为少数组;S22,将作为自变量的体检指标项目设为聚类指标变量,将终点事件设为样本标签,将K设定为类别组数;S23,从多数组样本中随机选择K个样本作为质心,对多数组样本中的每一个点,基于聚类指标变量计算其与每一个质心样本的欧几里德距离,并将其划分到距离最短的质心所属的集合中;S24,所有数据归入K个集合后,重新计算每个集合的质心点;S25,若新计算出来的质心样本和原质心样本之间的欧几里德距离小于设置的阈值,则将获得的K个集合作为K

Means聚类分组;否则继续进行迭代,直至最终获得K

Means聚类分组;S26,按照少数组比多数组的比例对K

Means聚类分组进行随机抽样;S27,合并所有的抽样样本与少数组样本,通过二分类逻辑回归获得预测模型。4.根据权利要求2所述的基于细胞增殖标志物的TC患病风险预测建模方法,其特征在于,步骤S6中所述的按照参数综合方式进行模型优化具体包括以下步骤:S61,使用最终的预测模型组中的各个预测模型,分别对全部的训练集加验证集的数据进行受试者工作特征曲线验证并计算曲线下面积AUC值;S62,根据验证结果中对阳性样本的预测正确率大小对所述的各个预测模型进行排序;S63,选择预测正确率最高的2

10个模型,进行...

【专利技术属性】
技术研发人员:李劲张波刘绵学周际艾伦
申请(专利权)人:华瑞同康生物技术深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1