【技术实现步骤摘要】
基于细胞增殖标志物的TC患病风险预测建模方法
[0001]本申请涉及患病风险预测建模领域,尤其是涉及一种基于细胞增殖标志物的TC患病风险预测建模方法。
技术介绍
[0002]甲状腺癌症(Thyroid Carcinoma,TC)是十大常见癌种之一,其成因复杂,早期多无明显自觉症状。据2021年统计结果,2015年我国甲状腺癌患者共计20.1万人;预计2020年我国甲状腺癌男性患者53389人,女性患者167704人,分别占世界甲状腺癌患者的38.89%和37.36%,2020年发病人数较2015年增加约2万人,逐渐呈现年轻化和偏女性化特征,且同期发病率均高于甲状腺癌世界人口均化发病率。从1980
‑
2015年间,我国甲状腺癌发病率持续升高,一方面是由于现代生活节奏和压力增大,环境因素影响增强,另一方面也因为医学检测技术的不断升级。
[0003]为实现对乳头状TC、滤泡状TC、源于滤泡上皮细胞的未分化TC以及主要来源于滤泡旁细胞的髓样TC的早期筛选,在普通外科检查之外,还需要血液检查甲状腺激素、甲状腺自身免疫抗体以及肿瘤标志物作为辅助,对高风险人群需进一步进行细针穿刺抽吸细胞学检查(FNA检查),以确诊肿瘤类型和分化进展分期。由于甲状腺外科触摸检查高度依赖医师经验,主观性影响较大,超声检测仅从外部探测组织结构,血液检查标志物的敏感性和特异性不足以实现早筛目的,而FNA检测的过度应用,更会造成较多患者不必要的痛苦。开发一种基于循环系统肿瘤风险因子、无损且可持续监测的甲状腺癌肿瘤风险评估方法,以减 ...
【技术保护点】
【技术特征摘要】
1.基于细胞增殖标志物的TC患病风险预测建模方法,其特征在于,包括:采集样本数据;将医学影像学检查结果转换为量化的TI
‑
RADS分级,并设定TR
‑
3及以上的TI
‑
RADS分级作为终点事件;将细胞增殖标志物血清胸苷激酶1即TK1检测结果为主的多种体检指标项目作为自变量;通过回归法进行建模,从而获得甲状腺癌TC患病风险预测模型。2.根据权利要求1所述的基于细胞增殖标志物的TC患病风险预测建模方法,其特征在于,所述的通过回归法进行建模,从而获得甲状腺癌TC患病风险预测模型,具体包括以下步骤:S1,使用三折交叉验证法随机抽样将原始样本数据拆分为训练集与验证集;S2,针对不同的训练集,通过重复使用不平衡回归ILKL算法进行建模,获得多个预测模型;对应同一个训练集所获得的多个预测模型形成一个预测模型库;S3,对各个预测模型库中的预测模型进行筛选,若预测模型公式中含有TK1项目自变量,则将该所述的预测模型纳入初筛预测模型组中;S4,对于初筛预测模型组中的预测模型,使用对应的验证集样本进行受试者工作特征曲线验证并计算曲线下面积AUC值;S5,若AUC值大于等于0.7,则将对应的初筛预测模型组中的预测模型纳入最终的预测模型组中;S6,对最终的预测模型组中的各个预测模型,按照参数综合方式进行模型优化,从而得到TC风险预测模型。3.根据权利要求2所述的基于细胞增殖标志物的TC患病风险预测建模方法,其特征在于,步骤S2所述的使用不平衡回归ILKL算法进行建模具体包括以下步骤:S21,将样本根据终点事件状态分为两组,其中,终点事件为一般风险的样本为多数组,阳性样本组为少数组;S22,将作为自变量的体检指标项目设为聚类指标变量,将终点事件设为样本标签,将K设定为类别组数;S23,从多数组样本中随机选择K个样本作为质心,对多数组样本中的每一个点,基于聚类指标变量计算其与每一个质心样本的欧几里德距离,并将其划分到距离最短的质心所属的集合中;S24,所有数据归入K个集合后,重新计算每个集合的质心点;S25,若新计算出来的质心样本和原质心样本之间的欧几里德距离小于设置的阈值,则将获得的K个集合作为K
‑
Means聚类分组;否则继续进行迭代,直至最终获得K
‑
Means聚类分组;S26,按照少数组比多数组的比例对K
‑
Means聚类分组进行随机抽样;S27,合并所有的抽样样本与少数组样本,通过二分类逻辑回归获得预测模型。4.根据权利要求2所述的基于细胞增殖标志物的TC患病风险预测建模方法,其特征在于,步骤S6中所述的按照参数综合方式进行模型优化具体包括以下步骤:S61,使用最终的预测模型组中的各个预测模型,分别对全部的训练集加验证集的数据进行受试者工作特征曲线验证并计算曲线下面积AUC值;S62,根据验证结果中对阳性样本的预测正确率大小对所述的各个预测模型进行排序;S63,选择预测正确率最高的2
‑
10个模型,进行...
【专利技术属性】
技术研发人员:李劲,张波,刘绵学,周际,艾伦,
申请(专利权)人:华瑞同康生物技术深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。