用于预测直肠癌患者术后出院准备度的模型制造技术

技术编号:33933176 阅读:27 留言:0更新日期:2022-06-25 22:45
本发明专利技术涉及一种用于预测直肠癌患者术后出院时间的方法,其特征在于包括:获取待预测的直肠癌患者手术前后相关体征数据;将待预测的直肠癌患者手术前后相关体征数据输入到预先构建完成的基于GA_XGboost的术后出院天数预测模型中,获得预测出院天数;所述基于GA_XGboost的术后出院天数预测模型中应用遗传算法GA对XGboost回归进行超参数的选择。通过构建并训练得到基于GA_Xgboost的模型,验证表明GA_XGboost在MSE和MAE两项指标中的预测精度有明显提高,提供给医生和患者一定的参考和预期,不仅有利于对患者的术后安排和治疗,同时减少了不必要的医疗资源浪费。减少了不必要的医疗资源浪费。减少了不必要的医疗资源浪费。

【技术实现步骤摘要】
用于预测直肠癌患者术后出院准备度的模型


[0001]本专利技术涉及一种用于预测直肠癌患者术后出院准备度的模型。

技术介绍

[0002]结直肠癌是消化系统常见恶性肿瘤,属于全球范围内男女恶性肿瘤发病率前三,发病率在男性、女性中分列第3位和第2位,死亡病例数在男性、女性中分列第4位和第3位,严重影响人类健康。随着人们生活水平的不断提高以及生活方式尤其是膳食结构的改变,我国结直肠癌的发病率日益增高,已跃居城市恶性肿瘤发病率第2位,死亡率第4位。近年来,随着医疗水平的不断提高,我国结直肠癌患者的总体5年生活率也有了较大的提高,其中结肠癌5年生存率达57.6%,直肠癌5年生存率达56.9%。
[0003]患者出院准备度由Fenwick于1979年首次提出,是指医护人员在患者出院之前对患者的生理、心里和社会的健康状况进行综合评估,分析判断患者在离开医院、回归社会方面的康复能力,因此可知出院准备度评估结果可以辅助判断患者是否达到出院的标准,精准的评估预测患者将于何时出院有助于医院更好的管理医疗资源并能更好的了解其峰值容量,同时对于节约医疗资源、降低患者住院费用等方面也有重要意义。然而,现有技术中对结直肠癌患者术后出院准备度鲜有研究。
[0004]前述
技术介绍
知识的记载旨在帮助本领域普通技术人员理解与本专利技术较为接近的现有技术,同时便于对本专利技术构思及技术方案的理解,应当明确的是,在没有明确的证据表明上述内容在本专利申请的申请日前已公开的情况下,上述
技术介绍
不应当用于评价本申请技术方案的新创性。
专利技术内容
[0005]为解决上述
技术介绍
中提及的至少一种技术问题,本专利技术的目的旨在提供一种用于预测直肠癌患者术后出院时间的方法,通过构建并训练得到基于GA_XGBoost的模型,最后将待预测的直肠癌患者手术前后相关体征数据作为验证集输入上述模型即可预测合适的出院时间,GA_XGBoost在MSE和MAE两项指标中的预测精度有明显提高,提供给医生和患者一定的参考和预期,不仅有利于对患者的术后安排和治疗,同时减少了不必要的医疗资源浪费。
[0006]为了实现上述目的,本专利技术提供如下技术方案。
[0007]用于预测直肠癌患者术后出院准备度的模型,包括预测直肠癌患者出院时间的方法,包括:获取待预测的直肠癌患者手术前后相关体征数据;将所述待预测的直肠癌患者手术前后相关体征数据,输入到预先构建完成的基于GA_XGBoost的术后出院天数预测模型中,获得预测出院天数;所述基于GA_XGBoost的术后出院天数预测模型中应用遗传算法GA对XGBoost回归进行超参数的选择。
[0008]所述基于GA_XGBoost的术后出院天数预测模型经过由历史直肠癌患者手术前后的体征数据组成的训练集训练。
[0009]所述用于预测直肠癌患者术后出院时间的方法具体包括:步骤一、采集历史直肠癌患者的手术前后数据作为特征集;步骤二、对特征集进行清洗;步骤三、对清洗后的特征集进行特征筛选;步骤四、建立术后出院天数预测模型,将步骤三得到的特征集输入预测模型进行训练;步骤五、利用完成训练的预测模型对验证集数据进行预测,得到出院天数。
[0010]部分实施方式,步骤一中,所述手术前后数据包括年龄、PS评分、TNM分期、分化程度、身高、体重、BMI、入院空腹血糖、白蛋白、前白蛋白、总蛋白、GOT(丙氨酸)、GPT(天冬氨酸)、L

γ

谷氨酰转移酶、总胆红素、直接胆红素、间接胆红素、肌酐、白细胞、血红蛋白、淋巴细胞计数这些术前必须的体检指标以及手术持续时间、出血量。
[0011]部分实施方式,步骤二中,对特征集进行清洗执行下述步骤:去除指标缺失严重的病例,采用准则去除数值异常的数据,对少量特征缺失数据用均值填充,将一些离散的数据指标数值化。
[0012]部分实施方式,步骤三中,特征筛选执行下述步骤:利用XGBoost和随机森林的重要性得分以及线性相关程度这三个指标去除一些冗余和无关特征,具体是通过XGBoost和随机森林进行重要性排序,剔除二者之和最小的5个特征。原始数据共有27个维度,其中一定存在冗余以及对模型预测无效的数据,而以往的PCA降维等主流的线性降维对树模型是没有作用的,因此接下来进行特征选择时通过XGBoost和随机森林进行重要性排序,剔除二者之和最小的5个特征,可以显著提高模型预测的准确度。
[0013]部分实施方式,步骤四中,术后出院天数预测模型是基于GA_XGBoost的模型。
[0014]所述预测模型包括XGBoost回归算法:其目标函数主要由损失函数和正则函数构成:其目标函数主要由损失函数和正则函数构成:其中,为第s次迭代的目标函数;为模型的损失函数;是在第轮训练对样本i的预测值;是样本i的真实值;为第i个输入样本;为第s轮训练的子模型;为第s次迭代的模型的正则函数;n为样本数;γ和λ为正则项系数;T为模型的叶节点个数。
[0015]损失函数是:其中constant为常数;
使用泰勒公式对其展开:其中,是之前s

1轮的训练损失,并不影响本轮的训练损失值,可将其视为常量;对其去掉常量后转换为:令为第j个叶子节点输出值,为第j个叶子节点值的样本子集,将其对应到每一个叶子节点上,改写成:其中为损失函数对的一阶导数,为其二阶导数;令,;上式表示为: 对上式求导得叶子结点j的最优值和目标函数的最优值:其中,可评价树模型的优劣,其值越小,表明该树模型越好。
[0016]XGBoost算法沿用了贪心算法,并且假设树结构为二叉树,令其最终的节点分裂目标函数公式为:其中,G、H由该节点的所有样本的g、h求和得到,;;;;;;;;;I
L
为左叶子结点的样本集;I
R
为右叶子结点的样本集。
[0017]由此,XGBoost的训练过程如下:1、每一轮的训练中新增一个初始化的二叉树模型;2、在开始训练之前,更新梯度统计:
3、根据贪心生成算法和梯度生成本轮训练完整树;3.1、选择最优切分点:3.2、得到叶子节点的权重数值:4、将本轮新得到的树模型加权到之前的模型中去:。
[0018]训练好后,将经过特征工程处理后的验证集数据输入训练好的模型中即可得到预测值。
[0019]所述预测模型还包括:GA_XGBoost算法。
[0020]通过遗传算法(GA)对XGBoost模型选择超参数,步骤如下:1、在超参数空间随机生成N个组合作为初始化种群;2、通过交叉验证方法得到XGBoost的损失函数来计算每个个体适应度;3、将适应度较高的参数组合保留;4、对保留的个体参数进行交叉操作,生成新的参数组合,并且对生成的参数组合进行随机变异的操作;5、淘汰参数组合中适应度较低的个体;6、重复步骤2到5,直到满足设定的结束条件为止;7、选择所有参数组合中适应度最高的个体作为模型的超参数。
[0021]在训练XGBoost模型时,以往调参常常考虑的是网格法,但网格法寻找最优模型的复本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.用于预测直肠癌患者术后出院准备度的模型,其特征在于包括预测直肠癌患者出院时间的方法,具体包括:获取待预测的直肠癌患者手术前后相关体征数据;将所述待预测的直肠癌患者手术前后相关体征数据,输入到预先构建完成的基于GA_XGBoost的术后出院天数预测模型中,获得预测出院天数;所述基于GA_XGBoost的术后出院天数预测模型中应用遗传算法GA对XGBoost回归进行超参数的选择。2.根据权利要求1所述的模型,其特征在于:所述基于GA_XGBoost的术后出院天数预测模型经过由历史直肠癌患者手术前后的体征数据组成的训练集训练。3.根据权利要求1或2所述的模型,其特征在于:所述预测直肠癌患者术后出院时间的方法具体包括:步骤一、采集历史直肠癌患者的手术前后数据作为特征集;步骤二、对特征集进行清洗;步骤三、对清洗后的特征集进行特征筛选;步骤四、建立术后出院天数预测模型,将步骤三得到的特征集输入预测模型进行训练;步骤五、利用完成训练的预测模型对验证集数据进行预测,得到出院天数。4.根据权利要求3所述的模型,其特征在于:步骤一中,所述手术前后数据包括年龄、PS评分、TNM分期、分化程度、身高、体重、BMI、入院空腹血糖、白蛋白、前白蛋白、总蛋白、GOT(丙氨酸)、GPT(天冬氨酸)、L

γ

谷氨酰转移酶、总胆红素、直接胆红素、间接胆红素、肌酐、白细胞、血红蛋白、淋巴细胞计数这些术前必须的体检指标以及手术持续时间、出血量。5.根据权利要求3所述的模型,其特征在于:步骤三中,特征筛选执行下述步骤:利用XGBoost和随机森林的重要性得分以及线性相关程度这三个指标去除一些冗余和无关特征,具体是通过XGBoost和随机森林进行重要性排序,剔除二者之和最小的5个特征。6.根据权利要求1或2所述的模型,其特征在于:应用遗传算法GA对XG...

【专利技术属性】
技术研发人员:王增姚庆华李清林蔡鑫君陆怡袁梅琴雷蕾
申请(专利权)人:浙江省肿瘤医院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1