一种基于机器学习的胸部肿瘤放疗后放射性肺炎预测方法和系统技术方案

技术编号：32874849 阅读：27 留言：0更新日期：2022-04-02 12:05

本发明专利技术提供一种基于机器学习的胸部肿瘤放疗后放射性肺炎预测方法，包括：获取患者数据；将患者数据中非数字的特征进行数字化，并进行特征缺失值预测和冗余特征去除，得到预处理后的患者数据；将预处理后的患者数据分为训练集和测试集，训练生成改进的支持向量机模型；使用测试集计算工作特征曲线ROC曲线的曲线下面积AUC来评估模型的精度；将需要预测的患者相关数据输入验证通过模型，对放射性肺炎发生进行预测。本发明专利技术提供的方法能够结合大量医疗案例数据库，结合患者的临床信息、剂量信息、CT影像组学等多种因素，更加快速、直观地预测胸部肿瘤患者放疗后的放射性肺炎发生情况。测胸部肿瘤患者放疗后的放射性肺炎发生情况。测胸部肿瘤患者放疗后的放射性肺炎发生情况。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于机器学习的胸部肿瘤放疗后放射性肺炎预测方法和系统

[0001]本专利技术涉及机器学习领域，特别是指一种基于机器学习的胸部肿瘤放疗后放射性肺炎预测。

技术介绍

[0002]放射性肺炎属于放射性肺损伤的一部分，是胸部肿瘤放疗最主要也是最严重的并发症，常见于放疗开始后1～3个月内。10％
‑
30％的胸部放疗患者会出现放射性肺炎，它不仅限制了治疗的实施，影响了治疗疗效，也降低了患者的生存质量乃至生存率，因此降低放射性肺炎的发生率在临床上具有重要意义。对放射性肺炎发生情况的准确预测，有利于及时进行临床干预，降低患者放疗风险。
[0003]目前研究已经发现，急性放射性肺炎的发生，与许多因素相关，如：患者年龄、性别、KPS功能状态评分、是否患高血压、是否化疗、放疗前化疗周期数、肿瘤靶区体积、肿瘤位置、淋巴结位置、肺部受照平均剂量、肺部接受5Gy、10Gy、20Gy、30Gy剂量的体积、患者每日照射剂量、总疗程照射剂量。临床中常用放疗计划中患者肺部受5Gy、20Gy剂量照射体积(V5Gy，V20Gy)及肺部平均受照剂量，来评估放射性肺炎发生情况。但目前尚未建立一个简单有效的模型能够综合各种因素来预测放射性肺炎的发生情况。

技术实现思路

[0004]本专利技术的主要目的在于克服现有技术中的上述缺陷，提出一种基于机器学习的胸部肿瘤放疗后放射性肺炎预测方法，能够结合大量医疗案例数据库，结合患者的临床信息、剂量信息、CT影像组学等多种因素，更加快速、直观地预测胸部肿瘤患者放疗后的放射性肺炎发...

【技术保护点】

【技术特征摘要】
1.一种基于机器学习的胸部肿瘤放疗后放射性肺炎预测方法，其特征在于，包括：获取患者数据，所述患者数据包括患者肺部CT影像组学数据、患者临床数据、患者放疗计划剂量学数据；将患者数据中非数字的特征进行数字化，并进行特征缺失值预测和冗余特征去除，得到预处理后的患者数据；将预处理后的患者数据分为训练集和测试集，训练生成改进的支持向量机模型；使用测试集计算工作特征曲线ROC曲线的曲线下面积AUC来评估模型的精度，若曲线下面积大于等于0.9，则验证通过，输出验证通过模型；若曲线下面积小于0.9，则重新生成支持向量机模型；将需要预测的患者相关数据输入验证通过模型，对放射性肺炎发生进行预测。2.根据权利要求1所述的一种基于机器学习的胸部肿瘤放疗后放射性肺炎预测方法，其特征在于，所述患者数据包括患者肺部CT影像组学数据、患者临床数据、患者放疗计划剂量学数据，具体为：患者肺部CT影像组学数据包括：LLH小波变换下的一阶纹理特征最小值、HHL小波变换下的一阶纹理特征最小值和灰度共生矩阵的自相关性，HHH小波变换下的灰度共生矩阵的自相关性；患者临床数据包括：胸部肿瘤放疗患者的年龄、性别、KPS功能状态评分、是否患高血压、是否化疗、放疗前化疗周期数、肿瘤靶区体积、肿瘤位置、淋巴结位置；患者放疗计划剂量学数据包括：肺部受照平均剂量、肺部接受5Gy、10Gy、20Gy、30Gy剂量的体积、患者每日照射剂量、总疗程照射剂量。3.根据权利要求1所述的一种基于机器学习的胸部肿瘤放疗后放射性肺炎预测方法，其特征在于，并进行特征缺失值预测和冗余特征去除，具体为：采用K最近邻算法对非缺失的患者数据进行拟合，预测特征缺失值；根据方差最大化原理，用一组线性无关且相互正交的新向量组表征原来的数据矩阵的行/列，用以压缩特征个数，剔除冗余特征。4.根据权利要求1所述的一种基于机器学习的胸部肿瘤放疗后放射性肺炎预测方法，其特征在于，训练生成改进的支持向量机模型，具体包括：训练样本集D＝{(x1,y1),(x2,y2),
…
,(x
m
,y
m
)}，y
i
∈{
‑
1，+1}；m为特征个数；引入“软间隔”，允许某些样本不满足约束y
i
(ω
T
x
i
+b)≥1优化目标可以写为s.t.y
i
(ω
T
x
i
+b)≥1
‑
ii≥0，i＝1,2，
…
，m.即为改进的支持向量机模型；模型中高斯核函数：
其中，ω和b是模型参数，C称为惩罚系数，γ宽度系数，i为松弛变量，i≥0。5.一种基于机器学习的胸部肿瘤放疗后放射性肺炎预测...

【专利技术属性】
技术研发人员：陈思嘉，石丽婉，李涛，高翔，康峥，李夷民，林勤，
申请(专利权)人：厦门大学附属第一医院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人