一种基于机器学习的胸部肿瘤放疗后放射性肺炎预测方法和系统技术方案

技术编号:32874849 阅读:27 留言:0更新日期:2022-04-02 12:05
本发明专利技术提供一种基于机器学习的胸部肿瘤放疗后放射性肺炎预测方法,包括:获取患者数据;将患者数据中非数字的特征进行数字化,并进行特征缺失值预测和冗余特征去除,得到预处理后的患者数据;将预处理后的患者数据分为训练集和测试集,训练生成改进的支持向量机模型;使用测试集计算工作特征曲线ROC曲线的曲线下面积AUC来评估模型的精度;将需要预测的患者相关数据输入验证通过模型,对放射性肺炎发生进行预测。本发明专利技术提供的方法能够结合大量医疗案例数据库,结合患者的临床信息、剂量信息、CT影像组学等多种因素,更加快速、直观地预测胸部肿瘤患者放疗后的放射性肺炎发生情况。测胸部肿瘤患者放疗后的放射性肺炎发生情况。测胸部肿瘤患者放疗后的放射性肺炎发生情况。

【技术实现步骤摘要】
一种基于机器学习的胸部肿瘤放疗后放射性肺炎预测方法和系统


[0001]本专利技术涉及机器学习领域,特别是指一种基于机器学习的胸部肿瘤放疗后放射性肺炎预测。

技术介绍

[0002]放射性肺炎属于放射性肺损伤的一部分,是胸部肿瘤放疗最主要也是最严重的并发症,常见于放疗开始后1~3个月内。10%

30%的胸部放疗患者会出现放射性肺炎,它不仅限制了治疗的实施,影响了治疗疗效,也降低了患者的生存质量乃至生存率,因此降低放射性肺炎的发生率在临床上具有重要意义。对放射性肺炎发生情况的准确预测,有利于及时进行临床干预,降低患者放疗风险。
[0003]目前研究已经发现,急性放射性肺炎的发生,与许多因素相关,如:患者年龄、性别、KPS功能状态评分、是否患高血压、是否化疗、放疗前化疗周期数、肿瘤靶区体积、肿瘤位置、淋巴结位置、肺部受照平均剂量、肺部接受5Gy、10Gy、20Gy、30Gy剂量的体积、患者每日照射剂量、总疗程照射剂量。临床中常用放疗计划中患者肺部受5Gy、20Gy剂量照射体积(V5Gy,V20Gy)及肺部平均受照剂量,来评估放射性肺炎发生情况。但目前尚未建立一个简单有效的模型能够综合各种因素来预测放射性肺炎的发生情况。

技术实现思路

[0004]本专利技术的主要目的在于克服现有技术中的上述缺陷,提出一种基于机器学习的胸部肿瘤放疗后放射性肺炎预测方法,能够结合大量医疗案例数据库,结合患者的临床信息、剂量信息、CT影像组学等多种因素,更加快速、直观地预测胸部肿瘤患者放疗后的放射性肺炎发生情况。
[0005]本专利技术采用如下技术方案:
[0006]一种基于机器学习的胸部肿瘤放疗后放射性肺炎预测方法,包括:
[0007]获取患者数据,所述患者数据包括患者肺部CT影像组学数据、患者临床数据、患者放疗计划剂量学数据;
[0008]将患者数据中非数字的特征进行数字化,并进行特征缺失值预测和冗余特征去除,得到预处理后的患者数据;
[0009]将预处理后的患者数据分为训练集和测试集,训练生成改进的支持向量机模型;
[0010]使用测试集计算工作特征曲线ROC曲线的曲线下面积AUC来评估模型的精度,若曲线下面积大于等于0.9,则验证通过,输出验证通过模型;若曲线下面积小于0.9,则重新生成支持向量机模型;
[0011]将需要预测的患者相关数据输入验证通过模型,对放射性肺炎发生进行预测。
[0012]具体地,所述患者数据包括患者肺部CT影像组学数据、患者临床数据、患者放疗计划剂量学数据,具体为:
[0013]患者肺部CT影像组学数据包括:LLH小波变换下的一阶纹理特征最小值、HHL小波变换下的一阶纹理特征最小值和灰度共生矩阵的自相关性,HHH小波变换下的灰度共生矩阵的自相关性;
[0014]患者临床数据包括:胸部肿瘤放疗患者的年龄、性别、KPS功能状态评分、是否患高血压、是否化疗、放疗前化疗周期数、肿瘤靶区体积、肿瘤位置、淋巴结位置;
[0015]患者放疗计划剂量学数据包括:肺部受照平均剂量、肺部接受5Gy、10Gy、20Gy、30Gy剂量的体积、患者每日照射剂量、总疗程照射剂量。
[0016]具体地,并进行特征缺失值预测和冗余特征去除,具体为:
[0017]采用K最近邻算法对非缺失的患者数据进行拟合,预测特征缺失值;
[0018]根据方差最大化原理,用一组线性无关且相互正交的新向量组表征原来的数据矩阵的行/列,用以压缩特征个数,剔除冗余特征。
[0019]具体地,训练生成改进的支持向量机模型,具体包括:
[0020]训练样本集D={(x1,y1),(x2,y2),

,(x
m
,y
m
)},y
i
∈{

1,+1};m为特征个数;
[0021]引入“软间隔”,允许某些样本不满足约束
[0022]y
i

T
x
i
+b)≥1
[0023]优化目标可以写为
[0024][0025]s.t.y
i

T
x
i
+b)≥1

i
[0026]i≥0,i=1,2,

,m.
[0027]即为改进的支持向量机模型;
[0028]模型中高斯核函数:
[0029][0030]其中,ω和b是模型参数,C称为惩罚系数,γ宽度系数,i为松弛变量,i≥0。
[0031]本专利技术实施例还提供一种基于机器学习的胸部肿瘤放疗后放射性肺炎预测系统,包括:
[0032]获取患者数据模块:获取患者数据,所述患者数据包括患者肺部CT影像组学数据、患者临床数据、患者放疗计划剂量学数据;
[0033]数据预处理模块:将患者数据中非数字的特征进行数字化,并进行特征缺失值预测和冗余特征去除,得到预处理后的患者数据;
[0034]模型训练模块:将预处理后的患者数据分为训练集和测试集,训练生成改进的支持向量机模型;
[0035]模型评估模块:使用测试集计算工作特征曲线ROC曲线的曲线下面积AUC来评估模型的精度,若曲线下面积大于等于0.9,则验证通过,输出验证通过模型;若曲线下面积小于0.9,则重新生成支持向量机模型;
[0036]预测模块:将需要预测的患者相关数据输入验证通过模型,对放射性肺炎发生进行预测。
[0037]具体地,所述患者数据包括患者肺部CT影像组学数据、患者临床数据、患者放疗计划剂量学数据,具体为:
[0038]患者肺部CT影像组学数据包括:LLH小波变换下的一阶纹理特征最小值、HHL小波变换下的一阶纹理特征最小值和灰度共生矩阵的自相关性,HHH小波变换下的灰度共生矩阵的自相关性;
[0039]患者临床数据包括:胸部肿瘤放疗患者的年龄、性别、KPS功能状态评分、是否患高血压、是否化疗、放疗前化疗周期数、肿瘤靶区体积、肿瘤位置、淋巴结位置;
[0040]患者放疗计划剂量学数据包括:肺部受照平均剂量、肺部接受5Gy、10Gy、20Gy、30Gy剂量的体积、患者每日照射剂量、总疗程照射剂量。
[0041]具体地,所述数据预处理模块中,进行特征缺失值预测和冗余特征去除,具体为:
[0042]采用K最近邻算法对非缺失的患者数据进行拟合,预测特征缺失值;
[0043]根据方差最大化原理,用一组线性无关且相互正交的新向量组表征原来的数据矩阵的行/列,用以压缩特征个数,剔除冗余特征。
[0044]具体地,所述模型训练模块中,训练生成改进的支持向量机模型,具体包括:
[0045]训练样本集D={(x1,y1),(x2,y2),

,(x
m
,y
m
)},
i
∈{

1本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于机器学习的胸部肿瘤放疗后放射性肺炎预测方法,其特征在于,包括:获取患者数据,所述患者数据包括患者肺部CT影像组学数据、患者临床数据、患者放疗计划剂量学数据;将患者数据中非数字的特征进行数字化,并进行特征缺失值预测和冗余特征去除,得到预处理后的患者数据;将预处理后的患者数据分为训练集和测试集,训练生成改进的支持向量机模型;使用测试集计算工作特征曲线ROC曲线的曲线下面积AUC来评估模型的精度,若曲线下面积大于等于0.9,则验证通过,输出验证通过模型;若曲线下面积小于0.9,则重新生成支持向量机模型;将需要预测的患者相关数据输入验证通过模型,对放射性肺炎发生进行预测。2.根据权利要求1所述的一种基于机器学习的胸部肿瘤放疗后放射性肺炎预测方法,其特征在于,所述患者数据包括患者肺部CT影像组学数据、患者临床数据、患者放疗计划剂量学数据,具体为:患者肺部CT影像组学数据包括:LLH小波变换下的一阶纹理特征最小值、HHL小波变换下的一阶纹理特征最小值和灰度共生矩阵的自相关性,HHH小波变换下的灰度共生矩阵的自相关性;患者临床数据包括:胸部肿瘤放疗患者的年龄、性别、KPS功能状态评分、是否患高血压、是否化疗、放疗前化疗周期数、肿瘤靶区体积、肿瘤位置、淋巴结位置;患者放疗计划剂量学数据包括:肺部受照平均剂量、肺部接受5Gy、10Gy、20Gy、30Gy剂量的体积、患者每日照射剂量、总疗程照射剂量。3.根据权利要求1所述的一种基于机器学习的胸部肿瘤放疗后放射性肺炎预测方法,其特征在于,并进行特征缺失值预测和冗余特征去除,具体为:采用K最近邻算法对非缺失的患者数据进行拟合,预测特征缺失值;根据方差最大化原理,用一组线性无关且相互正交的新向量组表征原来的数据矩阵的行/列,用以压缩特征个数,剔除冗余特征。4.根据权利要求1所述的一种基于机器学习的胸部肿瘤放疗后放射性肺炎预测方法,其特征在于,训练生成改进的支持向量机模型,具体包括:训练样本集D={(x1,y1),(x2,y2),

,(x
m
,y
m
)},y
i
∈{

1,+1};m为特征个数;引入“软间隔”,允许某些样本不满足约束y
i

T
x
i
+b)≥1优化目标可以写为s.t.y
i

T
x
i
+b)≥1

ii≥0,i=1,2,

,m.即为改进的支持向量机模型;模型中高斯核函数:
其中,ω和b是模型参数,C称为惩罚系数,γ宽度系数,i为松弛变量,i≥0。5.一种基于机器学习的胸部肿瘤放疗后放射性肺炎预测...

【专利技术属性】
技术研发人员:陈思嘉石丽婉李涛高翔康峥李夷民林勤
申请(专利权)人:厦门大学附属第一医院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1