一种基于时间窗的COPD急性加重预测方法技术

技术编号:32133493 阅读:12 留言:0更新日期:2022-01-29 19:37
本发明专利技术公开了一种基于时间窗的COPD急性加重预测方法,S1、利用小肺仪,电子听诊器等设备收集患者每日两次(早晨和下午)的肺部指标;S2、为了支持的模型可以预测T+1,T+2,T+3天,且为了保持模型的易用性;S3、根据上述特征提取更多特征,这些特征能够反映患者的肺部监控指标的变化情况;S4、将一次病情加重(及其前7天)作为一个正样本;S5、对特征进行显著性检验;S6、使用上述235个显著性特征作为模型输入其参数,预测T+d日(d=1,2,3)是否加重,使用一个时间窗的肺部监测数据对患者是否有COPD急性加重风险进行预测,患者可以居家就能自我监控,对COPD患者居家照顾有重要意义。对COPD患者居家照顾有重要意义。对COPD患者居家照顾有重要意义。

【技术实现步骤摘要】
一种基于时间窗的COPD急性加重预测方法


[0001]本专利技术涉及COPD急性加重预测
,具体涉及一种基于时间窗的COPD急性加重预测方法。

技术介绍

[0002]慢性阻塞性肺疾病(下文称为“COPD”)是一种慢性支气管炎、引起肺泡结构损伤的疾病的肺气肿、或者两者出现的混合并且从支气管到肺泡的气道关闭的疾病;这种疾病的症状包括:长期咳嗽带痰、由于气道阻塞引起的空气流速下降而导致的呼吸困难以及常见的呼吸道感染(诸如,普通感冒);这种疾病在全球造成了高死亡率,并且由于吸烟、空气污染等迅速增加;COPD的病因是肺对有毒分子或气体以及复杂地参与了COPD的各种因素(诸如,吸烟、城市化、污染、传染性呼吸系统疾病等)的异常的慢性炎症反应。
[0003]临床参数的组合已经被用于预测患者的COPD急性加重;但是,这些临床参数不足以准确适用于各个病例的预测;此外,尽管COPD患者由于上述因素在去医院后可能会出现急性加重的可能性,但是COPD患者无法预测他们自己的急性加重的可能性;因此,COPD患者在COPD急性加重发生后去医院可能会导致不良结果。
[0004]目前虽然已有文献使用统计学或机器学习手段对COPD急性加重事件进行预测,但是目前本领域文献的缺陷如下:
[0005]1、现有研究主要还是横截面数据,未能使用时间序列数据对患者的COPD急性加重事件进行实时预警;
[0006]2、目前的研究没有进行系统的特征挖掘,提升模型的预测能力;
[0007]3、目前的研究无法做出T+1,T+2,T+3的预测,现有模型只能预测患者未来加重的风险概率。

技术实现思路

[0008]本专利技术的目的在于提供一种基于时间窗的COPD急性加重预测方法,使用一个时间窗的肺部监测数据对患者是否有COPD急性加重风险进行T+d日(d=1,2,3)预测,患者可以居家就能自我监控,自我预警,操作简单,这对COPD患者居家照顾有重要意义,以解决上述
技术介绍
中提出的问题。
[0009]为实现上述目的,本专利技术提供如下技术方案:
[0010]一种基于时间窗的COPD急性加重预测方法,包括如下步骤:
[0011]S1、利用小肺仪,电子听诊器等设备收集患者每日两次(早晨和下午)的肺部指标,如FVC,FEV1,听诊器收集的肺部震动的能量最大值,所述FVC采用仪器“小肺仪”,获取用力肺活量,是指尽力最大吸气后,尽力尽快呼气所能呼出的最大气量;所述FEV1采用仪器“小肺仪”,获取最大深吸气后做最大呼气,最大呼气第一秒呼出的气量的容积;所述PEF采用仪器“小肺仪”,获取指用力肺活量测定过程中,呼气流量最快时的瞬间流速;
[0012]S2、为了支持的模型可以预测T+1,T+2,T+3天,且为了保持模型的易用性,使用固
定的时间窗口(7天)的患者肺部监控指标进行预测,通过电子设备收集患者每日早晨和晚上的32种指标,将五日时间窗的这些指标区分日期和是否早晨,则特征数量为32
×7×
2=448个;
[0013]S3、根据上述特征提取更多特征,这些特征能够反映患者的肺部监控指标的变化情况;数据扩充包括:指标滑窗统计量,如3日均值/方差,5日均值/方差;隔日指标差值;扩充后特征数有1744个;
[0014]S4、将一次病情加重(及其前7天)作为一个正样本;对于负样本,规定时间窗不能包括急性发作时期的前后30天,以防止病情对监控指标造成影响;负样本由数据中采样所有能够连续观测的7天的数据生成;
[0015]S5、对特征进行显著性检验,发现有235个特征对T+d日(d=1,2,3)是否加重有显著相关性;
[0016]S6、使用上述235个显著性特征作为模型输入其参数,预测T+d日(d=1,2,3)是否加重;所述模型采用基于决策树的集成模型:xgboost、lightgbm以及catboost,并采用5折交叉验证对模型效果进行评估。
[0017]优选的,所述XGBoost模型的解释方法,包括以下步骤:
[0018](1)对XGBoost模型进行树模型元结构解析,以解析出每个单棵树的树结构;
[0019](2)对所述XGBoost模型输入测试样本,根据树结构获取所述测试样本对应的有效叶子节点以及有效叶子节点的树的有效路径;
[0020](3)根据有效路径计算出特征的贡献值,并根据获取到的贡献值对所述XGBoost模型进行解释。
[0021]优选的,所述XGBoost利用的是Boosting集成方法,大量用于数据挖掘,XGBoost可对缺失值进行处理、将特征正则化,从而实现对代价函数二阶加速优化的功能。
[0022]优选的,所述LightGBM是一种新的梯度提升树框架,支持GBDT、GBRT、GBM以及MART的算法,所述LightGBM是基于DMTK框架的分布式培训的完整解决方案。
[0023]优选的,所述Catboost算法包括:在感知周期内,次用户把感知到的信道中能量值发送到融合中心作为特征能量向量,主用户间断性发送占用频谱资源与否的信息给融合中心作为标签,这样完成了训练数据集的构建。在融合中心中用Catboost算法训练模型。
[0024]优选的,所述Catboost算法由Yandex提出,Catboost算法优化了类别特征的处理,并且是在训练阶段处理而不是数据预处理阶段,在选择树模型的时候计算叶子节点值,减少过拟合。
[0025]优选的,预测期时长以八天为一个时间窗截取正样本,这八天记为(T

7,T

6,T

5,T

4,T

3,T

2,T

1,T),对于正样本,第T天为急性加重发作开始日期;对于负样本,规定时间窗不能包括急性发作时期的前后7天。
[0026]优选的,所述预测期为了达到提前预警的作用,提前设置3组预测任务:
[0027](1)Task_1,采用T

5天到T

1天的观察值,预测第T天是否急性加重;
[0028](2)Task_2,采用T

6天到T

2天的观察值,预测第T天是否急性加重;
[0029](3)Task_3,采用T

7天到T

3天的观察值,预测第T天是否急性加重。
[0030]优选的,为减少特征数量,对特征做Kolmogorov

Smirnov检验,该检验可以比较两个分布是否相同,再将每个特征在正样本上的分布和负样本上的分布做检验,取置信度
0.05。
[0031]综上所述,由于采用了上述技术,本专利技术的有益效果是:
[0032]1.本专利技术可以对T+d日(d=1,2,3)是否有copd急性加重进行预测预警,使用一个时间窗的肺部监测数据对患者是否有COPD急本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于时间窗的COPD急性加重预测方法,其特征在于,该预测方法包括如下步骤:S1、利用小肺仪,电子听诊器等设备收集患者每日两次(早晨和下午)的肺部指标,如FVC,FEV1,听诊器收集的肺部震动的能量最大值,所述FVC采用仪器“小肺仪”,获取用力肺活量,是指尽力最大吸气后,尽力尽快呼气所能呼出的最大气量;所述FEV1采用仪器“小肺仪”,获取最大深吸气后做最大呼气,最大呼气第一秒呼出的气量的容积;所述PEF采用仪器“小肺仪”,获取指用力肺活量测定过程中,呼气流量最快时的瞬间流速;S2、为了支持的模型可以预测T+1,T+2,T+3天,且为了保持模型的易用性,使用固定的时间窗口(7天)的患者肺部监控指标进行预测,通过电子设备收集患者每日早晨和晚上的32种指标,将五日时间窗的这些指标区分日期和是否早晨,则特征数量为32
×7×
2=448个;S3、根据上述特征提取更多特征,这些特征能够反映患者的肺部监控指标的变化情况;数据扩充包括:指标滑窗统计量;隔日指标差值;S4、将一次病情加重(及其前7天)作为一个正样本;对于负样本,规定时间窗不能包括急性发作时期的前后30天,以防止病情对监控指标造成影响;负样本由数据中采样所有能够连续观测的7天的数据生成;S5、对特征进行显著性检验,发现有235个特征对T+d日(d=1,2,3)是否加重有显著相关性;S6、使用上述235个显著性特征作为模型输入其参数,预测T+d日(d=1,2,3)是否加重;所述模型采用基于决策树的集成模型:xgboost、lightgbm以及catboost,并采用5折交叉验证对模型效果进行评估。2.根据权利要求1所述的一种基于时间窗的COPD急性加重预测方法,其特征在于:所述XGBoost模型的解释方法,包括以下步骤:(1)对XGBoost模型进行树模型元结构解析,以解析出每个单棵树的树结构;(2)对所述XGBoost模型输入测试样本,根据树结构获取所述测试样本对应的有效叶子节点以及有效叶子节点的树的有效路径;(3)根据有效路径计算出特征的贡献值,并根据获取到的贡献值对所述XGBoost模型进行解释。3.根据权利要求1所述的一种基于时间窗的COPD急性加重预测方法,其特征在于:所述XGBoost利用的是Boosting集成方法,大量用于数据挖掘,XGBoost可对缺失值进行处理、将特征正则化,从而实现对代价函数二阶加速优化的功能。4.根据权利要求1所述的一种基于时间窗...

【专利技术属性】
技术研发人员:王琨朱威李强陆银美侯应伟
申请(专利权)人:无锡启益医疗科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1