一种基于机器学习预测预警感染性疾病就医人数突增的方法技术

技术编号:26973810 阅读:44 留言:0更新日期:2021-01-06 00:07
本发明专利技术是一种基于机器学习预测预警感染性疾病就医人数突增的方法,实现多点监测,多特征的患感染性疾病疫情突增的动态分析预测和灵敏预警。该方法涉及数据统计学、人工智能等领域。本发明专利技术方法包括:选取多个医疗机构的每日就医感染性疾病人数和每日的最低气温作为输入特征;选用机器学习模型LightGBM作为训练模型动态预测来日的感染性疾病就医人数;对就医人数的预测值与前M天的真实值进行数据统计分析,提出感染性疾病就医人数突增的预警算法。本发明专利技术方法避免了基于单监测点、单一特征时间序列或时态事件对疾病演化过程建模信息损失问题,有效提升了对感染性疾病就医人数预测的精准性和就医人数突增预警的灵敏性。

【技术实现步骤摘要】
一种基于机器学习预测预警感染性疾病就医人数突增的方法
本专利技术属于数据统计学、人工智能、医疗信息化等领域,涉及一种基于机器学习预测预警感染性疾病就医人数突增的方法。
技术介绍
近年来,利用机器学习技术实现对流感等疾病的预测已经成为热点研究问题,特别是今年新冠状病毒肺炎大流行为全人类带来了巨大灾难。如何做到“早发现,早预防,早治疗,早控制”,特别是“早发现”是一项紧迫任务。目前,业内技术的主要问题是单点静态数据研究多,没有形成多点协同触发、动态灵敏的预警研判模式;缺少环境气候关键数据特征等。造成预测精度不高,预警灵敏度低等问题。
技术实现思路
本专利技术的目的在于提供一种基于机器学习预测预警感染性疾病就医人数突增的方法,实现多点监测,多特征的患感染性疾病疫情突增的动态分析预测和灵敏预警。为了达到上述目的,本专利技术的实现方式是:使用K个医疗机构的前N年每日感染性疾病就医人数和前N年每日最低气温作为特征,构成K*(2*N*365)个数据特征训练样本集。使用上述训练样本,训练构建机器学习LightGBM模型,形成了基于机器学习的预测感染性疾病就医人数的方法。LigthGBM是一种梯度提升框架,采用损失函数的负梯度作为当前决策树的残差近似值,去拟合新的决策树。使用K个医疗机构的前M天的感染性疾病就医人数和最低气温作为训练后的LightGBM动态模型的输入,动态预测来日的感染性疾病就医人数P预测。依据预测的感染性疾病就医人数,计算其预警指数,如下:Q=(P预测-P前日)/STD(P前m日)其中,Q为预警指数,P预测为来日T的预测值,P前日为T-1天的真实数据,STD(P前M日)为T-1,T-2,。。。T-M天的真实数据的样本标准差。依据预警指数Q≥σ,σ为预警指数阈值,判断为来日的感染性疾病就医人数将会出现突增。将来日的感染性疾病就医人数突增告警通过建设基于机器学习预测预警感染性疾病就医人数突增可视化平台进行及时发布预警。可选地,所述的基于机器学习预测预警感染性疾病就医人数突增可视化系统进行多点动态分析预测,灵敏预警和告警呈现的设计思路。可选地,所述的样本数据通过网络及自定义的接口协议,上传到基于机器学习预测预警感染性疾病就医人数突增可视化系统平台。可选地,所述的使用前M=9天的感染性疾病就医人数和最低气温作为训练后的LightGBM模型的输入,动态预测来日的感染性疾病就医人数的准确性和预警灵敏度最高。可选地,所述的预警指数阈值σ,在基于机器学习预测预警感染性疾病就医人数突增可视化系统平台中设定为100%,即预警指数Q为样本标准差的一倍以上的,判断为突增。可选地,所述的基于机器学习预测预警感染性疾病就医人数突增可视化系统已实现网络化、系统化,可实时在线实现同地或异地的多家医疗机构对感染性疾病就医人数突增预测预警。由于采用上述方法,本专利技术的有益效果是:本专利技术是一种基于机器学习预测预警感染性疾病就医人数突增的方法,实现多点监测,多特征的患感染性疾病疫情突增的动态分析预测和灵敏预警。本专利技术方法包括:选取多个医疗机构的每日感染性疾病就医人数和每日的最低气温作为输入特征;选用机器学习模型LightGBM作为训练模型预测来日的就医感染性疾病人数;对就医人数预测值与前M天的真实值进行数据统计分析,提出感染性疾病就医人数突增的预警算法。本专利技术方法避免了基于单监测点、单一特征时间序列或时态事件对疾病演化过程建模信息损失问题,有效提升了对感染性疾病就医人数的预测精准性和就医人数突增预警的灵敏性。是建设协同综合、灵敏可靠的公共卫生监测预警体系的核心技术。附图说明图1是本专利技术一种基于机器学习预测预警感染性疾病就医人数突增方法的总流程图;图2是本专利技术基于机器学习预测感染性疾病就医人数突增的动态更新预测模型流程图;具体实施方式以下结合附图所示实施例对本专利技术作进一步的说明。以下实例将有助于本领域的技术人员进一步理解本专利技术,但不以任何形式限制本专利技术。应当指出的是,对本领域的普通技术人员来说,在不脱离本专利技术构思的前提下,还可以做出若干变化和改进。这些都属于本专利技术的保护范围。本专利技术提供一种基于机器学习预测预警感染性疾病就医人数突增的方法,实现多点监测,多特征的患感染性疾病疫情突增的动态分析预测和灵敏预警。该方法选取多个医疗机构的每日感染性疾病就医人数和每日的最低气温作为输入特征;选用机器学习模型LightGBM作为训练模型预测来日的就医感染性疾病人数;对就医人数预测值与前M天的真实值进行数据统计分析,提出感染性疾病就医人数突增的预警算法。告警信息在基于机器学习预测预警感染性疾病就医人数突增可视化系统平台上的告警窗口呈现。该方法包括以下步骤:(1)使用K个医疗机构的前N年每日感染性疾病就医人数和前N年每日最低气温作为特征,构成K*(2*N*365)个数据特征训练样本集。本实施例中,计算所述的每日感染性疾病就医人数与当日的最低气温的Pearson相关系数其中,Cov(X,Y)为X、Y的协方差,Var[X]为X的方差,Var[Y]为Y的方差。可得出每日感染性疾病就医人数与当日的最低气温有较强的负相关性。(2)使用上述训练样本,训练构建机器学习LightGBM模型,形成了基于机器学习的预测感染性疾病就医人数的方法。LigthGBM是一种梯度提升框架,采用损失函数的负梯度作为当前决策树的残差近似值,去拟合新的决策树。本实施例中,LightGBM的目标函数是:其中式中的n代表样本个数,yi代表第i个样本的真实值,·1(yi,Yi)代表第i个样本的训练损失,对于回归任务通常选择平方误差损失函数,Ω(fk(xi))是正则化惩罚项,K代表树的总数。γ是叶子节点数量的惩罚系数,T是叶子节点的个数,wt是第t个叶子节点的得分,λ是L2正则化系数。因为叶子节点过多时,会有过拟合的风险,因此γT项是为了限制叶子节点的数量。LightGBM在每轮训练中加入一个新的决策树至模型,对于决策树的训练,利用信息增益选择树节点的分裂点。(3)使用K个医疗机构的前M天的感染性疾病就医人数和最低气温作为训练后的LightGBM模型的输入,预测来日的感染性疾病就医人数P预测。本实施例中,采用动态预测模型:在测试集上的预测,利用了动态模型,每次有新的测试数据时,加入已有数据重新训练模型,再进行预测。其步骤框图,如图2所示。可选地,使用前M=9天的感染性疾病就医人数和最低气温作为训练后的LightGBM模型的输入,动态预测来日的感染性疾病就医人数的准确性和预警灵敏度最高。(4)依据预测的感染性疾病就医人数,计算其预警指数。本实施例中,采用下式计算,Q=(P预测-P前日)/STD(P前m日)其中,Q为预警指数,P预测为来日T的预测值,P前日为T-1天的真实数据,STD(P前M日)为T-1,T-2,。。。T-M天的真实数据的样本标准差。(5)依据预警指本文档来自技高网...

【技术保护点】
1.一种基于机器学习预测预警感染性疾病就医人数突增的方法,实现多点监测,多特征的患感染性疾病疫情突增的动态分析预测和灵敏预警。其特征在于,包括以下几个步骤:/n步骤一:使用K个医疗机构的前N年每日感染性疾病就医人数和前N年每日最低气温作为特征,构成K*(2*N*365)个数据特征训练样本集。/n步骤二:使用上述训练样本构建机器学习LightGBM(Light Gradient BoostingMachine)模型,形成了基于机器学习的预测感染性疾病就医人数的方法。/n步骤三:使用K个医疗机构的前M天的感染性疾病就医人数和最低气温作为训练后的LightGBM模型的输入,预测来日的感染性疾病就医人数P预测。/n步骤四:依据预测的感染性疾病就医人数,计算其预警指数,如下:/nQ=(P

【技术特征摘要】
1.一种基于机器学习预测预警感染性疾病就医人数突增的方法,实现多点监测,多特征的患感染性疾病疫情突增的动态分析预测和灵敏预警。其特征在于,包括以下几个步骤:
步骤一:使用K个医疗机构的前N年每日感染性疾病就医人数和前N年每日最低气温作为特征,构成K*(2*N*365)个数据特征训练样本集。
步骤二:使用上述训练样本构建机器学习LightGBM(LightGradientBoostingMachine)模型,形成了基于机器学习的预测感染性疾病就医人数的方法。
步骤三:使用K个医疗机构的前M天的感染性疾病就医人数和最低气温作为训练后的LightGBM模型的输入,预测来日的感染性疾病就医人数P预测。
步骤四:依据预测的感染性疾病就医人数,计算其预警指数,如下:
Q=(P预测-P前日)/STD(P前m日)
其中,Q为预警指数,P预测为来日T的预测值,P前日为T-1天的真实数据,STD(P前M日)为T-1,T-2,。。。T-M天的真实数据的样本标准差。
步骤五:依据预警指数Q≥σ,σ为预警指数阈值,判断为来日的感染性疾病就医人数将会出现突增。
步骤六:将来日的感染性疾病就医人数突增告警通过建设基于机器学习预测预警感染性疾病就医人数突增可视化平...

【专利技术属性】
技术研发人员:刘源朱怡婧
申请(专利权)人:上海玺翎智能科技有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1