【技术实现步骤摘要】
一种优化LSTM和LightGBM参数的流感预测系统、存储介质和装置
本专利技术属于人工智能、数据统计学、医疗信息化等领域,涉及一种用于预流感的多变量LSTM和LightGBM调参系统、存储介质和装置。
技术介绍
目前对于流感的趋势预测已有一些进展,例如对流感爆发趋势进行预测,主要采用线性回归模型、时间序列模型等进行预测,这些预测方式以历史流感人数数据对模型进行训练,虽然一定程度上考量了诸如环境因素、天气因素等对流感病例的百分比造成一定程度影响的外部特征,但也仅是对爆发趋势的预测,并不能准确找出一定范围人群中的易感者。现有技术中已出现通过长短记忆网络LSTM(LongShortTermMemorynetworks,LSTM)进行疾病预测的技术方案,但通过该方法仅能得到疾病爆发趋势的预测结果,并不能将群体中的易感者抓取出来,且预测均是基于一般LSTM模型进行的,输入的是单一的时间序列导致预测结果不够准确;若采用多时间序列数据,LSTM模型大计算速度慢,难于收敛,导致无法在预期时间内获得预测结果。LightGBM算法作为对目前工业界已广泛应用的GBDT算法的改进,以决策树为基学习器,通过使用直方图算法寻找决策树的最佳分裂结点,并使用带深度限制的叶子生长策略(leaf_wise)分裂结点,有效解决了GBDT算法在面对特征维度很高或者数据量很大时存在的效率过低问题。但目前基于该算法得到的概率,并未考虑到算法本身存在的诸如过拟合等问题对预测结果带来的不良影响,在一定程度上也影响了预测的准确性。< ...
【技术保护点】
1.一种优化LSTM和LightGBM参数的流感预测系统,其特征在于,包括LSTM模块、LightGBM模块、预测模块;/n所述LSTM模块被配置为基于历史因素数据及外部因素数据,采用LSTM计算聚集群体中流感感染人数的预测值n;/n所述LSTM的参数确定方法包括:/nS11设定LSTM网络层数、每层网络隐藏节点数、随机删除隐藏节点率、感染人数观测步长的初始值;/nS12以最小化测试集上的预设函数作为LSTM的网络的目标函数;/nS13采用贝叶斯优化对LSTM的网络进行优化;/nS14返回贝叶斯优化后的预设函数,确定对应的LSTM的网络的LSTM网络层数、每层网络隐藏节点数、随机删除隐藏节点率、感染人数观测步长的初始值;/nS15将S14获得的LSTM的网络的LSTM网络层数、每层网络隐藏节点数、随机删除隐藏节点率、感染人数观测步长作为LSTM的参数;/n所述LightGBM模块被配置为基于健康情况数据及周围环境数据采用LightGBM计算聚集群体中每个人感染流感的概率
【技术特征摘要】 【专利技术属性】
1.一种优化LSTM和LightGBM参数的流感预测系统,其特征在于,包括LSTM模块、LightGBM模块、预测模块;
所述LSTM模块被配置为基于历史因素数据及外部因素数据,采用LSTM计算聚集群体中流感感染人数的预测值n;
所述LSTM的参数确定方法包括:
S11设定LSTM网络层数、每层网络隐藏节点数、随机删除隐藏节点率、感染人数观测步长的初始值;
S12以最小化测试集上的预设函数作为LSTM的网络的目标函数;
S13采用贝叶斯优化对LSTM的网络进行优化;
S14返回贝叶斯优化后的预设函数,确定对应的LSTM的网络的LSTM网络层数、每层网络隐藏节点数、随机删除隐藏节点率、感染人数观测步长的初始值;
S15将S14获得的LSTM的网络的LSTM网络层数、每层网络隐藏节点数、随机删除隐藏节点率、感染人数观测步长作为LSTM的参数;
所述LightGBM模块被配置为基于健康情况数据及周围环境数据采用LightGBM计算聚集群体中每个人感染流感的概率,由大到小排序获得感染概率序列;
所述预测模块被配置为选取感染流感概率最高的前n个人为高风险人群。
2.据权利要求1所述的优化LSTM和LightGBM参数的流感预测系统,其特征在于:所述预设函数为:
,
或,
,
或,
;
其中,,为三种预设函数,为真实值,为预测值,m为学生总数。
3.据权利要求1所述的优化LSTM和LightGBM参数的流感预测系统,其特征在于:所述LightGBM的参数确定方法包括:
S21计算训练集绝对平方误差TRAIN_MAE及测试集绝对平方误差TEST_MAE;
S22根据训练集绝对平方误差TRAIN_MAE及测试集绝对平方误差TEST_MAE的差确定LightGBM的参数:最大深度MAX_DEPTH、健康情况数据及周围环境数据的采样比例COLSAMPLE_BYLEVEL。
4.根据权利要求3所述的优化LSTM和LightGBM参数的流感预测系统,其特征在于:所述步骤S22进一步包括:
若,
则,
若,
则;
若,
则,
技术研发人员:吴和俊,王敏康,王玲,傅天涯,
申请(专利权)人:杭州华网信息技术有限公司,
类型:发明
国别省市:浙江;33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。