System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于联合模型设计的两阶段黑热病干预效果评估方法技术_技高网

基于联合模型设计的两阶段黑热病干预效果评估方法技术

技术编号:40057823 阅读:9 留言:0更新日期:2024-01-16 22:13
本发明专利技术涉及黑热病的防控效果评价方法,具体为基于联合模型设计的两阶段黑热病干预效果评估方法,首先基于干预前的黑热病时间序列数据建立预测模型,预测干预后的黑热病数据,并通过比较预测值与真实值的差异评价整体干预的效果,在这一阶段,建立了SARIMA‑LSTM组合预测模型,以提高预测模型的准确性、更合理地评价干预效果;其次进一步基于泊松分布的分段回归模型进行中断时间序列分析,并采用谐波回归、改进谐波回归对分段回归模型进行调整以解决传统泊松分段回归模型无法解决黑热病时序数据的季节性、周期性、自相关性等问题的不足,以期更精准地拟合黑热病数据,得到更为准确的评估。

【技术实现步骤摘要】

本专利技术涉及黑热病的防控效果评价方法,具体为基于联合模型设计的两阶段黑热病干预效果评估方法


技术介绍

1、黑热病(kala-azar)又称内脏利什曼病(viszerale leishmaniose),是由杜氏利什曼原虫经白蛉叮咬侵入人体,并寄生于人体的巨噬细胞中导致的慢性地方性丙类传染病。黑热病潜伏期3-6个月,感染后一般表现为持续不规则发热、肝脾肿大、腹泻、贫血、皮肤发黑、腹部隆起等病状及并发症,若不及时治疗,2年内90%以上的病例可因合并感染而死亡,其发生发展常会造成较大的公共卫生问题。

2、黑热病在全球范围内流行,主要集中在巴西、印度、埃塞俄比亚和肯尼亚等中东地区从事农业、畜牧业的人群中。为了合理地评价阳泉市黑热病的防控效果,进一步做好防控工作,选择合适的统计学方法是必要的。公共卫生干预措施常常在某一群体中开展,采用自身前后对照,以感染率、患病率等作为效果评价指标。过去,研究人员通常将实施干预前作为对照组、实施干预后作为观察组,采用t检验、卡方检验等统计学方法进行分析。然而,这些方法无法控制时序数据预先存在的趋势,并且容易忽视发病的季节周期性带来的影响。基于时间序列的预测模型,通过对干预前的数据建模以预测干预后的数据,将预测值与真实值进行比较,从而判断干预的效果;这种方法通过提取过去的时序信息很好地拟合了时序数据预先存在的趋势,从而解决发病的季节周期性带来的影响。季节性自回归移动平均(seasonal autoregressive integrated moving average,sarima)模型是疾病预测中最常用的一种方法。它通过引入自回归项、移动平均项、差分次数、季节自回归项和季节移动平均项从而调整时序数据的不平稳性和季节性,它对于平稳、变化规律的序列预测精度较高,常作为新建模方法的基准评价指标。然而,sarima模型为线性模型,在提取、利用非线性的信息时往往会出一定的局限性,难以完美的拟合时序数据,在使用这些模型进行预测时,预测性能较差,并且sarima模型需要采用差分的方式将不平稳的序列变平稳,这也会损失一定的信息从而造成预测精度的下降。近年来,随着计算机硬件和算法的提升,深度神经网络(deep neural network,dnn)被广泛用于时间序列预测领域。与线性模型相比,dnn具有较强的非线性、映射和自适应特性,能够直接训练和预测数据,对异常值的预测精度较高。循环神经网络(recurrent neural network,rnn)作为深度神经网络的代表性模型,可以有效地捕捉数据之间潜在的特征、并进行精确地推断和预测,是处理时序数据最强大的工具之一。但是,当时间序列较长时,rnn会出现梯度消失及长期记忆能力不足的问题。长短期记忆神经网络(long-short term memory,lstm)于1997年由jürgen schmidhuber等人提出,引入了独特的记忆单元结构,可以很好地弥补rnn的不足,更适合处理长时间序列数据。在2017年,li wei等人使用支持向量机、朴素贝叶斯、决策树、多层感知器、rnn和lstm六种模型对我国2008-2015年的股票数据进行预测,结果表明:多层感知器,rnn,lstm等深度神经网络模型的性能较好。

3、

4、在实际生活中,时间序列数据通常被认为是由线性和非线性两部分组成,单一的线性模型和非线性模型都不能充分地提取时序数据中所存在的所有信息。基于此,众多学者提出由线性和非线性模型组成的混合模型。在2016年,0liveira提出了arima-svr混合模型,使用arima模型拟合时序数据中线性部分,使用svr模型拟合非线性部分;结果证明,arima-svr混合模型可以有效提高模型的拟合、预测精度。在2021年zhai等人使用arima-ernn、arima-bpnn混合模型预测我国山西省布病,结果表明arima-ernn、arima-bpnn混合模型的拟合、预测性能均优于单一的arima模型。由此可以看出,综合使用线性模型与非线性模型进行组合的建模方法可以完美地提取时序数据信息、提高模型的性能,是一种有效的建模思路。因此,本专利技术尝试使用干预前的黑热病数据建立sarima-lstm组合预测模型对干预后的数据进行预测,并将预测值与实际值进行比较,以期更合理地评价黑热病干预的效果。

5、虽然基于时间序列的预测模型评价干预效果的方法可以很好地拟合时序数据预先存在的趋势、解决发病的季节周期性带来的影响,但是,这种方法无法客观地反映公共卫生干预措施存在的长、短期效果,无法进行准确的参数估计。中断时间序列设计(interrupted time series analysis,itsa)是一种在明确的时间点来评估干预措施有效性的准实验设计,近年来,中断时间序列设计常被用于定量地评价公共卫生措施效果。分段回归分析是在中断时间序列研究中评价干预效果的一种强有力的统计方法,它可以将干预效果定量地分为短期和长期效果,反应干预效果是及时或延迟、持续或短暂从而直观的显示干预效果的动态变化,它还可以根据不同的数据类型构建不同的分段回归模型,如线性分段回归模型、泊松分段回归模型等。自2000年以来,在pubmed数据库检索到的关itsa和分段回归分析的文章呈指数增长。a.k.wagner等人使用itsa分析1980年1月-1983年12月的四年时间里,两种药物支出干预政策在药物支出水平上的影响,结果表明两种政策的干预效果均有效。james lopez bernal等人使用itsa分析2005年1月10日意大利全国公共场所禁烟政策对血管紧张素转换酶抑制剂(aces)使用的干预效果,结果表明禁烟令的短期干预效果有效。分段回归分析要求时间序列平稳且不存在自相关性,如果建立的模型未能纠正自相关,这可能使模型参数估计值的标准误偏小,从而高估了干预的效果。

6、然而,一些疾病发病往往伴随着明显的季节性,这种季节性会使时间序列不平稳,产生自相关;例如,某一月份的发病率与一年前同一月份的发病率更相加相似。同时,如果干预前后发病率在各月份分布不均匀,也可能会使研究结果出现明显的偏差。因此,当序列存在明显的季节周期性时,合理地加以控制才能使干预效果的评估更加真实可靠。时间序列数据通常使用两种建模方法来调整序列的季节性。一种是时域法(time domainapproach),它将时间序列视为时间函数,通过探索序列发展的趋势从而拟合模型,时域法常构建sarima模型。另一种是频域法(frequency domain approach),它基于一个假设,即时间序列的数据可以分解为多个周期函数。频域法通常构建包含正、余弦函数项的回归模型,即谐波回归模型(harmonic regression),标准的正、余弦函数是光滑、对称的,因此可以拟合时序数据中波峰、波谷的周期性变化从而调整序列的季节性。2017年,margaret等人使用泊松谐波回归模型拟合澳大利亚的罗斯河病、布鲁氏菌病以及登革热序列中季节周期性部分并进行预测,结果显示泊松谐波回归模型可以很好的拟合数据的特征,预测性能更优。hongj本文档来自技高网...

【技术保护点】

1.基于联合模型设计的两阶段黑热病干预效果评估方法,其特征在于:

2.根据权利要求1所述的基于联合模型设计的两阶段黑热病干预效果评估方法,其特征在于:第一阶段数据预处理时,当原始数据时间序列为不平稳序列且为非白噪声时,进行差分使时间序列变为平稳后进行建模。

3.根据权利要求2所述的基于联合模型设计的两阶段黑热病干预效果评估方法,其特征在于:SARIMA模型构建时,采用Python网格搜索自动拟合SARIMA模型,赤池信息准则最小选择相对最优模型,通过模型残差白噪声Ljung-Box检验判断模型是否拟合成功,采用最大似然估计对模型进行参数检验。

4.根据权利要求3所述的基于联合模型设计的两阶段黑热病干预效果评估方法,其特征在于:LSTM模型构建时,残差数据先进行归一化,再采用滑动窗口法进行重构,重构的数据分为训练集和测试集。

5.根据权利要求1或2或3或4所述的基于联合模型设计的两阶段黑热病干预效果评估方法,其特征在于:LSTM模型的隐含层节点数其中,m和n分别为输入层和输出层的节点数,a为1-10之间的常数。

6.根据权利要求1或2或3或4所述的基于联合模型设计的两阶段黑热病干预效果评估方法,其特征在于:第二阶段检验平稳性时,采用ADF检验、自相关图判断序列的平稳,ADF检验的P值小于0.05代表序列平稳,自相关系数快速衰减为0或在某阶后变为0可判断为平稳序列。

...

【技术特征摘要】

1.基于联合模型设计的两阶段黑热病干预效果评估方法,其特征在于:

2.根据权利要求1所述的基于联合模型设计的两阶段黑热病干预效果评估方法,其特征在于:第一阶段数据预处理时,当原始数据时间序列为不平稳序列且为非白噪声时,进行差分使时间序列变为平稳后进行建模。

3.根据权利要求2所述的基于联合模型设计的两阶段黑热病干预效果评估方法,其特征在于:sarima模型构建时,采用python网格搜索自动拟合sarima模型,赤池信息准则最小选择相对最优模型,通过模型残差白噪声ljung-box检验判断模型是否拟合成功,采用最大似然估计对模型进行参数检验。

4.根据权利要求3所述的基于联合模...

【专利技术属性】
技术研发人员:王旭春仇丽霞任浩乔宇超崔宇赵执扬
申请(专利权)人:山西医科大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1