神经网络模型的训练方法、装置、电子设备及存储介质制造方法及图纸

技术编号:39261681 阅读:9 留言:0更新日期:2023-10-30 12:14
本公开提出了一种神经网络模型的训练方法、装置、电子设备及存储介质,涉及深度学习技术领域,包括:获取训练数据集,其中,所述训练数据集中包含待预测城市在指定时期内的新增异常数据;将所述训练数据集输入至预先构建的预测模型中进行迭代训练,直至迭代次数达到预设阈值停止训练,其中,所述预测模型是CNN模型和双向长短期记忆模型融合构建的模型;基于预先选择的误差函数模型对所述预测模型进行评估,直至所述预测模型所对应的误差值满足预设条件,确定所述预测模型为训练完成的预测模型。由此,可以使得训练生成的预测模型能够对新增阳性人数进行预测,实现对数据时序特征的提取,同时实现对预测精度的提高,有助于对数据进行精确化管理。据进行精确化管理。据进行精确化管理。

【技术实现步骤摘要】
神经网络模型的训练方法、装置、电子设备及存储介质


[0001]本公开涉及深度学习
,尤其涉及一种神经网络模型的训练方法、装置、电子设备及存储介质。

技术介绍

[0002]预测新增阳性病例人数已成为当今最为关注的问题之一。深度学习技术在这方面发挥了重要作用。其基于多层神经网络的模型可以自动地从大量数据中提取特征,对未来的趋势进行预测。具体来说,深度学习模型可以通过历史病例数据、天气、交通和社会活动等因素建立数据模型,并通过模型进行预测。此外,深度学习模型可以不断地学习新的数据,提升预测的准确性。因此,利用深度学习技术进行新增阳性病例人数预测是一种高效、准确、可持续的方法。
[0003]相关技术,可以使用CNN模型可以从历史数据中提取特征,但是它无法考虑增加阳性病例背后的原因,且模型泛化能力较差。这可能会使得模型预测出的结果缺乏解释力,不能直接用于制定公共卫生管理措施。

技术实现思路

[0004]本公开旨在至少在一定程度上解决相关技术中的技术问题之一。
[0005]本公开第一方面实施例提出了一种神经网络模型的训练方法,包括:
[0006]获取训练数据集,其中,所述训练数据集中包含待预测城市在指定时期内的新增异常数据;
[0007]将所述训练数据集输入至预先构建的预测模型中进行迭代训练,直至迭代次数达到预设阈值停止训练,其中,所述预测模型是CNN模型和双向长短期记忆模型融合构建的模型;
[0008]基于预先选择的误差函数模型对所述预测模型进行评估,直至所述预测模型所对应的误差值满足预设条件,确定所述预测模型为训练完成的预测模型。
[0009]本公开第二方面实施例提出了一种神经网络模型的训练装置,包括:
[0010]获取模块,用于获取训练数据集,其中,所述训练数据集中包含待预测城市在指定时期内的新增异常数据;
[0011]训练模块,用于将所述训练数据集输入至预先构建的预测模型中进行迭代训练,直至迭代次数达到预设阈值停止训练,其中,所述预测模型是CNN模型和双向长短期记忆模型融合构建的模型;
[0012]评估模块,用于基于预先选择的误差函数模型对所述预测模型进行评估,直至所述预测模型所对应的误差值满足预设条件,确定所述预测模型为训练完成的预测模型。
[0013]本公开第三方面实施例提出了一种电子设备,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时,实现如本公开第一方面实施例提出的神经网络模型的训练方法。
[0014]本公开第四方面实施例提出了一种非临时性计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时实现如本公开第一方面实施例提出的神经网络模型的训练方法。
[0015]本公开提供的神经网络模型的训练方法、装置、设备及存储介质,存在如下有益效果:
[0016]本公开实施例中,该装置首先获取训练数据集,其中,所述训练数据集中包含待预测城市在指定时期内的新增异常数据,之后将所述训练数据集输入至预先构建的预测模型中进行迭代训练,直至迭代次数达到预设阈值停止训练,其中,所述预测模型是CNN模型和双向长短期记忆模型融合构建的模型,最后基于预先选择的误差函数模型对所述预测模型进行评估,直至所述预测模型所对应的误差值满足预设条件,确定所述预测模型为训练完成的预测模型。由此,可以使得训练生成的预测模型能够对新增阳性人数进行预测,实现对数据时序特征的提取,同时实现对预测精度的提高,有助于对数据进行精确化管理。
[0017]本公开附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本公开的实践了解到。
附图说明
[0018]本公开上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
[0019]图1为本公开实施例所提供的一种神经网络模型的训练方法的流程示意图;
[0020]图2为本公开实施例所提供的一种神经网络模型的训练方法的流程示意图;
[0021]图3为本公开实施例所提供的一种神经网络模型的训练装置的结构框图;
[0022]图4示出了适于用来实现本公开实施方式的示例性计算机设备的框图。
具体实施方式
[0023]下面详细描述本公开的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本公开,而不能理解为对本公开的限制。
[0024]下面参考附图描述本公开实施例的神经网络模型的训练方法、装置、计算机设备和存储介质。
[0025]需要说明的是,本公开实施例中的神经网络模型的训练方法的执行主体为神经网络模型的训练装置,该装置可以由软件和/或硬件的方式实现,该装置可以配置在任意电子设备中,比如计算机。在本公开提出的场景中,下面将以“神经网络模型的训练装置”作为执行主体对本公开实施例中提出的神经网络模型的训练方法进行说明,在此不进行限定。
[0026]图1为本公开实施例所提供的神经网络模型的训练方法的流程示意图。
[0027]如图1所示,该神经网络模型的训练方法可以包括以下步骤:
[0028]步骤101,获取训练数据集,其中,训练数据集中包含待预测城市在指定时期内的新增异常数据。
[0029]其中,指定时期可以为最近30天、60天,或者100天,在此不做限定。
[0030]其中,待预测城市可以为研究对象。
[0031]其中,新增异常数据可以包含有每天待预测城市本地的新增阳性人数、外来的新增阳性人数,以及国外的阳性输入人数。
[0032]其中,训练数据集用于对预测模型进行训练。
[0033]步骤102,将训练数据集输入至预先构建的预测模型中进行迭代训练,直至迭代次数达到预设阈值停止训练,其中,预测模型是CNN模型和双向长短期记忆模型融合构建的模型。
[0034]本公开实施例中,预设阈值可以为50次,在此不做限定。需要说明的是,通过实验数据表明,迭代次数为50次时预测模型的预测能力可以满足需求,预测能力较高。
[0035]其中,预测模型可以为CNN

BiLSTM(卷积双向长短期记忆神经网络)模型。本公开实施例中,预测模型可以由CNN和双层LSTM组成。CNN主要用来提取空间特征,LSTM可以发掘时序特征,获得更多的有用特征。CNN与双层LSTM组合而成的CNN

BiLSTM能扬长避短,充分发挥两种模型在股价预测领域的作用。当日增阳性数据送入CNN

BiLSTM网络后,首先由一层二维卷积层提取特征,滤波器数为64,卷积核大小为3,在这之后添加池化层来进行数据过滤。再将CNN提取出的数据送入神经元为7的双层LSTM模型中,以挖掘出数据中的时序关系,再通过两个Dense层来增强数据特征,最后将预测结果输出。
...

【技术保护点】

【技术特征摘要】
1.一种神经网络模型的训练方法,其特征在于,包括:获取训练数据集,其中,所述训练数据集中包含待预测城市在指定时期内的新增异常数据;将所述训练数据集输入至预先构建的预测模型中进行迭代训练,直至迭代次数达到预设阈值停止训练,其中,所述预测模型是CNN模型和双向长短期记忆模型融合构建的模型;基于预先选择的误差函数模型对所述预测模型进行评估,直至所述预测模型所对应的误差值满足预设条件,确定所述预测模型为训练完成的预测模型。2.根据权利要求1所述的方法,其特征在于,在所述将所述训练数据集输入至预先构建的预测模型中进行迭代训练之前,还包括:按照预设的分区规则,对所述训练数据集进行窗口划分;对所述训练数据集进行预处理,以对所述训练数据集中的数据进行归一化。3.根据权利要求1所述的方法,其特征在于,在所述确定所述预测模型为训练完成的预测模型之后,还包括:将所述待预测城市指定历史时段的每日新增异常数据输入至所述训练完成的预测模型中,以对所述待预测城市在预测时期内的每日新增阳性人数进行预测。4.根据权利要求1所述的方法,其特征在于,所述预先选择的误差函数模型至少包含平均绝对误差和均方根误差。5.一种神经网络模型的训练装置,其特征在于,包括:获取模块,用于获取训练数据集,其中,所述训练数据集中包含待预测城市在指定时期内的新增异常数据;训练模块,用于将所述训练数据集...

【专利技术属性】
技术研发人员:林峰璞穆显显石志国郭家义朱芳朱蓉华梁玉晨毛伟赵敏贾瑞江
申请(专利权)人:太极计算机股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1