基于自动化参数调整循环神经网络的时序数据预测方法技术

技术编号:25441342 阅读:51 留言:0更新日期:2020-08-28 22:28
本发明专利技术实施例提供了一种时序数据预测方法及预测模型的训练方法,训练方法包括:分别从先获得的行业时间序列数据集和行业关键因子信息时间序列数据集中,查询给定行业和给定行业关键因子的时间序列数据;根据预测周期长度,划分上述给定行业和给定行业关键因子的时间序列数据,得到训练集,利用训练集对时序数据预测模型进行训练。时序数据预测方法包括,将给定行业和给定行业关键因子的时间序列数据,输入由该训练方法预先训练的时序数据预测模型,获得行业预测结果。使用上述方法,可根据行业历史信息和选择的关键因子信息,获取对行业的预测信息,同时,在训练中的特性工程和超参数调优中利用自动化参数调整,减少了训练过程工作量。

【技术实现步骤摘要】
基于自动化参数调整循环神经网络的时序数据预测方法
本专利技术涉及人工智能领域,尤其涉及基于自动化参数调整循环神经网络的时序数据预测方法。
技术介绍
预测未来长期业绩是金融领域中财务分析的最终目标,根据企业历史多项前瞻因子预测未来业绩情况,可以利用神经网络模型来进行。于此同时,针对不同的企业及其前瞻因子,不同行业数据特性不同、前瞻因子数量和数据特性不同,无法找到泛化能力达到要求的唯一的网络和相应参数;而网络模型训练过程中涉及到大量的特征选取和网络参数调整,对网络模型特征和超参数进行调优是一项繁琐但至关重要的任务。因此,需要一种新的预测方法解决上述技术问题。
技术实现思路
本专利技术的实施例提供一种时序数据预测方法,基于时序数据预测模型可以根据不同的行业历史信息以及选择的不同关键因子信息,获取对行业的预测信息,同时提供时序数据预测模型的训练方法,在训练过程的特性工程和超参数调优中引入自动化参数调整,除了初始设置之外,不需要额外的手动操作,减少了训练过程消耗的工作量。本专利技术为解决上述技术问题采用的技术方案为,提供一种时序数据预测模型的训练方法,所述方法包括:获取行业时间序列数据集;获取行业关键因子信息及其时间序列数据集;获取给定行业,并根据所述给定行业,从所述行业时间序列数据集中查询得到给定行业的时间序列数据;获取给定行业关键因子,并根据所述给定行业关键因子,从所述行业关键因子信息及其时间序列数据集中查询得到给定行业关键因子的时间序列数据;设定预测周期长度,并根据所述预测周期长度,对给定行业的时间序列数据和给定行业关键因子的时间序列数据进行划分,得到训练数据集;利用所述训练数据集,对基于所述预测周期长度、预先建立的时序数据预测模型进行训练。优选地,所述时序数据预测模型基于循环神经网络。优选地,所述时序数据预测模型基于长短期记忆神经网络或门控循环单元网络。优选地,所述预测周期由输入数量和推理数量构成,所述输入数量为用于一次预测的输入数据的数量,所述推理数量为一次预测得到的预测结果的数量。优选地,所述利用所述训练集,对根据所述预测周期长度预先建立的时序数据预测模型进行训练,包括:利用自动化参数调整,进行时序数据预测模型的数据特征提取和超参数选择。具体地,其中,所述时序数据预测模型还包括优化器;所述利用自动化参数调整,进行时序数据预测模型的数据特征提取和超参数选择,包括:所述优选器利用梯度信息,搜索时序数据预测模型的参数空间,得到参数空间中的一种参数组合,使用该种参数组合对时序数据预测模型进行配置;所述参数空间包括时序数据预测模型从输入数据提取的特征和时序数据预测模型的超参数;评估该种参数组合下数据预测模型的效果,并根据所述效果自动对所述特征和超参数进行调整,直至所述效果达到设定期望。优选地,所述利用所述训练集,对预先建立的时序数据预测模型进行训练,还包括:通过输出结果是否满足设定需求来判定是否结束训练过程,如果输出结果满足设定需求,则结束训练过程;如果输出结果不满足设定需求,则针对输出结果对所述时序数据预测模型进行自动化参数调整,继续进行训练过程。另一方面,提供一种时序数据的预测方法,所述方法包括:获取给定行业的时间序列数据;获取给定行业关键因子的时间序列数据;根据给定行业的时间序列数据和给定行业关键因子的时间序列数据,得到数据集;将所述预测数据集进行划分后,输入根据权利要求1的方法预先训练的时序数据预测模型,获得行业预测结果。具体地,所述输入根据权利要求1的方法预先训练好的时序数据预测模型,获得行业预测结果,包括:获得所述预先训练好的时序数据预测模型,其中,预先训练过程中设定的预测周期包括输入数量和推理数量;预先训练好的时序数据预测模型一次预测输入数据的最大数量和一次预测得到的预测结果的最大数量为权利要求1的方法中预测周期长度的设定所限制;将任意小于或等于所述输入数量的行业数据,输入所述预先训练好的时序数据预测模型,得到任意小于或等于所述推理数量的行业预测结果。使用本专利技术的实施例提供的一种时序数据预测方法、以及时序数据预测模型的训练方法可以根据不同的行业历史信息以及选择的不同关键因子信息,获取对行业的预测信息,同时,在训练中的特性工程和超参数调优中引入自动化参数调整,除了初始设置之外,不需要额外的手动操作,减少了训练过程消耗的工作量。附图说明为了更清楚说明本专利技术实施例的技术方案,下面将对实施例描述中所需使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术实施例提供的一种时序数据预测模型的训练方法的流程图;图2为本专利技术一个实施例提供的一种时序数据预测模型的训练和预测过程图;图3为本专利技术一个实施例提供的循环神经网络结构图;图4为本专利技术一个实施例提供的自动化参数调整过程示意图;图5为本专利技术实施例提供的一种时序数据的预测方法的流程图;具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。概括而言,预测未来长期业绩是财务分析最终目标,根据企业历史多项前瞻因子预测未来业绩情况,属于时间序列预测,适合循环神经网络模型。于此同时,针对不同的企业及其前瞻因子,不同行业数据特性不同、前瞻因子数量和数据特性不同,无法找到泛化能力达到要求的唯一的网络和相应参数,因此需利用不同的网络模型进行训练,才能得到适合于各个企业机器相关前瞻因子的结果;而网络模型训练过程中涉及到大量的特征选取和网络参数调整,对网络模型特征和超参数进行调优是一项繁琐但至关重要的任务。针对上述问题,本专利技术实施例提供了一种时序数据预测方法及预测模型的训练方法,对于往往网络模型训练中在最耗时的部分也正是特性工程和超参数调优,引入自动化参数调整,旨在使用带有策略的启发式搜索在更短的时间内找到最优超参数,除了初始设置之外,并不需要额外的手动操作。图1示出本专利技术实施例提供的一种时序数据预测模型的训练方法的流程图。如图1所示,该训练过程至少包括以下步骤:步骤11,获取行业时间序列数据集。在一个实施例中,行业时间序列数据集保存于数据库中。在另一个实施例中,所述行业时间序列数据,包括营收数据、价格数据、指数数据等。步骤12,获取行业关键因子信息及其时间序列数据集。在一个实施例中,行业关键因子信息及其时间序列数据集保存于数据库中。在另一个实施例中,所述本文档来自技高网...

【技术保护点】
1.一种时序数据预测模型的训练方法,所述方法包括:/n获取行业时间序列数据集;/n获取行业关键因子信息及其时间序列数据集;/n获取给定行业,并根据所述给定行业,从所述行业时间序列数据集中查询得到给定行业的时间序列数据;/n获取给定行业关键因子,并根据所述给定行业关键因子,从所述行业关键因子信息及其时间序列数据集中查询得到给定行业关键因子的时间序列数据;/n设定预测周期长度,并根据所述预测周期长度,对给定行业的时间序列数据和给定行业关键因子的时间序列数据进行划分,得到训练数据集;/n利用所述训练数据集,对基于所述预测周期长度、预先建立的时序数据预测模型进行训练。/n

【技术特征摘要】
1.一种时序数据预测模型的训练方法,所述方法包括:
获取行业时间序列数据集;
获取行业关键因子信息及其时间序列数据集;
获取给定行业,并根据所述给定行业,从所述行业时间序列数据集中查询得到给定行业的时间序列数据;
获取给定行业关键因子,并根据所述给定行业关键因子,从所述行业关键因子信息及其时间序列数据集中查询得到给定行业关键因子的时间序列数据;
设定预测周期长度,并根据所述预测周期长度,对给定行业的时间序列数据和给定行业关键因子的时间序列数据进行划分,得到训练数据集;
利用所述训练数据集,对基于所述预测周期长度、预先建立的时序数据预测模型进行训练。


2.根据权利要求1所述的方法,其中,所述时序数据预测模型基于循环神经网络。


3.根据权利要求2所述的方法,其中,所述循环神经网络包括长短期记忆神经网络或门控循环单元网络。


4.根据权利要求1所述的方法,其中,所述预测周期由输入数量和推理数量构成,所述输入数量为用于一次预测的输入数据的数量,所述推理数量为一次预测得到的预测结果的数量。


5.根据权利要求1所述的方法,其中,所述利用所述训练集,对根据所述预测周期长度预先建立的时序数据预测模型进行训练,包括:利用自动化参数调整,进行时序数据预测模型的数据特征提取和超参数选择。


6.根据权利要求5所述的方法,其中,所述时序数据预测模型还包括优化器;
所述利用自动化参数调整,进行时序数据预测模型的数据特征提取和超参数选择,包括:
所述优选器利用梯度信息,搜索时序数据预测模型的参数空间,得到参数空间中的...

【专利技术属性】
技术研发人员:张博尧周纯葆王彦棡曹荣强王珏
申请(专利权)人:中国科学院计算机网络信息中心
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1