System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于神经网络的时序预测方法技术_技高网
当前位置: 首页 > 专利查询>同济大学专利>正文

一种基于神经网络的时序预测方法技术

技术编号:40027656 阅读:12 留言:0更新日期:2024-01-16 17:44
本发明专利技术涉及一种基于神经网络的时序预测方法,包括以下步骤:获取待测时序数据;将所述待测时序数据放入时序预测模型,获取预测结果;其中,所述时序预测模型包括:卷积模块,对输入的时序数据进行特征提取获得第一特征向量;循环神经网络模块,基于所述第一特征向量提取所述时序数据的序列特性,得到第二特征向量;注意力机制模块,根据所述第二特征向量利用注意力机制分析得到第三特征向量;全连接模块,根据所述第三特征向量生成预测结果。本发明专利技术能够捕捉较长时间序列之间的语义关联信息,得到比较精确的预测结果。

【技术实现步骤摘要】

本专利技术涉及时序预测领域,特别是涉及一种基于神经网络的时序预测方法


技术介绍

1、时序预测通过分析历史数据的变化规律,可以预测未来数据的发展趋势。这有助于企业、政府等组织制定相应的策略和措施,提前应对可能出现的风险和机遇。基于时序预测的结果,决策者可以更为准确地评估不同决策方案的可能结果和影响,从而做出更加科学、有效的决策。时序预测也可以帮助我们了解未来可能出现的情景,从而降低由于信息不对称、不确定性造成的风险。时序预测在许多领域都有广泛的应用,例如:金融领域、气象领域、销售领域、能源领域等。

2、早期用于时序预测的模型以统计学习模型为主,传统统计学习模型如arma(autoregressive moving average model)模型、arima(autoregressive integratedmoving average model)模型、隐马尔可夫模型(hidden markov model)、随机漫步模型(random walk)等,由于其模型较为成熟、可解释性强等优点,在时序预测领域曾占据主导地位。随着数据资源的丰富以及硬件算力的提升,当前用于时序预测的模型以机器学习模型与深度学习模型为主。传统的统计学习模型是线性模型,对于非线性的时序数据的拟合和预测能力受到限制。此外,这些模型在处理大规模、高维度的数据时效果不佳,实际中的问题也很难符合传统统计学习模型的假设条件。人工神经网络在计算机视觉、自然语言处理、语音识别等领域展现出了优于传统机器学习模型的性能。随着以深度学习为核心的人工智能迅速发展,使用神经网络进行时序预测成为一个备受关注的研究方向。然而,现有基于深度学习的时序预测模型预测效果不佳,对较长时间序列之间的语义关联信息捕捉能力有限,无法充分利用神经网络的计算能力以及时序数据的信息。


技术实现思路

1、本专利技术所要解决的技术问题是提供一种基于神经网络的时序预测方法,能够准确捕捉较长时间序列之间的语义关联信息,得到比较精确的预测结果。

2、本专利技术解决其技术问题所采用的技术方案是:提供一种基于神经网络的时序预测方法,包括以下步骤:

3、获取待测时序数据;

4、将所述待测时序数据放入时序预测模型,获取预测结果;其中,所述时序预测模型包括:

5、卷积模块,对输入的时序数据进行特征提取获得第一特征向量;

6、循环神经网络模块,基于所述第一特征向量提取所述时序数据的序列特性,得到第二特征向量;

7、注意力机制模块,根据所述第二特征向量利用注意力机制分析得到第三特征向量;

8、全连接模块,根据所述第三特征向量生成预测结果。

9、进一步的,所述注意力机制模块包括第一归一化层,所述第一归一化层对输入的数据进行层归一化处理后输出给注意力机制层,所述注意力机制层对所述第一归一化层输出的数据进行分析,将分析结果经由第二归一化层进行层归一化化处理后输出,所述第一归一化层与所述第二归一化层残差连接。

10、进一步的,所述时序预测模型还包括批归一化模块,所述批归一化模块置于所述卷积模块与所述循环神经网络模块之间,用来将所述卷积模块输出的数据进行标准化处理后输出给所述循环神经网络模块。

11、进一步的,所述卷积模块是卷积神经网络。

12、进一步的,所述卷积神经网络采用gelu激活函数。

13、进一步的,所述循环神经网络模块是双向长短期记忆网络。

14、进一步的,所述注意力机制模块基于多头自注意力机制构建。

15、进一步的,所述全连接模块包括不少于两个全连接层。

16、进一步的,所述全连接层采用gelu激活函数。

17、进一步的,所述获取待测时序数据与所述将所述待测时序数据放入时序预测模型的步骤之间,还包括对所述待测时序数据进行预处理的步骤,包括:

18、利用pca降维和特征构造将所述待测时序数据特征维度的个数处理为与预设数量相同;

19、基于上一步骤处理后的待测时序数据数据,利用min-max标准化与滑动窗口法构造时序特征数据;

20、输出所述时序特征数据。

21、有益效果

22、由于采用了上述的技术方案,本专利技术与现有技术相比,具有以下的优点和积极效果:

23、(1)本专利技术在时序预测模型中采用了多层次特征提取。卷积神经网络具有优秀的空间自动聚类和特征提取能力,能够从原始数据中获取局部特征。本专利技术通过卷积和池化操作在时间序列数据中捕获时序波动的空间特征,有利于提取短期内环境的整体动态和潜在规律。

24、(2)本专利技术在时序预测模型中引入了长序列依赖和记忆能力。长短记忆网络(lstm)作为一种特殊的循环神经网络(rnn),可以捕捉长序列中的依赖关系。通过引入长短记忆网络,可以有效地处理时序数据中的长期依赖效应,有利于挖掘时序数据与环境之间的相互作用,并从中发现潜在的预测信号。

25、(3)本专利技术在时序预测模型中引入了选择性关注力机制。注意力机制能够根据输入数据的不同部分分配不同的关注权重。在时序预测过程中,可以通过注意力机制自适应地发现与预测目标息息相关的关键信息,从而提高预测精度。

26、(4)本专利技术实现了端到端学习。本专利技术构建的时序预测模型能够直接将输入数据转化为最终时序预测结果,整个过程中的优化参数可以通过端到端的方式进行学习。在训练过程中,网络可以在整个序列内自动学习到不同层次的特征,使模型更加高效和准确。

本文档来自技高网...

【技术保护点】

1.一种基于神经网络的时序预测方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于神经网络的时序预测方法,其特征在于,所述注意力机制模块包括第一归一化层,所述第一归一化层对输入的数据进行层归一化处理后输出给注意力机制层,所述注意力机制层对所述第一归一化层输出的数据进行分析,将分析结果经由第二归一化层进行层归一化化处理后输出,所述第一归一化层与所述第二归一化层残差连接。

3.根据权利要求1所述的基于神经网络的时序预测方法,其特征在于,所述时序预测模型还包括批归一化模块,所述批归一化模块置于所述卷积模块与所述循环神经网络模块之间,用来将所述卷积模块输出的数据进行标准化处理后输出给所述循环神经网络模块。

4.根据权利要求1所述的基于神经网络的时序预测方法,其特征在于,所述卷积模块是卷积神经网络。

5.根据权利要求4所述的基于神经网络的时序预测方法,其特征在于,所述卷积神经网络采用GELU激活函数。

6.根据权利要求1所述的基于神经网络的时序预测方法,其特征在于,所述循环神经网络模块是双向长短期记忆网络。

7.根据权利要求1所述的基于神经网络的时序预测方法,其特征在于,所述注意力机制模块基于多头自注意力机制构建。

8.根据权利要求1所述的基于神经网络的时序预测方法,其特征在于,所述全连接模块包括不少于两个全连接层。

9.根据权利要求8所述的基于神经网络的时序预测方法,其特征在于,所述全连接层采用GELU激活函数。

10.根据权利要求1所述的基于神经网络的时序预测方法,其特征在于,所述获取待测时序数据与所述将所述待测时序数据放入时序预测模型的步骤之间,还包括对所述待测时序数据进行预处理的步骤,包括:

...

【技术特征摘要】

1.一种基于神经网络的时序预测方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于神经网络的时序预测方法,其特征在于,所述注意力机制模块包括第一归一化层,所述第一归一化层对输入的数据进行层归一化处理后输出给注意力机制层,所述注意力机制层对所述第一归一化层输出的数据进行分析,将分析结果经由第二归一化层进行层归一化化处理后输出,所述第一归一化层与所述第二归一化层残差连接。

3.根据权利要求1所述的基于神经网络的时序预测方法,其特征在于,所述时序预测模型还包括批归一化模块,所述批归一化模块置于所述卷积模块与所述循环神经网络模块之间,用来将所述卷积模块输出的数据进行标准化处理后输出给所述循环神经网络模块。

4.根据权利要求1所述的基于神经网络的时序预测方法,其特征在于,所述卷积模块是卷积神经网络。

5.根据...

【专利技术属性】
技术研发人员:郝泳涛谢安南张瑞雪
申请(专利权)人:同济大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1