本发明专利技术公开了一种基于计算智能的时间序列多步预报方法。使用基于全局最值缩放策略和散点向量化策略对时间序列进行预处理;使用基于计算智能的建模策略,建模过程通过样本训练来实现;使用适应度函数作为算法的评价标准;适应度与精度、效率之间存在反比例关系,且支持精度优先与效率优先;提出了预报算法的参数选择策略与样本特征选择策略,将组合选择策略编码为实数与二进制的混合向量,同时进行预报算法的参数选择与样本特征选择。本发明专利技术根据时间序列的变化规律寻求未来发展趋势,可广泛应用于科研、工业、农业、商业等各个领域,优点如下:高精度,高效率,支持未来多步预报,方法具有通用性,对数据有自适应性,能够全程自动化实现。
【技术实现步骤摘要】
本专利技术属于时间序列分析的主要组成部分,涉及使用计算智能方法预报时间序列的未来变化情况。该方法根据时间序列的变化规律寻求未来发展趋势,可广泛应用于科研、工业、农业、商业等各个领域,例如金融预报、大气污染预报、电力预报、产量预报、水位预报、灾难预报、等等。以大气污染预报为例,给出一个典型的应用场景已知某大气污染观测站连续3年(36个月)的历史记录X= (X1, x2, x3,…x36}, X中的每一个元素表示当月平均大气污染指数,需要对第4年中每个月的平均大气污染指数进行预报。本专利技术所公开的方法十分适合解决此类问题,且具有领域无关性,因此具有推广意义。
技术介绍
时间序列预报是时间序列分析的主要组成部分,它根据事物的变化规律寻求未来发展趋势,在科研,工业,商业等各个领域中发挥着重要作用。随着社会生产和人们生活的不断发展,传统的时间序列预报技术已经无法满足实际预报问题的需要,新的预报求解算法必须同时满足以下条件I)更低的预报误差;2)更快的预报速度;3) “支持未来单步预报”升级为“支持未来多步预报”;4)算法能够自动化的进行智能调整以适应数据的变化规律。针对时间序列预报的问题,国内外提出了一些解决方案(I)线性时间序列方法将时间序列变化过程看成是线性回归过程。最具代表性的是Box-Jenkins线性时间序列算法,又称AR族算法,包括AR (purely autoregressive), MA (purelymoving average), ARMA(autoregressive moving average), ARIMA(autoregressiveintegrated moving average), and ARFIMA(autoregressive fractionally integratedmoving average)。后来又有学者将算法的残差进行二次建模,为AR族增添了ARCH(autoregressive conditional heteroskedasticity)以及 GARCH(generalizedautoregressive conditional heterosjedasticity)等。AR 方矣算法涵盖的范围较广,其它线性算法如Markov过程,Mean/Median过程等都可以部分或全部用AR族算法来表达。线性时间序列方法的优点是效率较高,主要不足之处在于所有算法的建立都以线性作为前提条件,而实际问题往往是非线性的,因而用线性算法概括其变化规律,难以获得准确结果。(2)小波分析方法将时间序列变化过程看成是多重波形的迭加过程。根据事件发生的周期性来预报将来要发生的事件。优点是对周期性的行为预报较好,自适应性强。缺点是不适合随机性应用,所以这种方法通常无法单独完成预报任务,需要与其他技术相结合使用。(3)随机信息方法将时间序列变化过程看成是随机过程。这种方法认为时间序列信息是正态分布的。然而在实际应用中,数据信息不可能完全服从正态分布,如果把它改成区间分布,即时间序列预报值是这个区间的一个随机值,这种方法的可靠性将会有所提高。优点是简单,直观,快速。局限性是区间算法的前提是区间上值的分布必须是统一的,这在实际应用中完全无法满足。(4)人工神经网络方法人工神经网络(Artificial Neural Network)具有强大的自学习功能,通过适当的训练就能准确获得时间序列特征并产生预报。这种预报本质上具有并行分布式处理结构,适用于多信息融合,可同时综合定量,定性信息,具有鲁棒性。人工神经网络已经被很多研究用于时间序列预报。众多研究表明人工神经网络预报要比传统的线性时间序列预报方法更加精确。然而,人工神经网络的学习过程比较复杂,算法参数的确定过程难以规范化,算法拟合速度慢,而且容易陷入局部极小。(5)支持向量机方法 支持向量机(Support Vector Machine, SVM)以其良好的泛化性,凸集上最优值的唯一性,以及解的稀疏性等优点,成为多种非线性问题的首选解决方法。传统的回归技术,包括神经网络方法在内,都是基于经验风险最小化(Empirical Risk Minimization,ERM)原则,这就不可避免会出现算法过拟合和欠拟合风险;而SVM则是基于结构风险最小化(Structural Risk Minimization, SRM)原则,它同时控制算法复杂度与泛化风险,而非仅仅控制训练误差。因而与传统方法相比,SVM有望获得更好的性能。众多研究验证了 SVM用于时间序列预报的可行性。不过SVM算法中存在多个参数,参数的选择过程难以规范化,不支持样本特征的选择,而且其向量化操作的要求也提高了其应用门槛。总之,现有的时间序列预报方法无法满足实际预报问题的需要,亟待低误差、高效率、自动化、自适应的时间序列多步预报解决方案。
技术实现思路
本专利技术的目的在于克服现有时间序列预报技术的不足,提供完整的低误差、高效率、自动化、自适应的时间序列多步预报解决方案。本专利技术克服了现有技术中的不足,提供了,所述方法其要点包括I、基于全局最值的时间序列数据缩放策略时间序列数据会随实际应用问题的不同而带有不同的量纲,因此时序数据的数值范围可能会很大,较大的数值计算会给算法和计算机带来负担,导致较大误差。预报算法通常只对有限数据区间反应灵敏,因此本专利技术在应用预报算法以前,基于全局最值对时间序列数据按比例映射到目标缩放数据区间,预报结束后再将预报结果按照相同比例映射回原始的数据区间。2、基于滑动时间窗口的向量化样本生成策略时间序列数据是一个散点集,而预报过程中需要向量化的样本集才能完成预报过程,因此本专利技术在预报过程以前,基于滑动时间窗口规则将时序散点集转化为向量化的样本集。同时,该样本生成策略还将未来单步预报扩展为未来多步预报。3、基于计算智能的预报策略计算智能算法能够满足非线性、数据适应性、预报过程自动化等要求,因此本专利技术采用计算智能算法作为时间序列预报问题的基础算法。人工神经网络和支持向量机,是计算智能算法的典型代表,都可以用来实现预报过程,当然其他相似的计算智能算法也可以适用于此预报策略。4、基于精度与效率并重的算法评价策略精度与效率是评价预报算法性能的两项主要指标,本专利技术的目的是要建立同时满足高精度和高效率的预报算法,因此提出了精度与效率并重的算法评价策略。进一步说,随着实际应用领域的不同,预报算法对精度或效率可能会有所偏重,本专利技术提出的算法评价策略也支持精度优先与效率优先的情况。 5、预报算法的参数选择策略与样本特征选择策略基于计算智能算法的时间序列预报,其算法通常有多个可以调节的参数,如何调节这些参数找到最佳的参数组合是一个重要的性能提升策略;其次,向量化的样本集中存在的不相关特征也会影响算法的精度与效率,如何发现并去掉这些特征是另一个重要的性能提升策略;另外,两种策略还是相关关联的,可作为组合策略来处理。本专利技术采用进化计算方法来实现此组合策略。粒子群算法和遗传算法,是进化计算方法的典型代表,都可以用来实现组合策略,当然其他相似的进化计算方法也可以适用于此策略。与现有技术相比,本专利技术的优点是I、使用预报算法的灵敏区间对数据进行处理,有效降低了算法的误差。2、弥补了散点数据本文档来自技高网...
【技术保护点】
【技术特征摘要】
...
【专利技术属性】
技术研发人员:胡亮,车喜龙,赵阔,初剑锋,张猛,
申请(专利权)人:吉林大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。