基于Prophet-LSTNet组合模型的供电成本分析预测方法技术

技术编号:29676691 阅读:75 留言:0更新日期:2021-08-13 21:59
本发明专利技术公开了基于Prophet‑LSTNet组合模型的供电成本分析预测方法,解决了现有技术的不足,包括以下步骤:步骤1,获取一段时间内历史每日供电成本数据,并将供电成本数据输入Prophet模型;步骤2,通过Prophet模型对供电成本数据分解成非线性趋势成分数据、季节性成分数据以及假日成分数据;步骤3,进行特征工程建设,得到供电成本数据的多维特征;步骤4,将供电成本数据的多维特征作为参数输入LSTNet模型,将非线性趋势成分数据输入LSTNet模型,对LSTNet模型进行训练,寻找供电成本数据的多维特征与非线性趋势成分数据之间的依赖关系,训练并交替更新LSTNet模型及非线性趋势成分数据权重参数;步骤5,对供电成本进行预测,得到预测结果。

【技术实现步骤摘要】
基于Prophet-LSTNet组合模型的供电成本分析预测方法
本专利技术涉及配电网
,尤其是指一种基于Prophet-LSTNet组合模型的供电成本分析预测方法。
技术介绍
电网供电成本预测是指根据以往的运维成本,包括人工成本、检修运维成本、营销运维成本、其他运营费用等情况对未来的形式分析,实现对未来特定时间内的成本消耗的估计,它的准确预测对于国家电网对使用成本的总体把握、资金部署和投资建设等有着非常重要的意义。目前相关研究很少,主要原因是电网规模庞大、分布地域广阔、运行条件繁琐,造成电网供电所数据波动特别大,数据短期无连续性,使得其预测非常困难。目前可用于预测的数据挖掘工具主要是一些传统统计分析方法,如时间序列分析、线性/非线性回归模型、灰色系统模型、最大熵马尔可夫模型等,其中时间序列分析方法突出了时间因素在预测中的作用,因此被广泛应用于经济预测。在时间序列分析方法中,最常用的是Box和Jenkins提出的ARIMA模型,但是以下两方面原因使得传统统计模型不能很好的预测成本变化:一方面是当数据量很大时,构建有效的输入数据结构来刻画相应成本金额非常有必要,然而传统方法要么是选取其中少量数据维度,要么忽略已有数据之间的总体关联性质,这都导致了数据的信息缺失,使得进一步的建模受到先验限制;另一方面,基于能获取的所有数据维度,传统方法无法有效提取出其中有利于预测的高维的、相互作用的有效特征,如:时间序列模型只突出时间序列而不考虑外界因素影响,这使得利用ARIMA模型预测变化较大的成本值会出现较大偏差,这些原因导致统计预测的不精确,也就限制了传统方法的实际应用。为了很好的利用历史数据(大数据)预测成本,构建有效的输入数据结构来刻画相应成本金额是非常有必要的,因此对大数据处理和挖掘的需求也应运而生,其中代表性的方法就神经网络方法,在过去的十多年,基于深度学习的神经网络方法已经被广泛应用于数据处理,Hochreiter和Schmidhuber在1997年提出的LSTM(长短期记忆网络)神经网络模型被广泛用在股票预测,手写识别,语音识别,电量预测等。然而实际上LSTM无法捕获非常长期的序列关系,因此相关研究人员设计LSTNet模型以解决此问题,LSTNet包括卷积组件、循环神经网络组件、跳跃循环神经网络组件以及自回归组件,可以捕捉数据的多尺度周期规律,但是LSTNet只能挖掘不同时段的序列特征,不能对序列噪音等进行平稳处理。
技术实现思路
本专利技术的目的是克服现有技术中的缺点,提供一种基于Prophet-LSTNet组合模型的供电成本分析预测方法。本专利技术的目的是通过下述技术方案予以实现:一种基于Prophet-LSTNet组合模型的供电成本分析预测方法,包括以下步骤:步骤1,获取一段时间内历史每日供电成本数据,并将供电成本数据进行数据清洗,然后将数据清洗完成后的供电成本数据输入Prophet模型;步骤2,通过Prophet模型对供电成本数据分解成非线性趋势成分数据、季节性成分数据以及假日成分数据;步骤3,进行特征工程建设,对供电成本相关信息进行挖掘分析,得到供电成本数据的多维特征;步骤4,将供电成本数据的多维特征作为参数输入LSTNet模型,将非线性趋势成分数据输入LSTNet模型,对LSTNet模型进行训练,寻找供电成本数据的多维特征与非线性趋势成分数据之间的依赖关系,训练并交替更新LSTNet模型及非线性趋势成分数据权重参数;步骤5,通过LSTNet模型、季节性成分数据以及假日成分数据结合对供电成本进行预测,得到预测结果。Prophet模型是一种针对时间序列预测的算法模型。它的算法原理是将数据分解成非线性趋势成分、周(日)季节性成分以及假日成分,从而对序列进行预测,与其他模型相比,Prophet模型对于缺失数据、异常数据、变动趋势具有较强的鲁棒性,在拥有多季节性以及节假日效应明显的序列上表现更好,该模型对于各种业务时间序列都具有足够的灵活性,并且可以由对数据生成过程和时间序列模型知之甚少的非专家进行配置。Long-andShort-termTime-seriesnetwork(LSTNet)专门设计用于时间序列预测的深度学习网络,该网络使用了卷积层(CNN)、循环神经网络(LSTM)、跳跃循环神经网络(Skip¬LSTM)以及自回归机制,LSTNet利用卷积层的优势来发现局部多维输入变量和循环层之间的依赖关系模式,以捕获复杂的长期依赖关系,它通过一种新颖的递归结构(即递归跳跃)来捕获非常长期的依赖模式,并利用输入时间序列信号的周期性来简化优化过程,最后,LSTNet结合了与非线性神经网络部分并行的传统自回归线性模型,这使得非线性深度学习模型对于违反尺度变化的时间序列更具鲁棒性。本方案中,首先对于供电成本数据通过Prophet模型进行时间序列分解,其中季节性成分数据以及假日成分数据为周期性变化数据较为稳定,而非线性趋势成分数据需要进一步分析研究,因此,通过LSTNet模型分析出运用供电成本数据的多维特征与非线性趋势成分数据之间的依赖关系,供电成本数据的多维特征可以是发电量分布、供电行业分布、多种发电类型发电功率、日期等多种维度,每个维度下又可以分若干个子维度,例如发电量分布的子维度可以按区域划分,按时间段划分,日期的子维度可以分星期属性,阳历月份属性、农历月份属性等,LSTNet模型可以寻找出最符合的依赖关系,在预测过程中可以通过多维特征预测非线性趋势成分数据的结果,结合季节性成分数据以及假日成分数据,可以较为准确的预测出供电成本。作为优选,所述的数据清洗包括异常值数据清洗,异常值数据清洗的方法为首先判断数据的正负情况,若数据为负值,则判断该数据为异常并删除,若数据为正值,则通过分位数检测处理数据中的异常值:计算第一四分位数Q1和第三四分位数Q3,异常值是位于四分位数范围之外的数据点,计算方式如下:,其中,,当超过异常值上限的数据使用异常值上限代替,低于异常值下限的数据使用异常值下限代替。作为优选,所述的步骤1中数据清洗包括缺失值数据清洗,缺失值数据清洗的方法为首先寻找缺失值相邻的若干日的供电成本数据,根据若干日的数据构建拟合曲线,然后确定缺失值对应的日期在拟合曲线上的拟合数值,该拟合数值即为缺失值匹配的供电成本数据,在历史每日供电成本数据中对该缺失值进行补充。作为优选,还对补充的缺失值进行验证,具体方法为首先确定该缺失值对应的日期信息,确定该日期信息的数据特征,然后寻找在一段时间内所有与该日期信息的数据特征相同的其他日期的供电成本数据,并对这些数据特征相同的数据进行聚类分析,确定聚类中心点,计算补充的缺失值与距离中心点的欧式距离,若欧式距离小于设定的阈值,则确定补充的缺失值可信,若欧式距离大于等于设定的阈值,则判断不中的缺失值不可信,则重新确定缺失值相邻的若干日的供电成本数据的数量,直到确定补充的缺失值可信,或重新确定缺失值相邻的若干日的供电成本数本文档来自技高网
...

【技术保护点】
1.基于Prophet-LSTNet组合模型的供电成本分析预测方法,其特征是,包括以下步骤:/n步骤1,获取一段时间内历史每日供电成本数据,并将供电成本数据进行数据清洗,然后将数据清洗完成后的供电成本数据输入Prophet模型;/n步骤2,通过Prophet模型对供电成本数据分解成非线性趋势成分数据、季节性成分数据以及假日成分数据;/n步骤3,进行特征工程建设,对供电成本相关信息进行挖掘分析,得到供电成本数据的多维特征;/n步骤4,将供电成本数据的多维特征作为参数输入LSTNet模型,将非线性趋势成分数据输入LSTNet模型,对LSTNet模型进行训练,寻找供电成本数据的多维特征与非线性趋势成分数据之间的依赖关系,训练并交替更新LSTNet模型及非线性趋势成分数据权重参数;/n步骤5,通过LSTNet模型、季节性成分数据以及假日成分数据结合对供电成本进行预测,得到预测结果。/n

【技术特征摘要】
1.基于Prophet-LSTNet组合模型的供电成本分析预测方法,其特征是,包括以下步骤:
步骤1,获取一段时间内历史每日供电成本数据,并将供电成本数据进行数据清洗,然后将数据清洗完成后的供电成本数据输入Prophet模型;
步骤2,通过Prophet模型对供电成本数据分解成非线性趋势成分数据、季节性成分数据以及假日成分数据;
步骤3,进行特征工程建设,对供电成本相关信息进行挖掘分析,得到供电成本数据的多维特征;
步骤4,将供电成本数据的多维特征作为参数输入LSTNet模型,将非线性趋势成分数据输入LSTNet模型,对LSTNet模型进行训练,寻找供电成本数据的多维特征与非线性趋势成分数据之间的依赖关系,训练并交替更新LSTNet模型及非线性趋势成分数据权重参数;
步骤5,通过LSTNet模型、季节性成分数据以及假日成分数据结合对供电成本进行预测,得到预测结果。


2.根据权利要求1所述的基于Prophet-LSTNet组合模型的供电成本分析预测方法,其
特征是,所述的数据清洗包括异常值数据清洗,异常值数据清洗的方法为首先判断数据的
正负情况,若数据为负值,则判断该数据为异常并删除,若数据为正值,则通过分位数检测
处理数据中的异常值:计算第一四分位数Q1和第三四分位数Q3,异常值是位于四分位数范
围之外的数据点,计算方式如下:



其中,,当超过异常值上限的数据使用异常值上限代替,低于异
常值下限的数据使用异常值下限代替。


3.根据权利要求1所述的基于Prophet-LSTNet组合模型的供电成本分析预测方法,其特征是,所述的步骤1中数据清洗包括缺失值数据清洗,缺失值数据清洗的方法为首先寻找缺失值相邻的若干日的供电成本数据,根据若干日的数据构建拟合曲线,然后确定缺失值对应的日期在拟合曲线上的拟合数值,该拟合数值即为缺失值匹配的供电成本数据,在历史每日供电成本数据中对该缺失值进行补充。


4.根据权利要求3所述的基于Prophet-LSTNet组合模型的供电成本分析预测方法,其特征是,还对补充的缺失值进行验证,具体方法为首先确定该缺失值对应的日期信息,确定该日期信息的数据特征,然后寻找在一段时间内所有与该日期信息的数据特征相同的其他日期的供电成本数据,并对这些数据特征相同的数据进行聚类分析,确定聚类中心点,计算补充的缺失值与距离中心点的欧式距离,若欧式距离小于设定的阈值,则确定补充的缺失值可信,若欧式距离大于等于设定的阈值,则判断不中的缺失值不可信,则重新确定缺失值相邻的若干日的供电成本数据的数量,直到确定补充的缺失值可信,或重新确定缺失值相邻的若干日的供电成本数据的数量的次数超过设定的次数为止。


5.根据权利要求1所述的基于Prophet-LSTNet组合模型的供电成本分析预测方法,其特征是,Prophet模型对供电成本数据分解成非...

【专利技术属性】
技术研发人员:王海庆蓝飞姚日权孙泉辉程嵩金绍君费英群方利锋罗哲珺
申请(专利权)人:国网浙江省电力有限公司国网浙江省电力有限公司湖州供电公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1