大数据环境下用户用电关联因素辨识及用电量预测方法技术

技术编号:14572412 阅读:150 留言:0更新日期:2017-02-06 09:18
一种大数据环境下用户用电关联因素辨识及用电量预测方法,针对与用电量预测相关的大数据种类多、体量大、维度高和生成速度快等特点,在研究用户用电特性评价指标的基础上,运用海量用户用电特性子空间聚类分析方法,挖掘用户多种用电模式,拓展现有的用电行为分析方法,同时根据不同用电模式对用户进行群体划分,并利用互信息矩阵从区域及行业经济数据、气候条件,以及电力价格等方面辨识与用户群体用电量相关联的因素,构建基于随机森林算法的用电量大数据预测模型,实现了用电预测全过程的数据驱动,并且可以规避用电模式差异性为用电量预测带来的不利影响,具有较高的预测精度,适用于大数据的分析处理。

【技术实现步骤摘要】

本专利技术涉及一种大数据环境下用户用电关联因素辨识及用电量预测方法
技术介绍
准确的用电量预测对电网规划和经济部门的管理决策具有重要的指导意义。在研究不同用户用电特性的基础上开展用电量预测,可以帮助电力企业更好地了解用户个性化服务需求,为未来电网发展及电力需求侧响应政策的制定提供数据支撑。随着我国社会经济的持续发展以及产业结构的不断调整,电力用户的用电特性正呈现多样化发展趋势,用户用电特性的多样化对传统的用电量预测方法提出了挑战。与此同时,随着智能电网的建设和发展,电力企业内部逐渐形成了包括生产数据、营销数据,以及相关社会经济数据等在内的智能配用电大数据为计及用户用电特性的用电量精细化预测提供了数据基础。然而,由于智能配用电大数据种类多、体量大、维度高和生成速度快等特征,使得传统的用电量预测方法在挖掘海量数据信息方面存在一定的局限性,难以准确把握用户的用电量关联因素及变化规律。如何在大数据环境下研究用户的用电特性和用电量关联因素,并对其用电量进行预测,是摆在研究者面前的一个挑战。目前,多数的用电量预测方法可归为三类:基于时间序列的预测方法、用户端预测法,以及计量经济预测法。但是,这些方法或者过于依赖可用数据的质量,或者在辨识用户用电量影响因素时需进行人为干预,无法挖掘隐藏于电能需求变化之后的深层次关联关系,对于大数据环境下的用户用电量预测具有较大的局限性。
技术实现思路
本专利技术提供一种大数据环境下用户用电关联因素辨识及用电量预测方法,通过对不同用户的用电特性进行多维度聚类分析,实现基于不同用电特性的用户群体精细化划分,并能对用户群体的用电量存在强关联的因素进行辨识,从而准确把握用户的用电量关联因素及变化规律,最后采用随机森林算法针对不同用户群体实现用电量的准确预测。为了达到上述目的,本专利技术提供一种大数据环境下用户用电关联因素辨识及用电量预测方法,包含以下步骤:步骤S1、建立多维评价指标体系对用户用电特性进行表征,并根据不同用户的用电特性,在多维评价指标数据的各个子空间中分别开展模糊C均值聚类,提取用户的多样化用电模式,从而实现基于用电模式判别的用户精细化分类;步骤S2、运用互信息理论对用户用电量数据与潜在关联因素数据进行关联分析,辨识与用户用电行为存在强关联关系的因素;步骤S3、根据各类用户的用电量数据及其强关联因素数据,面向各数据样本开展基于随机森林算法的预测建模及参数寻优,对各用户群体的用电量进行预测。所述的步骤S1中,实现用户精细化分类包含以下步骤:步骤S1.1、针对不同用户使用包含时序与非时序数据的用户用电特性多维评价指标:Vj={αt1,αt2,...,αtu;βt1,βt2,...,βtv;γ1,γ2,...,γw)∈VDj=1,2,...,m---(1)]]>其中:αt1,αt2,…,αtu和βt1,βt2,…,βtv是时序特征向量,分别代表用户年用电量和月用电量时间序列数据;γ1,γ2,…,γw是非时序特征向量,包括年最大负荷利用小时数γ1、负荷密度γ2、典型日平均负荷率γ3、季不均衡系数γ4,以及峰谷电量比γ5等负荷特性指标数据;步骤S1.2、基于“自上而下”的子空间聚类搜索策略,建立用电特性多维度解析模型,根据数据类型和指标含义的不同,将用电特性数据集VD划分为3个子空间L1、L2和L3,并相应地将原特征向量VC进行拆分,在各子空间中,分别以年用电量时间序列Vα、月用电量时间序列Vβ,以及负荷特性数据Vγ作为特征向量,利用模糊C均值算法进行聚类;步骤S1.3、在VD的3个子空间L1、L2和L3中,通过模糊C均值聚类分别发现r、s和t个簇,从子空间L1、L2和L3中分别取出1个簇进行融合,所形成的全空间簇可以确定1种用户用电模式,在全空间中,根据簇的不同,将全体用户的用电特性定义为r×s×t种用电模式,根据用电模式的不同将用户进行分组,分为n=r×s×t个群体,即Gi(i,=1,…,n),从而实现了对用户的精细化分类。所述的步骤S2中,辨识用户用电行为的关联因素包含以下步骤:步骤S2.1、将各个用户的用电量数据序列作为解释变量X,各潜在关联因素数据序列作为条件变量Y,其中Y和X之间的互信息大小反映了潜在关联因素与用电量之间的关联程度;步骤S2.2、对各个变量进行变量域离散化处理,即把各个变量的数值序列转化为概率分布区间,离散化后,解释变量X和条件变量Y之间的互信息可由下式得出:I(X,Y)=-Σi=1Ni[MiMlogMiM]-{-Σu=1NjP(yu)[Σv=1NiMuvMlogMuvM]本文档来自技高网...

【技术保护点】
一种大数据环境下用户用电关联因素辨识及用电量预测方法,其特征在于,包含以下步骤:步骤S1、建立多维评价指标体系对用户用电特性进行表征,并根据不同用户的用电特性,在多维评价指标数据的各个子空间中分别开展模糊C均值聚类,提取用户的多样化用电模式,从而实现基于用电模式判别的用户精细化分类;步骤S2、运用互信息理论对用户用电量数据与潜在关联因素数据进行关联分析,辨识与用户用电行为存在强关联关系的因素;步骤S3、根据各类用户的用电量数据及其强关联因素数据,面向各数据样本开展基于随机森林算法的预测建模及参数寻优,对各用户群体的用电量进行预测。

【技术特征摘要】
1.一种大数据环境下用户用电关联因素辨识及用电量预测方法,其特征在于,
包含以下步骤:
步骤S1、建立多维评价指标体系对用户用电特性进行表征,并根据
不同用户的用电特性,在多维评价指标数据的各个子空间中分别开展模糊
C均值聚类,提取用户的多样化用电模式,从而实现基于用电模式判别的
用户精细化分类;
步骤S2、运用互信息理论对用户用电量数据与潜在关联因素数据进
行关联分析,辨识与用户用电行为存在强关联关系的因素;
步骤S3、根据各类用户的用电量数据及其强关联因素数据,面向各
数据样...

【专利技术属性】
技术研发人员:王林童赵腾张焰杨增辉苏运
申请(专利权)人:上海交通大学国网上海市电力公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1