一种基于自回归和提升树算法的居民用电行为分析的系统及方法技术方案

技术编号:26599478 阅读:35 留言:0更新日期:2020-12-04 21:22
居民用电消费受较多因素的影响,掌握居民用电习惯及其主要影响因素间的规律对电力系统调度,电力市场化的推进,智能化城市管理都具有重要意义。针对大数据应用背景下用户智能用电行为分类的计算复杂性和特征选择有效性的问题,本发明专利技术公开了一种基于大数据思维的客户用电行为分析模型,根据历史用电数据和实时的电力负荷情况来识别居民用电规律与否的系统及方法,主要包括通过异常分析剔除掉个别极端用电数值,通过自回归模型建立每个用电单位的48小时用电曲线,以及利用提升树算法对实时的用电数据进行分类。

【技术实现步骤摘要】
一种基于自回归和提升树算法的居民用电行为分析的系统及方法
本专利技术涉及用电大数据人工智能分析领域,具体涉及一种基于自回归和提升树算法的居民用电行为分析的系统及方法。
技术介绍
大数据时代形成的新技术手段和商业模式等使得生活方式发生了变化,也给企业的发展带来了巨大的挑战。电力企业作为公用事业服务行业,需要为广大用户提供更好更优质的用电服务,这促使企业主动尝试或应用主流创新技术,加快服务转型与升级。随着智能电网建设的推进,电力企业在发电、输电、变电、配电和用电各个环节产生了海量的数据,但是这些数据在系统间分布储存,数据关联度不高,数据逻辑复杂,传统的数据处理分析方式已难以支撑电力企业对智能电网实时运营分析的要求,因此,如何积极开展大数据关键技术的研究和应用,梳理电力大数据的应用场景,思考如何利用大数据推动城市管理提升和业务创新是未来智能化城市管理的关键。本专利技术提出了一种基于电力负荷数据分析居民用电行为的系统及方法,其主要的应用在于在分类用户用电规律,识别潜在非正常用电情况。
技术实现思路
本专利技术提出了一种基于电力负荷数据分析居民用电行为的系统及方法,其主要的应用在于在分类用户用电规律,识别潜在非正常用电情况。整个过程包括了数据收集模块,剔除极端值模块,自相关系数分析模块以及实时识别报告模块,如图1所示。电力负荷数据收集模块通常通过智能电表等终端设备采集,存储并处理原始居民用电负荷数据,并对这些数据进行分析,整合,校正,填补缺失值,以及标准化处理。异常分析模块将电力负荷数据中的极端异常值剔除,这其中包括了,数据录入时发生的读取错误照成的极大极小值和缺失值。异常分析之后的数据录入到自回归分析模块,该模块对每一个用电单位的负荷数据进行48小时的自回归分析,通过计算同一时段在不同天的相关性,分析出该用电单位的用电规律是正常,较为正常,还是异常。最后在提升树模型中,通过历史历史数据(正常和异常)训练模型,通过提升树模型对实时用电数据进行分类,并通过识别报告模块,报告该用户是否属于用电异常用户。附图说明图1为本专利技术实施例中居民用电行为分析模块流程图。图2为本专利技术实施例中某用户历史用电数据(度/小时)曲线图。图3为本专利技术实施例中某用户历史用电数据自相关系数。图4为本专利技术实施例中某用户经识别判定为用电行为正常的曲线图。图5为本专利技术实施例中某用户经识别判定为用电行为异常的曲线图。具体实施方式为使得本专利技术的内容、目的、特征及优点能够更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,下面所描述的实施例仅仅是本专利技术一部分实施例,而非全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本专利技术保护说明书的范围,具体实施步骤如下。步骤1、数据收集模块:对每一个用电单位的用电数据进行收集和存储。用电负荷数据可以采用不同的频率进行录入,在进入分析之前会求和或再分配为小时。步骤2、根据步骤1中所取得的处理后的用电负荷数据,首先对每一个用户的用电数据进行异常分析,剔除掉极端值:1)数据值为:2)假设每一个用户的数据负荷高斯分布:3)求出相应参数:4)如果,则认为该值为极端值。步骤3、根据步骤2中所取得的处理后的数据,对每一个用电单位数据进行自回归分析:其中k值,我们选取48,为48小时。步骤4、根据步骤3的结果,原数据为每一个用户的小时用电量,转化为每一用户的自回归系数,训练数据集:其中N为用户数,是第i个用户的第j个特征,,是第j个特征可能取的第个值。步骤5、通过步骤3的自回归分析结果,我们选择第24和48的值,如果两个值相加的和大于0.15,视为该用户用电行为正常;如果两个值相加的和小于0.15,视为该用户用电行为异常:接着采用提升树算法对实时数据进行分类:输入:训练数据集,其中,,为别表示1正常;-1异常。输出:最终的分类器;(1)初始化训练数据的权重分布:(2)对,m指的是第几个分类器:(a)使用具有权重的的训练数据集学习,得到基本分类器:;在本专利技术中,我们选择决策树为分类器:对于每一个决策树,生成算法如下:输入训练数据集特征集:,阙值输出:决策树i)若中所有实例属于同一类,则为单结点树,并将类作为该结点的类标记,返回;ii)若,则为单结点数,并将中实例数最大的类作为该结点的类标记,返回;iii)否则,计算出A中各特征对D的信息增益,选择信息增益最大的特征;经验熵经验条件熵信息增益iv)如果的信息增益小于阙值,则为单结点树,并将D中实例数最大的类作为该结点的类标记,返回;v)否则,对的每一可能值,依将D分割为若干非空子集,将中实例数最大的类作为标记,构建子结点,由结点及其子结点构成树,返回;vi)对第i个子结点,以为训练集,递归地调用步(i)~(vi),得到子数;(b)计算:在训练数据集上的分类误差率(c)计算的系数:(d)更新训练数据集的权值分布,其中是规范化因子;(3)构建基本分类器的线性组合:(4)得到最终的分类器:。步骤6、当实时数据进入系统会得到以下结果:其中图4为识别后用户正常用电行为,图5为识别后用户异常用电行为。本专利技术公开了一种基于大数据思维的客户用电行为分析模型,运用自回归和提升树算法,根据历史用电数据和实时的电力负荷情况来识别居民用电规律的系统及方法。该方式针对一个社区内的用户用电情况进行分析,将用电分析结果及潜在的用电风险推送给相应机构;对于智能化城市管理,将改善行政管理和提高用电安全的效率。对于供电机构,可以指导用户合理签订购售电合同、选择电价政策、生产活动安排,降低用户的生产、用能成本,促进用户利益最大化;同时公司可通过价格、政策等措施引导、推进用户进行结构调整,转变增长方式;指导用户合理签订购售电合同、选择电价政策、生产活动安排、错峰用电,降低用户的生产、用能成本,促进用户利益最大化、促进节能降耗。以上是对本专利技术的较佳实施进行了具体说明,但本专利技术创造并不限于所述实施例,熟悉本领域的技术人员在不违背本专利技术精神的前提下还可做出种种的等同变形或替换,这些等同的变型或替换均包含在本申请权利要求所限定的范围内。本文档来自技高网...

【技术保护点】
1.本专利技术一种基于自回归和提升树算法的居民用电行为分析的系统及方法的特征在于,包括:/n步骤1、数据收集模块:对每一个用电单位的用电数据进行收集和存储,用电负荷数据可以采用不同的频率进行录入,在进入分析之前会求和或再分配为小时;/n步骤2、根据步骤1中所取得的处理后的用电负荷数据,首先对每一个用户的用电数据进行异常分析,剔除掉极端值:/n1) 数据值为:/n

【技术特征摘要】
1.本发明一种基于自回归和提升树算法的居民用电行为分析的系统及方法的特征在于,包括:
步骤1、数据收集模块:对每一个用电单位的用电数据进行收集和存储,用电负荷数据可以采用不同的频率进行录入,在进入分析之前会求和或再分配为小时;
步骤2、根据步骤1中所取得的处理后的用电负荷数据,首先对每一个用户的用电数据进行异常分析,剔除掉极端值:
1)数据值为:



2)假设每一个用户的数据负荷高斯分布:






3)求出相应参数:



4)如果,则认为该值为极端值;
步骤3、根据步骤2中所取得的处理后的数据,对每一个用电单位数据进行自回归分析:
其中k值,我们选取48,为48小时;
步骤4、根据步骤3的结果,原数据为每一个用户的小时用电量,转化为每一用户的自回归系数,训练数据集:



其中N为用户数,是第i个用户的第j个特征,,是第j个特征可能取的第个值;
步骤5、通过步骤3的自回归分析结果,我们选择第24和48的值,如果两个值相加的和大于0.15,视为该用户用电行为正常;如果两个值相加的和小于0.15,视为该用户用电行为异常:接着采用提升树算法对实时数据进行分类:
输入:训练数据集,其中,,为别表
示1正常;-1异常;输出:最终的分类器;
(1)初始化训练数据的权重分布:



(2)对,m指的是第几个分类器:
(a)使用具有权重的的训练数据集学习,得到基本分类器:
;在本发明中,我们选择决策树为分类器:对于每一个决策树,生成算法如下:
输入训练...

【专利技术属性】
技术研发人员:胡炳谦周浩顾一峰韩俊
申请(专利权)人:上海积成能源科技有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1