Including the present invention relates to a method and device for mining industry, electricity data relationship among them, methods: to obtain each electricity industry monthly electricity consumption data, the monthly electricity consumption data were normalized by all normalized each month; industry after the treatment of discretizing consumption data discretization method entropy based on the data of all industries; discrete treatment of the electricity data using the Apriori algorithm for mining association relation between industries. The technical scheme for extraction of electric information acquisition system in industry consumption data instead of the average load, avoids the instantaneous load characteristics analysis of possible interference caused by the overall load, the discretization method based on entropy for discrete processing industry consumption data, data mining analysis through Apriori algorithm, the frequent itemsets the mining of association rules, the different sectors of the electricity data mining association.
【技术实现步骤摘要】
一种行业用电数据关联关系挖掘方法及装置
本专利技术涉及数据挖掘
,特别涉及一种行业用电数据关联关系挖掘方法及装置。
技术介绍
智能电网作为解决未来能源输送问题的理想方案,成为电网发展的必然趋势。智能电网作为能源配置的绿色平台,是应对挑战、促进我国低碳发展的战略支点。伴随着智能电网的发展,关于负荷特性的有关研究也成为热点。基于智能电网的负荷分析目前还停留在区域性的或整体负荷分析,且因电网负荷是由众多用户负荷构成,不同用户的负荷受自身行业属性和生产特点影响,负荷规律也是千差万别,行业间的关联关系也对用户的用电行为产生一定影响。国内对于负荷特性研究较多的是网、省级电网的负荷特性,对于行业负荷特性的分析较少涉及,这些研究主要是调研普查性质,对未来行业负荷、行业电量走势的预判未考虑行业间的关联关系,分析预测存在一定误差。
技术实现思路
为解决现有技术的问题,本专利技术提出一种行业用电数据关联关系挖掘方法及装置,对未来行业负荷、行业电量走势的预判考虑行业间的关联关系,为分析行业用电量趋势提供了依据。为实现上述目的,本专利技术提供了一种行业用电数据关联关系挖掘方法,包括:获取每个用电行业的月用电量数据,对所述月用电量数据进行归一化处理;采用基于熵的数据离散化方法将归一化处理后的每个行业的所有月用电量数据进行离散化处理;对离散化处理后的所有行业的用电数据采用Apriori算法挖掘行业间的关联关系。优选地,所述采用基于熵的数据离散化方法将归一化处理后的每个行业的所有月用电量数据进行离散化处理的步骤包括:根据归一化处理后的每个行业的所有月用电量数据,确定每个行业的数值区间A ...
【技术保护点】
一种行业用电数据关联关系挖掘方法,其特征在于,包括:获取每个用电行业的月用电量数据,对所述月用电量数据进行归一化处理;采用基于熵的数据离散化方法将归一化处理后的每个行业的所有月用电量数据进行离散化处理;对离散化处理后的所有行业的用电数据采用Apriori算法挖掘行业间的关联关系。
【技术特征摘要】
1.一种行业用电数据关联关系挖掘方法,其特征在于,包括:获取每个用电行业的月用电量数据,对所述月用电量数据进行归一化处理;采用基于熵的数据离散化方法将归一化处理后的每个行业的所有月用电量数据进行离散化处理;对离散化处理后的所有行业的用电数据采用Apriori算法挖掘行业间的关联关系。2.如权利要求1所述的方法,其特征在于,所述采用基于熵的数据离散化方法将归一化处理后的每个行业的所有月用电量数据进行离散化处理的步骤包括:根据归一化处理后的每个行业的所有月用电量数据,确定每个行业的数值区间A以及数据元组集D,使得数值区间A包含归一化处理后的每个行业的所有月用电量数据;其中,数据元组集D中每个数据元组包括:行业的信息和对应行业的归一化处理后的月用电量数据;确定第一分裂点,根据所述第一分裂点将所述数值区间A划分成两个数值区间,并将数据元组集D划分成两个数据元组子集;其中,所述数值区间内期望信息需求最小的数据点作为分裂点;如果划分后的所述数值区间内的归一化处理后的月用电量数据的期望信息需求均大于等于阈值或划分后的所述数值区间内的归一化处理后的月用电量数据个数小于等于阈值时,确定符合条件的数值区间的分裂点,直至划分后的所述数值区间内的归一化处理后的月用电量数据的信息需求小于阈值或划分后的所述数值区间内的归一化处理后的月用电量数据个数大于阈值。3.如权利要求2所述的方法,其特征在于,所述期望信息需求的表达式为:其中,|D|是数据元组集D中的元组的个数,|D1|为分裂点划分数据元组集D后获得的子集D1的元组数,|D2|为分裂点划分数据元组集D后获得的子集D2的元组数;子集D1中的归一化处理后的月用电量数据分别属于行业类的个数为m,pi是子集D1中元组属于行业类i的概率,子集D2中的归一化处理后的月用电量数据分别属于行业类的个数为n,qi是D2中元组属于行业类i的概率。4.如权利要求1所述的方法,其特征在于,对所述月用电量数据进行归一化处理的表达式为:其中,x′为归一化后的取值,xi是本行业的第i个月份的电量,min(x)是本行业所有数据的最小值,max(x)是某行业所有数据的最大值。5.如权利要求1所述的方法,其特征在于,所述获取每个用电行业的月用电量数据的步骤包括:从用电信息采集系统中获取用电行业所有用户的日电量,空缺数值采用相似日均值进行填补;按照用户、行业将所有日电量数据合并为用电行业的月用电量数据。6.一种行业用电数据关联关系挖掘装置,...
【专利技术属性】
技术研发人员:周辛南,谢枫,傅军,孙志杰,孙贝贝,王海燕,方茂益,许鑫,朱天博,
申请(专利权)人:国家电网公司,国网冀北电力有限公司电力科学研究院,华北电力科学研究院有限责任公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。