电场多元运行数据分析方法及装置制造方法及图纸

技术编号:15107334 阅读:96 留言:0更新日期:2017-04-08 19:51
本发明专利技术提供了一种电场多元运行数据分析方法及装置,方法包括:对电场多元运行数据的各指标数据进行标准化处理,生成各指标数据的标准化事物项集;利用正态分布隶属度函数对标准化事物项集进行模糊化处理生成模糊集,并确定各模糊集的隶属度值;根据各指标数据在各模糊集的隶属度值确定频繁1项集;根据确定的频繁1项集通过该迭代识别计算出频繁项集;利用Apriori算法的相关步骤生成频繁项集的关联规则;此关联规则即为电场多元数据分析的结果。提出了改进模糊函数关联规则挖掘算法,将其引入风电场多元运行数据的分析中,用分区的概念将布尔型关联规则转化为数值型关联规则,引入模糊数学中正态分布隶属函数概念,使边界更合理有效。

【技术实现步骤摘要】

本专利技术涉及电力技术,具体的将是一种电场多元运行数据分析方法及装置
技术介绍
随着风电的飞速发展、电力设备自动化的逐步加深以及大数据时代的到来,风电运行数据海量的积累且类型多样,而现有技术对运行数据的主要分析方法还集中在统计分析层面上,包括概率分布、回归分析、方差等,数据与数据之间潜在的相关性并没有得到充分的利用。数据挖掘技术按其承担的任务可分为分类、预测、关联规则分析、聚类分析和离群分析这五大类,而关联规则是数据挖掘领域中一个十分重要的挖掘算法,其侧重于确定数据中不同数据项之间的关系。R.Agrawal等人于1993年首次提出了布尔型关联规则挖掘算法(Apriori算法),但布尔型关联规则处理的值都是离散的、种类化的,它显示了这些变量之间的关系(即数据的数值只能为0或者1)。
技术实现思路
为定量给出电场多元数据中每个因素的影响度,本专利技术实施例提供了一种电场多元运行数据分析方法,方法包括:对电场多元运行数据的各指标数据进行标准化处理,生成各指标数据的标准化事物项集;利用正态分布隶属度函数对所述标准化事物项集进行分区以及模糊化处理生成模糊集,并确定各模糊集的隶属度值;根据各指标数据在各模糊集的隶属度值确定频繁1项集;根据确定的频繁1项集通过该迭代识别计算出频繁K项集;利用Apriori算法中构造关联规则的相关步骤确定所述频繁K项集的关联规则及可信度,生成电场多元数据分析结果。<br>本专利技术实施例中,对电场多元运行数据中的各指标数据进行标准化处理包括:采用极值标准化方法对电场多元运行数据进行标准化处理。本专利技术实施例中,所述的利用正态分布隶属度函数对所述标准化事物项集进行模糊化处理生成模糊集,并确定各模糊集的隶属度值包括:确定所述标准化事物项集中各指标数据的期望值;根据所述各指标数据的期望值、各指标数据的标准化事物项集中的最大值、最小值对所述标准化事物项集中的每一指标数据分别进行分区;根据预设的各分区的正态分布隶属度函数将所述标准化事物项集转化为模糊集并确定模糊集的隶属度值。本专利技术实施例中,所述的预设的各分区的正态分布隶属度函数为:rhigh(tij)=1tij≤μmine-(tij-μmin)22σhigh2μmin≤tij≤μmax,σhigh=μ0-μmin3]]>rmiddle(tij)=e-(μ0-tij)22σmiddle12μmin≤tij≤μ0,σmiddle1=μ0-μmin3e-(tij-μ0)22σmiddle22μ0≤tij≤μmax,σmiddle2=μmax-μ03]]>rlow(tij)=e-(μmax-tij)22σlow2μmin≤tij≤μmax,σlow=μmax-μ031tij≥μmax]]>其中,为所述标准化事物项集中标准化后的数据,μmin、μmax为各指标数据的标准化事物项集中的的最小值和最大值,μ0为指标数据的期望值。。本专利技术实施例中,所述的根据各指标数据在各模糊集的隶属度值确定频繁1项集包括:将各指标数据在对应的模糊集合中的隶属度权值;判断模糊集合的隶属度权值不小于预设的最小支持度时,将该模糊集合放入频繁1项集中。同时,本专利技术还提供一种电场多元运行数据分析装置,装置包括:标准化处理模块,用于对电场多元运行数据的各指标数据进行标准化处理,生成各指标数据的标准化事物项集;模糊处理模块,用于利用正态分布隶属度函数对所述标准化事物项集进行模糊化处理生成模糊集,并确定各模糊集的隶属度值;频繁1项集生成模块,用于根据各指标数据在各模糊集的隶属度值确定频繁1项集;频繁K项集生成模块,用于根据确定的频繁1项集通过该迭代识别计算出频繁K项集;分析结果生成模块,利用Apriori算法中构造关联规则的相关步骤确定所述频繁K项集的关联规则及可信度,生成电场多元数据分析结果。本专利技术实施例中,标准化处理模块采用极值标准化方法对电场多元运行数据进行标准化处理。本专利技术实施例中,所述的模糊处理模块包括:期望值确定单元,用于确定所述标准化事物项集中各指标数据的期望值;分区单元,根据所述各指标数据的期望值、各指标数据的标准化事物项集中的最大值、最小值对所述标准化事物项集进行分区;模糊集生成单元,根据预设的各分区的正态分布隶属度函数将所述标准化事物项集转化为模糊集并确定模糊集的隶属度值。本专利技术实施例中,所述的频繁1项集生成模块包括:隶属度权值生成单元,用于将各指标数据在对应的模糊集合中的隶属度权值;判断单元,判断模糊集合的隶属度权值不小于预设的最小支持度时,将该模糊集合放入频繁1项集中。本专利技术提出了改进模糊函数关联规则挖掘算法,将其引入风电场多元海量运行数据的分析工作中。该算法用分区的概念将布尔型关联规则转化为数值型关联规则,并且引入模糊数学中正态分布隶属函数的概念,使其边界更加合理有效。为让本专利技术的上述和其他目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附图式,作详细说明如下。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为关联规则基本模型;图2为本专利技术实施例提供的电场多元运行数据分析方法流程图;图3为本专利技术实施例中的模糊函数关联规则算法流程图;图4为本专利技术实施例中的隶属度函数;图5为本专利技术实施例中风机年发电量统计图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。缩略语和关键术语定义:(1)关联规则的定义:关联规则挖掘用于发现存在于数据库中的项目或属性间的有趣的关联或相关关系,即从数据集中识别出频繁出现的属性集(又称频繁项集),然后再利用这些频繁集创建描本文档来自技高网...

【技术保护点】
一种电场多元运行数据分析方法,其特征在于,所述的方法包括:对电场多元运行数据的各指标数据进行标准化处理,生成各指标数据的标准化事物项集;利用正态分布隶属度函数对所述标准化事物项集进行分区以及模糊化处理生成模糊集,并确定各模糊集的隶属度值;根据各指标数据在各模糊集的隶属度值确定频繁1项集;根据确定的频繁1项集通过该迭代识别计算出频繁K项集;利用Apriori算法中构造关联规则的相关步骤确定所述频繁K项集的关联规则及可信度,生成电场多元数据分析结果。

【技术特征摘要】
1.一种电场多元运行数据分析方法,其特征在于,所述的方法包括:
对电场多元运行数据的各指标数据进行标准化处理,生成各指标数据的标准化事物项
集;
利用正态分布隶属度函数对所述标准化事物项集进行分区以及模糊化处理生成模糊
集,并确定各模糊集的隶属度值;
根据各指标数据在各模糊集的隶属度值确定频繁1项集;
根据确定的频繁1项集通过该迭代识别计算出频繁K项集;
利用Apriori算法中构造关联规则的相关步骤确定所述频繁K项集的关联规则及可信
度,生成电场多元数据分析结果。
2.如权利要求1所述的电场多元运行数据分析方法,其特征在于,所述的对电场多元运
行数据中的各指标数据进行标准化处理包括:
采用极值标准化方法对电场多元运行数据进行标准化处理。
3.如权利要求1所述的电场多元运行数据分析方法,其特征在于,所述的利用正态分布
隶属度函数对所述标准化事物项集进行模糊化处理生成模糊集,并确定各模糊集的隶属度
值包括:
确定所述标准化事物项集中各指标数据的期望值;
根据所述各指标数据的期望值、各指标数据的标准化事物项集中的最大值、最小值对
所述标准化事物项集中的每一指标数据分别进行分区;
根据预设的各分区的正态分布隶属度函数将所述标准化事物项集转化为模糊集并确
定模糊集的隶属度值。
4.如权利要求3所述的电场多元运行数据分析方法,其特征在于,所述的预设的各分区
的正态分布隶属度函数为:
rhigh(tij)=1tij≤μmine-(tij-μmin)22σhigh2μmin≤tij≤μmax,σhigh=μ0-μmin3]]>rmiddle(tij)=e-(μ0-tij)22σmiddle12μmin≤tij≤μ0,σmiddle1=μ0-μmin3e-(tij-μ0)22σmiddle22μ0≤tij≤μmax,σmiddle2=μmax-μ03]]>rlow(tij)=e-(μmax-tij)22σlow2μmin≤tij≤μmax1tij≥μmax,σlow=μmax-μ03]]>其中,为所述标准化事物项集中标准化后的数据,μmin、μmax为各指标数据的标准化事
物项集中的的最小值和最大值,μ0为指标数据的期望值。
5.如权利要求4所述的电场多元运行数据分析方法,其特征在于,所述的根据各指标数
据在各模糊集的隶属度值确定频繁1项集包括:
将各指标数据在对应的模糊集合中的隶属度权值;
判断模糊集合的隶属度权值不小于预设的最小支持度时,将该模糊集合放入频繁1项
集中。
6.一...

【专利技术属性】
技术研发人员:刘辉赵宇思吴林林崔正湃刘晓鹏徐海翔任巍曦王若阳王皓靖
申请(专利权)人:华北电力科学研究院有限责任公司国网冀北电力有限公司电力科学研究院国家电网公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1