一种风向聚类方法、装置及电子设备制造方法及图纸

技术编号:29097157 阅读:27 留言:0更新日期:2021-06-30 10:07
本发明专利技术提供了一种风向聚类方法、装置及电子设备,其中,该方法包括:获取风电场各风机的周期性风向数据;根据周期性风向数据确定适用于周期性风向数据的相似性度量指标;基于相似性度量指标,选出k个聚类中心,并将周期性风向数据划为k个簇;基于周期性风向数据确定误差平方和准则函数;基于误差平方和准则函数对k个簇的聚类效果进行评价,确定最终聚类效果。其中,通过周期性风向数据确定适用于周期性风向数据的相似性度量指标与误差平方和准则函数,解决了传统K

【技术实现步骤摘要】
一种风向聚类方法、装置及电子设备


[0001]本专利技术涉及数据聚类
,具体而言,涉及一种风向聚类方法、装置及电子设备。

技术介绍

[0002]目前,我国风力发电正处于快速且稳步发展的时期,然而,风能具有随机性和波动性,造成了风电场输出功率具有较大的不确定性。现有研究主要集中在风速特征对风电出力的影响,而风向也是影响风电出力的重要因素。在研究风向因素时,为了避免人为划分扇区具有一定主观性的缺点,采用聚类算法,对风机数据采集与监控系统所记录的风向数据进行聚类,并依据聚类结果划分风向扇区。
[0003]现有技术中常用的聚类算法有K

means聚类,K

means算法是一种十分基础的无监督聚类算法,但对于风向数据而言,传统的k

means聚类无法获得较好的聚类效果。由于大气的不可压缩流动性和惯性,导致了风向数据的周期性,对风向数据进行采样统计时发现,在一定时间尺度范围内,风向会在一定范围内来回摆动,由于风向数据的周期性,经过连续时间序列采样后的风向数据,总是以不同的频率出现在区间[0,360]内,而在风向频率统计图上,风向5
°
和风向355
°
之间只相差了10
°
,而不是两者直接相减,这导致K

means算法原本定义的计算样本间相似性的距离度量指标在对周期性的风向数据进行聚类计算时不再适用。
[0004]基于此,亟需改进现有的K

means算法以适用对周期性风向数据的聚类,从而获得较好的风向数据聚类效果。

技术实现思路

[0005]有鉴于此,本专利技术的目的在于提供一种风向聚类方法、装置以及电子设备,能够通过风向变化角度确定相似度量指标与误差平方和准则函数,解决传统聚类算法不适用于对周期性风向数据进行聚类的缺点。
[0006]第一方面,本专利技术实施例提供了一种风向聚类方法,方法包括:
[0007]获取风电场各风机的周期性风向数据,周期性风向数据表征风电场各风机的历史运行数据;根据周期性风向数据确定适用于周期性风向数据的相似性度量指标;基于相似性度量指标,选出k个聚类中心,并将周期性风向数据划为k个簇;基于周期性风向数据确定误差平方和准则函数,其中,误差平方和准则函数适用于评价周期性风向数据的聚类效果;基于误差平方和准则函数对k个簇的聚类效果进行评价,确定最终聚类效果。
[0008]优选地,获取风电场各风机的周期性风向数据的步骤,包括:按照预设的采样时间采集风电场各风机的风向数据;存储风向数据,将存储的风向数据作为周期性风向数据。
[0009]优选地,聚类中心的数量k不少于2类,并且,聚类中心的数量k不大于8类。
[0010]优选地,根据周期性风向数据确定适用于周期性风向数据的相似性度量指标,包括:基于周期性风向数据,确定风向变化角度;基于风向变化角度,确定周期性风向数据中
风向样本之间的相似性度量指标;基于相似性度量指标,选出k个聚类中心,包括:在周期性风向数据中选择一个目标风向样本作为初始聚类中心;计算周期性风向数据中除目标风向样本之外的其余风向样本与初始聚类中心之间的相似性度量指标;依次计算每个风向样本被选为下一个聚类中心的概率,依据轮盘赌算法选出下一个聚类中心,计算周期性风向数据中除目标风向样本之外的其余风向样本与下一个聚类中心之间的相似性度量指标;直到选出k个聚类中心。
[0011]优选地,周期性风向数据集合X为:
[0012][0013]其中,x
i
={x
i1
,x
i2
,

,x
ip
},x
i
∈X,x
i
表示第i台风机采集的风向样本,X为n
×
p维数据,n表示n台风机,p表示共有p个采样时刻风向数据。
[0014]基于周期性风向数据,确定风向变化角度包括:
[0015]通过下述算式计算风向变化角度D
im

[0016][0017]其中,x
im
∈x
i
,x
jm
∈x
j
,x
im
表示第i台风机在第m时刻采集的风向样本,x
jm
表示第j台风机在第m时刻采集的风向样本。
[0018]优选地,根据所述周期性风向数据确定适用于周期性风向数据的相似性度量指标,包括:
[0019]通过下述算式计算相似性度量指标D(x
i
,x
j
):
[0020][0021]其中,D
im
表示第i台风机和第j台风机在第m时刻采集的两个风向样本之间的风向变化角度。
[0022]优选地,在基于相似性度量指标,选出k个聚类中心之后,方法还包括:
[0023]通过下述步骤计算聚类中心:计算周期性风向数据中各风向样本到k个聚类中心之间的相似性度量指标D(x
i
,x
j
),将风向样本归属到与聚类中心相似性度量指标最小的簇内,完成对周期性风向数据的聚类,得到k个簇;计算每个簇内所有风向样本的均值,并将该均值作为新的聚类中心;
[0024]重复执行步骤计算聚类中心的步骤,直至聚类中心不再变化,得到聚类结果。
[0025]优选地,基于误差平方和准则函数对k个簇的聚类效果进行评价,确定最终聚类效果包括:
[0026]通过下述算式计算误差平方和准则:
[0027][0028]其中,D
im
表示第i个簇内第m个风向样本到簇内聚类中心的风向变化角度,i=1,2,...,k,m=1,2,...,l,k表示共有k个簇,l表示第k个簇内除聚类中心外其余风向样本的个数。
[0029]根据误差平方和的大小,评价不同聚类数下对周期性风向数据的聚类效果,确定最终聚类效果。
[0030]第二方面,本专利技术实施例还提供了一种风向聚类装置,装置包括:
[0031]数据获取模块,用于获取风电场各风机的周期性风向数据,周期性风向数据表征风电场各风机的历史运行数据;
[0032]指标确定模块,用于根据周期性风向数据确定适用于周期性风向数据的相似性度量指标;
[0033]数据划分模块,用于基于相似性度量指标,选出k个聚类中心,并将周期性风向数据划为k个簇;
[0034]函数确定模块,用于基于周期性风向数据确定误差平方和准则函数,其中,误差平方和准则函数适用于评价周期性风向数据的聚类效果;
[0035]效果确定模块,用于基于误差平方和准则函数对k个簇的聚类效果进行评价,确定最终聚类效果。
[0036]第三方面,本专利技术实施例还提供一种电子设备,包括:处理器、存储器和总线,存储器存储有处理器可执行的机器可读指令,当电子设备运行时,处理器与存储器之间通过总线通信本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种风向聚类方法,其特征在于,包括:获取风电场各风机的周期性风向数据,所述周期性风向数据表征所述风电场各风机的历史运行数据;根据所述周期性风向数据确定适用于周期性风向数据的相似性度量指标;基于所述相似性度量指标,选出k个聚类中心,并将所述周期性风向数据划为k个簇;基于所述周期性风向数据确定误差平方和准则函数,其中,所述误差平方和准则函数适用于评价所述周期性风向数据的聚类效果;基于所述误差平方和准则函数对所述k个簇的聚类效果进行评价,确定最终聚类效果。2.根据权利要求1所述的方法,其特征在于,获取风电场各风机的周期性风向数据的步骤,包括:按照预设的采样时间采集风电场各风机的风向数据;存储所述风向数据,将存储的所述风向数据作为周期性风向数据。3.根据权利要求1所述的方法,其特征在于,所述聚类中心的数量k不少于2类,并且,所述聚类中心的数量k不大于8类。4.根据权利要求1所述的方法,其特征在于,所述根据所述周期性风向数据确定适用于周期性风向数据的相似性度量指标,包括:基于所述周期性风向数据,确定风向变化角度;基于所述风向变化角度,确定所述周期性风向数据中风向样本之间的相似性度量指标;所述基于所述相似性度量指标,选出k个聚类中心,包括:在所述周期性风向数据中选择一个目标风向样本作为初始聚类中心;计算所述周期性风向数据中除所述目标风向样本之外的其余风向样本与初始聚类中心之间的相似性度量指标;依次计算每个风向样本被选为下一个聚类中心的概率,依据轮盘赌算法选出下一个聚类中心,计算所述周期性风向数据中除所述目标风向样本之外的其余风向样本与下一个聚类中心之间的相似性度量指标;直到选出k个聚类中心。5.根据权利要求4所述的方法,其特征在于,所述周期性风向数据集合X为:其中,x
i
={x
i1
,x
i2
,

,x
ip
},x
i
∈X,x
i
表示第i台风机采集的风向样本,X为n
×
p维数据,n表示n台风机,p表示共有p个采样时刻风向数据;所述基于所述周期性风向数据,确定风向变化角度包括:通过下述算式计算风向变化角度D
im

其中,x
im
∈x
i
,x
jm
∈x
j
,x
im
表示第i台风机在第m时刻采集的风向样本,x

【专利技术属性】
技术研发人员:胡阳李倩房方郭小江王庆华刘吉臻
申请(专利权)人:华能集团技术创新中心有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1