一种用于局部放电模式识别算法的PRPD图谱数据增强方法,将不同格式的PRPD图谱图片通过背景色彩稳定且背景占比最大的特征进行背景特征的提取,通过PRPD图谱图片中局部放电信号的表示形式一般为实心圆或者实心矩形且占有多个像素点的特征进行局部放电幅值和相位的提取,实现PRPD图谱图片由图片格式向数据格式的转换,并完成归一化处理;通过随机抽取的方法实现PRPD图谱数据的有效扩充,完成PRPD图谱数据的增强。从而为基于机器学习的局部放电模式识别算法提供更多的有效原始数据。模式识别算法提供更多的有效原始数据。模式识别算法提供更多的有效原始数据。
【技术实现步骤摘要】
一种用于局部放电模式识别算法的PRPD图谱数据增强方法
[0001]本专利技术涉及高压电力装备故障智能化诊断领域,具体的说是一种用于局部放电模式识别算法的PRPD图谱数据增强方法。
技术介绍
[0002]局部放电是反映高压电力装备的绝缘状态的常用指标之一,而局部放电类型是现场检测中关注的重点,因此开展局部放电类型的模式识别研究是十分必要的。
[0003]目前局部放电模式识别方法通常利用PRPD图谱作为原始数据,以机器学习作为核心算法进行模式识别,一般包括三个步骤:(1)数据收集;(2)数据清洗;(3)数据挖掘。其中基于机器学习算法有效的前提是庞大的样本数据,即在数据收集步骤需要获得大量的数据。但是,以下几个方面的原因导致可用于模式识别的PRPD图谱数据较少:(1)装备发生局部放电的拆机验证过程比较困难,因此得到有效验证的局部放电案例较少,导致有效的局部放电PRPD图谱数据不多;(2)不同厂家的局部放电检测仪器检测结果的格式不统一;(3)早期大量的检测结果没有保存数据文件,仅保留图片文件;(4)电力装备用户单位众多,不同单位之间的数据无法实现有效的交流。以上原因导致有效的PRPD图谱数据总量较少,且格式不统一。即便搜集到大量的原始数据,因格式差别较大,在数据清洗阶段也被清洗,造成数据的浪费。这个问题严重制约着局部放电检测仪器的模式识别功能。同时局部放电的发生是随时间变化的动态过程,而获得PRPD图谱图片格式数据是一种静态数据,图片数据直接用于数据挖掘是一种数据浪费。
技术实现思路
[0004]本专利技术旨在提供一种用于局部放电模式识别算法的PRPD图谱数据增强方法,为基于机器学习的局部放电模式识别算法提供更多的有效原始数据。
[0005]为了解决以上技术问题,本专利技术采用的具体方案为:一种用于局部放电模式识别算法的PRPD图谱数据增强方法,将不同格式的PRPD图谱图片通过背景色彩稳定且背景占比最大的特征进行背景特征的提取,通过PRPD图谱图片中局部放电信号的表示形式一般为实心圆或者实心矩形且占有多个像素点的特征进行局部放电幅值和相位的提取,实现PRPD图谱图片由图片格式向数据格式的转换,并完成归一化处理;通过随机抽取的方法实现PRPD图谱数据的有效扩充,完成PRPD图谱数据的增强。
[0006]优选的,包括以下步骤:
[0007]S1、将不同格式的PRPD图谱图片转化为RGB图片数据格式,记做矩阵 pic_rgb[i,j],其中i、j为像素点的坐标,每个坐标点包含r、g、b三个原色值;
[0008]S2、将矩阵pic_rgb[i,j]转换为灰度图矩阵pic_gray[i,j],其中i、j为像素点的坐标,每个坐标点包含灰度值g,g的取值范围为0
‑
255;
[0009]S3、利用PRPD图谱图片中背景色彩稳定且背景占比最大的特征,进行背景特征提取,具体步骤如下:
[0010]S301、初始化灰度频次数组N_gray[n],n的取值范围为0
‑
255;
[0011]S302、依次读取S2中获取的灰度图矩阵pic_gray[i,j]中各个像素点的灰度值g
ij
,将数组N_gray[g
ij
]对应的元素加1,直至全部像素点读取完毕;
[0012]S303、统计数组N_gray[n]中的最大值N_gray_max,对应的数组N_gray 元素序号g
ij
_max即为PRPD图谱图片中的背景特征值;
[0013]S4、初始化PRPD图谱图片的背景特征矩阵pic_back_flag[i,j],初值全部为0;设定相对灰度范围参数δ和绝对灰度参数η,以g
ij
_max
±
δ作为阈值范围在灰度矩阵中搜索,当pic_gray[i,j]在在此范围内,对应的pic_back_flag[i,j]值不变,当不在此范围内时且pic_gray[i,j]大于绝对绝对灰度参数η时,对应的 pic_back_flag[i,j]值置为1;
[0014]S5、初始化PRPD图谱图片的图谱特征矩阵pic_flag[i,j],初值全部为0;设定大小为p*q的滑动窗,将该滑动窗自图片的i=0,j=0处开始滑动,滑动方法为将滑动窗的最左上角像素点与图谱图片的像素点[i,j]重叠,计算各个像素点的图谱征矩阵pic_flag[i,j],计算方法如下:
[0015][0016]S6、利用PRPD图谱图片中局部放电信号的表示形式一般为实心圆或者实心矩形且占有多个像素点的特征进行局部放电幅值和相位的提取,具体步骤如下:
[0017]S601、初始化放电点的相位数组PD_phase[]和幅值数组PD_amp[],用于存储PRPD图谱图片中放电点的相位和幅值;
[0018]S602、依次读取图谱特征矩阵的各元素,当元素值大于0.7时,将该像素点设定为局部放电点,将该像素点的横坐标存入数组PD_phase[]中,纵坐标存入PD_amp[]中;
[0019]S7、利用数组PD_phase[]和PD_amp[]按照统一规则重新绘制PRPD图谱图片,该图片即为归一化之后的PRPD图谱;
[0020]优选的,针对S7中获取的归一化之后的PRPD图谱,在数组PD_phase[] 和PD_amp[]对应随机抽取不同百分比的元素,按照统一的规则重新绘制PRPD图谱图片;设定t个百分比值,每个百分比值下随机抽取s次,即通过一张PRPD 图谱的图片格式数据生成t*s张PRPS图谱数据。
[0021]优选的,S4中,η取值大于5小于10,δ的取值不大于3,并且当g
ij
_max+δ大于255时,阈值上限取255;当g
ij
_max
‑
δ小于0时,阈值下限取0。
[0022]优选的,S5中,p和q的取值大于2且小于6。
[0023]本专利技术可利用搜集来的不同来源、不同格式的PRPD图谱的图片格式数据进行反向识别,通过图谱背景色彩稳定且背景占比最大的特征进行背景特征的提取,通过图谱中局部放电信号的表示形式一般为实心圆或者实心矩形且占有多个像素点的特征,进行局部放电幅值和相位的提取,实现图谱有图片格式向数据格式的转换,完成归一化处理,且可通过随机抽取的方法实现PRPD图谱数据的有效扩充,完成数据的增强。为基于机器学习的局部放电模式识别算法提供更多的有效原始数据,对提升原始数据的利用效率具有重要的工程实用意义。
附图说明
[0024]图1为本专利技术的实施流程图。
具体实施方式
[0025]以下针对两个PRPD图谱图片样本进行图谱数据增强,通过增强过程对本专利技术的技术方案进行详细说明。如表1所示。两个样本的特征差别较大,区别在于以下四个方面:(1)背景颜色不同;(2)图谱中放电点的形状不同;(3)图谱中放电点的颜色不同;(4)图片的清晰度不同。步骤如下:
[0026]S1、读取图片本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种用于局部放电模式识别算法的PRPD图谱数据增强方法,其特征在于:将不同格式的PRPD图谱图片通过背景色彩稳定且背景占比最大的特征进行背景特征的提取,通过PRPD图谱图片中局部放电信号的表示形式一般为实心圆或者实心矩形且占有多个像素点的特征进行局部放电幅值和相位的提取,实现PRPD图谱图片由图片格式向数据格式的转换,并完成归一化处理;通过随机抽取的方法实现PRPD图谱数据的有效扩充,完成PRPD图谱数据的增强。2.根据权利要求1所述的一种用于局部放电模式识别算法的PRPD图谱数据增强方法,其特征在于:包括以下步骤:S1、将不同格式的PRPD图谱图片转化为RGB图片数据格式,记做矩阵pic_rgb[i,j],其中i、j为像素点的坐标,每个坐标点包含r、g、b三个原色值;S2、将矩阵pic_rgb[i,j]转换为灰度图矩阵pic_gray[i,j],其中i、j为像素点的坐标,每个坐标点包含灰度值g,g的取值范围为0
‑
255;S3、利用PRPD图谱图片中背景色彩稳定且背景占比最大的特征,进行背景特征提取,具体步骤如下:S301、初始化灰度频次数组N_gray[n],n的取值范围为0
‑
255;S302、依次读取S2中获取的灰度图矩阵pic_gray[i,j]中各个像素点的灰度值g
ij
,将数组N_gray[g
ij
]对应的元素加1,直至全部像素点读取完毕;S303、统计数组N_gray[n]中的最大值N_gray_max,对应的数组N_gray元素序号g
ij
_max即为PRPD图谱图片中的背景特征值;S4、初始化PRPD图谱图片的背景特征矩阵pic_back_flag[i,j],初值全部为0;设定相对灰度范围参数δ和绝对灰度参数η,以g
ij
_max
±
δ作为阈值范围在灰度矩阵中搜索,当pic_gray[i,j]在在此范围内,对应的pic_back_flag[i,j]值不变,当不在此范围...
【专利技术属性】
技术研发人员:胡迪,陈忠,杨为,朱太云,张国宝,蔡梦怡,吴正阳,
申请(专利权)人:国网安徽省电力有限公司电力科学研究院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。