输电线路鸟类声音识别模型优化方法技术

技术编号:39799366 阅读:8 留言:0更新日期:2023-12-22 02:30
本发明专利技术公开了一种输电线路鸟类声音识别模型优化方法

【技术实现步骤摘要】
输电线路鸟类声音识别模型优化方法、系统、介质及设备


[0001]本专利技术涉及输电线路监控
,尤其涉及一种输电线路鸟类声音识别模型优化方法

系统

介质及设备


技术介绍

[0002]近年来,电网大力推进可视化线路建设,以可视化

智能化手段提高输电线路的巡检效率,输电通道可视化技术在隐患的及时发现

及时预警方面起到了重要作用,对输电线路的安全性

可靠性保障以及智能化提升方面都做出了突出贡献

尽管近年来输电通道可视化技术及与之相关的人工智能技术都取得了一定进展,但仍处于起步阶段,距离满足输电运维需求还有很长的路要走

要满足安全性

可靠性

智能化输电线路的需求,不但需要研究视觉技术,还应广泛研究听觉

触觉

嗅觉相关技术

[0003]鸟类活动作为导致输电线路故障的一个重要因素,越来越多针对鸟害的防治措施不断被采取,例如加强巡视排查,使用防鸟驱鸟装置等

但是面对整体防鸟区域范围广

杆塔多

识鸟难度大等问题,一般的措施很难起到针对性的防治效果

鸟类的图像及声音分类的准确识别及图像音频检索是解决输电线路环境中防治鸟害如东方白鹳等大型鸟类问题的重要方法

[0004]当前基于深度学习的终端鸟叫声音分类算法的工作方式为:在云端服务器进行样本数据积累标注并进行模型训练,模型训练完毕经过测试量化压缩以后部署到移动终端进行推理

然而随着监控设备部署数量越来越多,各监控场千变万化,使得在云端训练并部署到监控终端的检测模型在不同背景下进行鸟叫声音识别缺少一定的鲁棒性

受限于云训练服务器的资源,为每个监控设备的安装场景单独训练一个模型几乎是无法实现的

而每一个输电线路监控设备长时间监控着一个固定的场景,其环境下活动的鸟种在一段时间内变化不大

因此如果只针对一个固定的场景研究声音分类算法常常能取得不错的效果,当场景发生变化,则及时的对算法进行调试,修改参数,最终也能达到较高的检测性能

因此,基于端侧的深度学习识别模型的在线调优非常有实际意义

[0005]当前输电线路监控鸟类声音的分析流程主要在云服务器进行

随着监拍装置的不断增多

监拍密度不断加大

源源不断的声音数据通过无线网络涌向云端分析服务器,给
4g
无线网络及云端服务器带来巨大压力

分析服务器不能及时分析处理海量的音频数据,造成大量的数据积压,引发搞告警延迟,隐患无法及时通知到用户,给输电线路的安全带来巨大隐患

[0006]将隐患分析智能迁移至监控设备进行前端分析是输电线路监控隐患识别的必然趋势,但是由于前端设备的低算力及低功耗的限制,常用的深度神经网络模型过大,不适合在终端进行前端隐患识别分析计算,只能部署轻量级的深度神经网络模型

然而轻量级网络模型对音频的特征表达不足,识别精度无法达到云端分析服务器的识别精度

另外,输电线路场景千变万化,用云端服务器训练的一个模型去识别所有输电场景下的隐患,导致网络模型与具体识别的输电线路监拍场景融合不足,导致大量误报,识别精度降低


技术实现思路

[0007]针对现有技术存在的不足,本专利技术的目的是提供一种输电线路鸟类声音识别模型优化方法

系统

介质及设备,能够从海量在运行的前端分析设备中筛选出需要进行模型迭代升级的设备子集,避免了对所有设备进行模型迭代升级训练的现象

并通过实时模型微调,极大的解决了不同场景下模型训练资源不够的问题,并能及时更新高漏报误报率的某场景隐患识别模型,降低误报及漏报

[0008]为了实现上述目的,本专利技术是通过如下的技术方案来实现:本专利技术第一方面提供了一种输电线路鸟类声音识别模型优化方法,包括以下步骤:获取当前场景一段时间内的背景声音,并对背景声音进行预处理;依次利用前端服务器和云端分析服务器对背景声音进行分类检测,得到背景声音的分类检测结果,根据分类检测结果生成初步样本集;利用缓存的声音记录

预置的样本以及初步样本集进行样本扩充,在线生成训练样本集;利用扩充后的样本集微调终端设备侧运行的鸟类声音识别模型,其中,微调过程包括:固定鸟类声音识别模型参数层,新初始化一个层作为微调层,仅配置微调层用于扩充后的样本集训练

[0009]进一步的,对背景声音进行预处理的步骤包括:对所有采集的背景声音进行强变化检测,从声音的本身

时域及频域三个角度对采集的背景声音进行判断,计算声压级

帧最大能量

频域平均能量三个特征值,将特征值与预先设定阈值进行比较,当三个特征值超过预设阈值则保留下来,否则就将背景声音滤除

[0010]进一步的,依次利用前端服务器和云端分析服务器对背景声音进行分类检测的具体步骤为:利用前端服务器对预处理后的背景声音与预设告警声音对比分类,判断是否达到模型优化标准;当预处理后的背景声音达到模型优化标准时,利用云端分析服务器对背景声音进行二次分类检测,确定背景声音的告警种类

[0011]更进一步的,利用云端分析服务器对背景声音进行二次分类检测的具体步骤为:对鸟鸣声音信号进行预加重和滑窗均匀分割处理,通过声图变换方法转化为对应的图像特征信息,获得的图像特征信息作为输入,使用训练好的鸟种识别模型,最终实现通过鸟鸣声对鸟种进行预测识别

[0012]更进一步的,鸟种识别模型的训练过程为:首先对鸟叫音频数据提取鸟类叫声特征,同时将地域特征和声音特征拼接作为新特征,将新特征输入到模型中,模型使用新特征进行训练,具体的,模型结构构建好之后,模型内部参数随机初始化,然后通过数据及正反向传播算法在不断地训练中对参数进行迭代更新,学习到能够拟合输电场景声音数据分布的参数,最终使用该模型结构和相应的参数共同实现鸟类声音的识别

[0013]更进一步的,所述告警声音根据每个场景环境中不同的常见鸟类声音进行设置

[0014]更进一步的,鸟类叫声特征采用梅尔频谱图,给每个地域赋予数字代号,然后对代号进行编码得到地域特征,然后将地域特征与叫声特征拼接为新特征作为模型输入

[0015]进一步的,得到背景声音的分类检测结果后,通过监控平台对分类检测结果进行人工审核确认

[0016]进一步的,利用缓存的声音记录

预置的样本以本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
输电线路鸟类声音识别模型优化方法,其特征在于,包括以下步骤:获取当前场景一段时间内的背景声音,并对背景声音进行预处理;依次利用前端服务器和云端分析服务器对背景声音进行分类检测,得到背景声音的分类检测结果,根据分类检测结果生成初步样本集;利用缓存的声音记录

预置的样本以及初步样本集进行样本扩充,在线生成训练样本集;利用扩充后的样本集微调终端设备侧运行的鸟类声音识别模型,其中,微调过程包括:固定鸟类声音识别模型参数层,新初始化一个层作为微调层,仅配置微调层用于扩充后的样本集训练
。2.
如权利要求1所述的输电线路鸟类声音识别模型优化方法,其特征在于,对背景声音进行预处理的步骤包括:对所有采集的背景声音进行强变化检测,从声音的本身

时域及频域三个角度对采集的背景声音进行判断,计算声压级

帧最大能量

频域平均能量三个特征值,将特征值与预先设定阈值进行比较,当三个特征值超过预设阈值则保留下来,否则就将背景声音滤除
。3.
如权利要求1所述的输电线路鸟类声音识别模型优化方法,其特征在于,依次利用前端服务器和云端分析服务器对背景声音进行分类检测的具体步骤为:利用前端服务器对预处理后的背景声音与预设告警声音对比分类,判断是否达到模型优化标准;当预处理后的背景声音达到模型优化标准时,利用云端分析服务器对背景声音进行二次分类检测,确定背景声音的告警种类
。4.
如权利要求3所述的输电线路鸟类声音识别模型优化方法,其特征在于,利用云端分析服务器对背景声音进行二次分类检测的具体步骤为:对鸟鸣声音信号进行预加重和滑窗均匀分割处理,通过声图变换方法转化为对应的图像特征信息,获得的图像特征信息作为输入,使用训练好的鸟种识别模型,最终实现通过鸟鸣声对鸟种进行预测识别
。5.
如权利要求4所述的输电线路鸟类声音识别模型优化方法,其特征在于,鸟种识别模型的训练过程为:首先对鸟叫音频数据提取鸟类叫声特征,同时将地域特征和声音特征拼接作为新特征,将新特征输入到模型中,模型使用新特征进行训练,具体的,模型结构构建好之后,模型内部参数随机初始化,然后通过数据及正反向传播算法在不断地训练中对参数进行迭代更新,学习到能够拟合输电场景声音数据分布的参数,最终使用该模型结构和相应的参数共同实现鸟类声音的识别
。6.
如权利要求5所述的输电线路鸟类声音识别模型优化方法,其特征在于,鸟类叫声特征采用梅尔频谱图,给每个...

【专利技术属性】
技术研发人员:沈浩李丹丹周超黄振宁梅红伟吴雄刘辉贾然李常勇程磊张洋刘嵘刘传彬李成毛永杰周学坤周立志孟海磊孙晓斌耿博
申请(专利权)人:国网山东省电力公司东营供电公司国网电力科学研究院武汉南瑞有限责任公司清华大学深圳国际研究生院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1