一种输电通道多隐患声音分类标记方法及系统技术方案

技术编号：43562252 阅读：14 留言：0更新日期：2024-12-06 17:34

本发明专利技术提出了一种输电通道多隐患声音分类标记方法及系统，属于输电通道多隐患声音分类技术领域，包括：持续采集输电通道周围的声音信号；对声音信号进行处理并提取梅尔频谱图特征；将提取的梅尔频谱图特征输入到训练好的分类标记模型中进行预测，输出该声音信号中包含的声音类型。实现声音信号中包含的单类或者多类隐患声音类型的分类标记，提高多隐患同时出现时的监测能力，进一步保障电力设施的安全。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于输电通道多隐患声音分类领域，尤其涉及一种输电通道多隐患声音分类标记方法及系统。

技术介绍

1、本部分的陈述仅仅是提供了与本专利技术相关的
技术介绍
信息，不必然构成在先技术。

2、输电通道场景是指户外电力输电线场景，输电线通过杆塔安装在空中，实现电力传输，输电线暴露在室外环境存在很多隐患，比如大型鸟类易造成输电线短路，输电线周围施工可能会对输电线造成破坏等；因此，需要通过一些技术手段对输电线周围的隐患进行监测，当有隐患出现及时预警，后续可以采取其他防范措施。

3、目前输电通道场景存在多种隐患声音，该场景下的声音分类技术主要通过声学特征结合深度学习进行多类单标签的分析，每次输入一个音频信号只输出得分最高的一类，也就是说每次针对一个输入信号只输出一个类别。

4、当前声音分类的研究也有很多，包括传统机器学习方法和深度学习方法，例如，支持向量机这种传统机器学习方法，适用于小样本和高维数据，能够处理音频特征提取后的多标签分类任务；深度学习方法包括卷积神经网络，主要用于处理音频特征图，能捕捉到局部特征，适合多标签分类任务。近年来，基于自注意力机制的transformer架构也被应用于音频分类，能够建模长范围的依赖关系；声音分类主流特征也比较多，如：梅尔频谱、梅尔倒谱系数以及fbank等。

5、现有文献中存在的技术主要包括：申请号：cn202110679471.x一种基于卷积神经网络关系建模的环境声音分类方法；申请号：cn202410093149.2，一种水下声音分类模型训练方法、系统

6、经过分析发现，现有技术对于环境声音分类多采用输出声音信号中预测得分最大的类别，适用于类型单一的情况，对于声音信号中同时包含多类声音的情况容易出现漏检、误检。

7、另外，现有文献还公开了cn114464215b_一种输电线路通道隐患监测方法及设备，通过视听采集设备内的声音分类算法，确定出隐患音频数据，能够将无隐患的音频数据进行滤除，从而减少进行隐患处理的音频数据，提高隐患分析速度。其次，本申请实施例通过预设音频特征提取器与预设声音分类器，能够对隐患数据进行类别识别以及声音起始时间识别，从而得到详细的输电线路隐患信息。此外，本申请实施例通过声音识别的第一输电线路隐患信息，与通过图像识别出的第二输电线路隐患信息，结合得到输电线路隐患等级，能够在因天气、环境变化等情况下，实时对输电线路进行监测，及时准确的确定出输电线路发生的隐患，从而确保输电线路的稳定运行。

8、上述该方案对于隐患声音与无隐患声音交替单独出现有效果，但是对于隐患和无隐患声音混叠出现容易产生误判，而且从上述文本描述来看，该方案只区分有隐患和无隐患，并没有对隐患的具体类型进行识别，后续很难针对隐患采取相应有效的防范措施。

技术实现思路

1、为克服上述现有技术的不足，本专利技术提供了一种输电通道多隐患声音分类标记方法，实现对同时包含多种类型隐患声音的分类。

2、为实现上述目的，本专利技术的一个或多个实施例提供了如下技术方案：

3、第一方面，公开了一种输电通道多隐患声音分类标记方法，包括：

4、持续采集输电通道周围的声音信号；

5、对声音信号进行处理并提取梅尔频谱图特征；

6、将提取的梅尔频谱图特征输入到训练好的分类标记模型中进行预测，输出该声音信号中包含的声音类型；

7、其中，所述分类标记模型包括卷积层、深度可分离卷积层、瓶颈层、se模块以及全局平均池化和分类层；

8、其中卷积层用于对输入的梅尔频谱图特征进行特征提取；

9、深度可分离卷积层对提起的提取再次进行处理以减小计算复杂度；

10、瓶颈层主要采用1x1卷积进行通道压缩；

11、se模块用于在通道维度上对特征进行重新校准，通过学习每个通道的重要性权重，自适应地调整特征图的通道权重，以便网络能够更好地关注重要的特征；

12、全局平均池化，用于减少特征维度，获得更紧凑的特征表示；

13、分类层用于为每个目标声音类型提供概率。

14、作为进一步的技术方案，所述分类标记模型在训练的过程中使用输电通道多隐患声音数据集进行训练。

15、作为进一步的技术方案，所述输电通道多隐患声音数据集的构建过程为：

16、采集输电通道周围存在的声音数据；

17、对采集的声音数据进行分析，根据统计分析及输电场景感兴趣的声音确定标注声音类型，相应的标注文件也按照划分的声音类型进行构建，后续根据每个声音文件中包含的具体声音类别在相应的标注文件类别下进行标注；

18、最终将所有标注过的音频放到一个文件夹下，所有音频对应的标注标签整理到一个csv表格文件中，从标注文件中按照比例拆分成训练标签数据csv文件、测试标签数据csv文件、验证标签数据csv文件，外加一个数据集包含所有声音类型文件，完成输电通道多隐患声音数据集的构建。

19、作为进一步的技术方案，根据每个声音文件中包含的具体声音类别在相应的标注文件类别下进行标注，具体的标注过程为：

20、将所有的待标注的声音文件生成一个总的标注文件，标注文件中包含所有声音文件的文件名以及对应的类型标签；

21、对所有音频进行标注，对每个音频进行检查，确认是否存在确定的标注声音类型中的声音类型，根据存在与否以及音频中包含声音的明确程度依次打分；

22、然后，所有声音数据标注完成之后会有三个标注文件，对于三个标注文件采用筛选机制确定最终的数据标签。

23、作为进一步的技术方案，采用筛选机制确定最终的数据标签的过程为：

24、对照检查三个标注文件中声音文件数量及名称是否一致，确保三个标注文件标记了同样的音频数据；

25、确认好一致性后，对标注文件中所有类别根据标注分数对标签进行二值化处理0或者1；

26、最后将同一音频对应的三个标注的类别取交集，得到最终音频数据标注，音频对应的标注标签可以能是一类，也可能为多类，具体情况由其实际包含的声音决定。

27、作为进一步的技术方案，对标签进行二值化处理0或者1，具体操作：每个音频对应各个类别的得分以0.8为阈值进行处理，大于等于0.8的赋值为1，否则赋值为0。

28、作为进一步的技术方案，所述对声音信号进行处理并提取梅尔频谱图特征，具体过程为：

29、采用高通滤波器对声音信号进行预加重处理，以均衡高低频之间强度的差异；

30、本文档来自技高网...

【技术保护点】

1.一种输电通道多隐患声音分类标记方法，其特征是，包括：

2.如权利要求1所述的一种输电通道多隐患声音分类标记方法，其特征是，所述分类标记模型在训练的过程中使用输电通道多隐患声音数据集进行训练。

3.如权利要求2所述的一种输电通道多隐患声音分类标记方法，其特征是，所述输电通道多隐患声音数据集的构建过程为：

4.如权利要求3所述的一种输电通道多隐患声音分类标记方法，其特征是，根据每个声音文件中包含的具体声音类别在相应的标注文件类别下进行标注，具体的标注过程为：

5.如权利要求4所述的一种输电通道多隐患声音分类标记方法，其特征是，采用筛选机制确定最终的数据标签的过程为：

6.如权利要求1所述的一种输电通道多隐患声音分类标记方法，其特征是，所述对声音信号进行处理并提取梅尔频谱图特征，具体过程为：

7.一种输电通道多隐患声音分类标记系统，其特征是，包括：

8.一种计算机程序产品，包括计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法。

9.一种计算机装置,

10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时执行上述权利要求1-6任一所述方法的步骤。

...

【技术特征摘要】

1.一种输电通道多隐患声音分类标记方法，其特征是，包括：

2.如权利要求1所述的一种输电通道多隐患声音分类标记方法，其特征是，所述分类标记模型在训练的过程中使用输电通道多隐患声音数据集进行训练。

3.如权利要求2所述的一种输电通道多隐患声音分类标记方法，其特征是，所述输电通道多隐患声音数据集的构建过程为：

5.如权利要求4所述的一种输电通道多隐患声音分类标记方法，其特征是，采用筛选机制确定最终的数据标签的过程为：

6.如...

【专利技术属性】
技术研发人员：郑文杰，李壮壮，孙晓斌，张峰达，李程启，孙艺玮，林颖，杨祎，刘萌，杜伦，贾然，刘强，
申请(专利权)人：国网山东省电力公司电力科学研究院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人