基于MFCC和扩散化高斯混合模型的电缆隐患识别方法及装置制造方法及图纸

技术编号：32659038 阅读：12 留言：0更新日期：2022-03-17 11:08

本发明专利技术提供了一种基于MFCC和扩散化高斯混合模型的电缆隐患识别方法及装置，涉及电缆隐患识别技术领域，方法包括：获取第一声音数据，第一声音数据经低通滤波降噪后进行预处理以获取第二声音数据；对第二声音数据进行频域变换以获取第三声音数据；将第三声音数据分为第三声音数据测试集以及第三声音数据训练集，构建扩散化的高斯混合模型分类器，利用第三声音数据测试集对构建好的扩散化的高斯混合模型分类器进行训练以对扩散化的高斯混合模型分类器参数进行优化；利用第三声音数据训练集对参数优化好的扩散化的高斯混合模型分类器进行测试。通过本发明专利技术可以缓解现有技术中难以检测到外破因素的发声时刻或是采集到大量无效的声音数据的技术问题。效的声音数据的技术问题。效的声音数据的技术问题。

全部详细技术资料下载

【技术实现步骤摘要】
基于MFCC和扩散化高斯混合模型的电缆隐患识别方法及装置

[0001]本专利技术涉及电缆隐患识别
，尤其是涉及一种基于MFCC和扩散化高斯混合模型的电缆隐患识别方法及装置。

技术介绍

[0002]随着城市建设的飞速发展，城市建设不断扩张加速，各大市政工程也随之铺开，主要涉及市政重点工程、地铁、桥梁、道路、房地产开发及城市配套管网供水、热力、燃气、通信施工等，时刻威胁到地下电缆的安全。传统电缆防外破方式采取人员定期巡视，现场看护等方式，该方式不仅效率极低，而且由于巡视周期的存在，并不能及时发现隐患进而开展应对工作。因此现阶段，地下电缆随时暴露在外破隐患风险中，为供电系统的安全稳定性运行埋下了无数个不稳定因素。
[0003]随着互联网及新媒体平台的迅猛发展，音频数据总量变得越来越庞大。在大数据及人工智能的背景下，音频场景识别技术可应用的领域越来越广泛，其重要性不言而喻。音频场景识别本质上是对声音信号中包含的声音特征及声学事件进行感知，并加以处理和分析，从而对音频信号进行分类。近年来对于人工智能的研究渐渐成熟，深度学习技术飞速发展，在模式识别、机器学习等领域取得了革命性的突破，使得越来越多的人投身有关深度学习的研究。
[0004]虽然围绕挖掘机、拉管机等外破隐患声音的时频特征已经开展了许多研究，并取得了大量分类算法。但由于挖掘机、拉管机发声具有随机性、响度较小，并且电缆通道大多建于路边，汽车等背景干扰大，使得实际工作中难以检测到外破因素的发声时刻或是采集到大量无效的声音数据。

技术实现思路
r/>[0005]有鉴于此，本专利技术的目的在于提供一种基于MFCC和扩散化高斯混合模型的电缆隐患识别方法及装置，以缓解现有技术中难以检测到外破因素的发声时刻或是采集到大量无效的声音数据的技术问题。
[0006]获取第一声音数据，所述第一声音数据包括背景声音数据、拉管机声音数据以及挖掘机声音数据，所述第一声音数据经低通滤波降噪后进行预处理以获取第二声音数据；
[0007]对所述第二声音数据进行频域变换以获取第三声音数据；
[0008]将所述第三声音数据分为第三声音数据测试集以及第三声音数据训练集，构建扩散化的高斯混合模型分类器，利用所述第三声音数据训练集对构建好的扩散化的高斯混合模型分类器进行训练以对所述扩散化的高斯混合模型分类器参数进行优化；
[0009]利用所述第三声音数据测试集对参数优化好的扩散化的高斯混合模型分类器进行测试。
[0010]优选的，所述获取第一声音数据，所述第一声音数据包括背景声音数据、拉管机声音数据以及挖掘机声音数据，所述第一声音数据经低通滤波降噪后进行预处理以获取第二
声音数据的步骤包括：
[0011]采用如下步骤获取所述第一声音数据中的有效数据所述第二声音数据：
[0012]将所述获取第一声音数据进行切分以获取第一声音数据片段；
[0013]对所述第一声音片段进行低通滤波以及分帧处理；
[0014]获取所述第一声音片段中的有效声音片段以获取第二声音数据。
[0015]优选的，所述获取所述第一声音片段中的有效声音片段以获取第二声音数据的步骤包括：
[0016]获取每一个所述第一声音片段的能量并获取所有所述第一声音片段中声音能量最大的第一声音片段；
[0017]判定所述第一声音片段的能量是否超过能量最大的所述第一声音片段的能量的50％；
[0018]若是，则判定为所述第一声音片段中的有效声音片段；
[0019]若否，则判定为所述第一声音片段中的无效声音片段。
[0020]优选的，采用如下公式获取每一个所述第一声音片段的能量
[0021][0022]P(n)—第n帧音频信号的平均声压；
[0023]P—第n帧音频信号的瞬时声压。
[0024]优选的，所述对所述第二声音数据进行频域变换以获取第三声音数据的步骤包括：
[0025]所述第二声音数据进行傅里叶变换并获取所述第二声音数据的MFCC 参数；
[0026]计算所述第二声音数据的MFCC参数的一阶差分以获取第三声音数据。
[0027]优选的，所述第二声音数据进行傅里叶变换并获取所述第二声音数据的MFCC参数的步骤包括：
[0028]采用如下公式获取所述第二声音数据的MFCC参数：
[0029][0030]C
t
(n)—第t帧的第n个MFCC参数；、
[0031]S
t
(m)—音频信号的对数功率谱；
[0032]M—三角滤波器的个数。
[0033]优选的，采用如下公式计算所述第二声音数据的MFCC参数的一阶差分：
[0034][0035]i—取一阶差分的窗口宽度；
[0036]D
t
—在时域第t帧的一阶差分。
[0037]优选的，所述利用所述第三声音数据测试集对构建好的扩散化的高斯混合模型分类器进行训练以对所述扩散化的高斯混合模型分类器参数进行优化的步骤包括：
[0038]初始化模型参数，获取第三声音数据训练集集的平均值和方差并求取概率密度函数；
[0039][0040]p(D
t
)—数据集中某一数据计算得到的概率值；
[0041]n为数据集中数据个数；
[0042]μ—为数据集的平均值；
[0043]D
t
—数据集中每个声音数据的MFCC参数一阶差分；
[0044]Σ—数据集的协方差矩阵。
[0045]优选的，所述利用所述第三声音数据测试集对参数优化好的扩散化的高斯混合模型分类器进行测试的步骤包括：
[0046]获取阈值，并将第三声音数据训练集代至入概率密度函数得到的p(x)，判定p(x)与阈值的大小关系，如果p(x)大于阈值则得到的声音数据有效，并获取第三声音数据训练集的声音数据的有效率以获取训练好的扩散化的高斯混合模型分类器训练结果。
[0047][0048]p(D
t
)—数据集中某一数据计算得到的概率值；
[0049]n—数据集中数据个数；
[0050]μ—数据集的平均值；
[0051]D
t
—数据集中每个声音数据的MFCC参数一阶差分
[0052]Σ—数据集的协方差矩阵。
[0053]另一方面.本专利技术提供了一种基于MFCC和扩散化高斯混合模型的电缆隐患识别装置，包括：
[0054]音频处理模块：用于获取第一声音数据，所述第一声音数据包括背景声音数据、拉管机声音数据以及挖掘机声音数据，所述第一声音数据经低通滤波降噪后进行预处理以获取第二声音数据；
[0055]频域转换模块：用于对所述第二声音数据进行频域变换以获取第三声音数据；
[0056]训练模块：用于将所述第三声音数据分为第三声音数据测试集以及第三声音数据训练集，构建扩散化的高斯混合模型分类器，利用所述第三声音数据测试集本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于MFCC和扩散化高斯混合模型的电缆隐患识别方法，其特征在于，具体按照如下步骤进行：获取第一声音数据，所述第一声音数据包括背景声音数据、拉管机声音数据以及挖掘机声音数据，所述第一声音数据经低通滤波降噪后进行预处理以获取第二声音数据；对所述第二声音数据进行频域变换以获取第三声音数据；将所述第三声音数据分为第三声音数据测试集以及第三声音数据训练集，构建扩散化的高斯混合模型分类器，利用所述第三声音数据训练集对构建好的扩散化的高斯混合模型分类器进行训练以对所述扩散化的高斯混合模型分类器参数进行优化；利用所述第三声音数据测试集对参数优化好的扩散化的高斯混合模型分类器进行测试。2.根据权利要求1所述的方法，其特征在于，所述获取第一声音数据，所述第一声音数据包括背景声音数据、拉管机声音数据以及挖掘机声音数据，所述第一声音数据经低通滤波降噪后进行预处理以获取第二声音数据的步骤包括：采用如下步骤获取所述第一声音数据中的有效数据所述第二声音数据：将所述获取第一声音数据进行切分以获取第一声音数据片段；对所述第一声音片段进行低通滤波以及分帧处理；获取所述第一声音片段中的有效声音片段以获取第二声音数据。3.根据权利要求1所述的方法，其特征在于，所述获取所述第一声音片段中的有效声音片段以获取第二声音数据的步骤包括：获取每一个所述第一声音片段的能量并获取所有所述第一声音片段中声音能量最大的第一声音片段；判定所述第一声音片段的能量是否超过能量最大的所述第一声音片段的能量的50％；若是，则判定为所述第一声音片段中的有效声音片段；若否，则判定为所述第一声音片段中的无效声音片段。4.根据权利要求1所述的方法，其特征在于，采用如下公式获取每一个所述第一声音片段的能量P(n)—第n帧音频信号的平均声压；P—第n帧音频信号的瞬时声压。5.根据权利要求1所述的方法，其特征在于，所述对所述第二声音数据进行频域变换以获取第三声音数据的步骤包括：所述第二声音数据进行傅里叶变换并获取所述第二声音数据的MFCC参数；计算所述第二声音数据的MFCC参数的一阶差分以获取第三声音数据。6.根据权利要求5所述的方法，其特征在于，所述第二声音数据进行傅里叶变换并获取所述第二声音数据的MFCC参数的步骤包括：采用如下公式获取所述第二声音数据的MFCC参数：
C
t
(n)—第t帧...

【专利技术属性】
技术研发人员：周宝柱，董政鑫，郝泽琪，刘玉珩，谢宇，王君鹏，孟醒，孟健，邵强，乐坤，苏旭，
申请(专利权)人：国家电网有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人