当前位置: 首页 > 专利查询>天津大学专利>正文

一种基于希尔伯特-黄变换和Mel谱变换的脉冲声识别方法技术

技术编号:38682345 阅读:15 留言:0更新日期:2023-09-02 22:55
本申请公开了一种基于希尔伯特

【技术实现步骤摘要】
一种基于希尔伯特

黄变换和Mel谱变换的脉冲声识别方法


[0001]本申请涉及音频检测
,尤其涉及一种基于希尔伯特

黄变换和Mel谱变换的脉冲声识别方法。

技术介绍

[0002]脉冲声是指短时间内突变的、不具有连续性的声音信号。常见的脉冲声信号如枪声、炮声、雷电声、关门声等声信号。传统的脉冲声识别方法有小波变换、自相关、过零率分析、频谱分析、线性预测分析等理论的声信号识别方法。一般情况下,传统脉冲声识别方法可以取得不错的识别率,能有效区分出目标信号和干扰信号;但是,当干扰信号与目标信号具有相同的频率范围,频谱重叠时,传统方法就很难将干扰信号从目标信号中分离出来,造成较高的虚警率,识别结果不理想。另一方面,近年来,新型声音识别方法不断被提出来,应用较为广泛的方法是:通过提取声音信号的Mel谱系数特征,运用隐马尔可夫模型(HMM),识别出目标脉冲声信号。这种方法已经在语音识别及模式识别中得到了广泛的应用。但这种方法也有局限性,其不能很好的表达非线性非平稳声信号的局部时域特征,不能进一步精确的识别出时频特征的细节。
[0003]传统的识别方法是通过提取声音信号的Mel谱系数特征,运用隐马尔可夫模型(HMM),识别出目标脉冲声信号。虽然这种方法已经在语音识别及模式识别中得到了广泛的应用,但Mel谱系数特征不能很好的表达非线性非平稳声信号的局部时域特征,不能进一步精确的识别出时频特征的细节。其次,隐马尔可夫模型(HMM)的概率识别方法,在数据训练、概率计算等环节,计算复杂度较高;在模型中,输入不同的参数,会导致算法的识别精度有波动,在应对非平稳信号时,识别率偏低。

技术实现思路

[0004]本申请实施例提供一种基于希尔伯特

黄变换和Mel谱变换的脉冲声识别方法,采用希尔伯特

黄变换(HHT),提取出脉冲信号的边际谱特征,以有效识别出非线性非平稳声信号的局部时域特征,提高识别精度。
[0005]本申请实施例提供一种基于希尔伯特

黄变换和Mel谱变换的脉冲声识别方法,包括:
[0006]预先基于训练脉冲信号生成MFCC系数和边际谱系数来训练MFCC模型和边际谱模型,以构建训练好的高斯混合模型;
[0007]对于给定的脉冲信号,基于所述脉冲信号分别进行Mel谱变换处理和HHT变换处理,以生成所述脉冲信号的MFCC系数和边际谱系数;
[0008]计算MFCC系数和边际谱系数的高斯概率密度函数,以生成待识别脉冲的高斯混合模型;
[0009]基于待识别脉冲的高斯混合模型以及训练好的高斯混合模型,进行匹配,确定出最大概率所对应的脉冲信号的种类,即为所给定脉冲信号的脉冲类型。
[0010]可选的,预先基于训练脉冲信号生成MFCC系数和边际谱系数来训练MFCC模型和边际谱模型,以构建训练好的高斯混合模型包括:
[0011]预先基于训练脉冲信号生成MFCC系数和边际谱系数构建训练序列;
[0012]基于所述训练序列,GMM似然度表示为:
[0013][0014]其中,λ表示估计参数,X
i
表示训练序列;
[0015]训练过程满足:
[0016]采用EM算法估计出一个新的参数使得新的模型参数下的似然度
[0017]迭代运算直到模型收敛。
[0018]可选的,基于所述脉冲信号分别进行Mel谱变换处理和HHT变换处理,以生成所述脉冲信号的MFCC系数和边际谱系数包括:
[0019]对所述脉冲信号进行预处理之后,执行FFT变换;
[0020]对每一帧FFT后的数据,计算谱线能量;
[0021]对每一帧谱线能量,与美尔滤波器的频域响应相乘并相加,以确定通过美尔滤波器的能量;
[0022]基于通过美尔滤波器的能量,计算DCT,以确定MFCC系数和第一差谱系数。
[0023]可选的,基于所述脉冲信号分别进行Mel谱变换处理和HHT变换处理,以生成所述脉冲信号的MFCC系数和边际谱系数包括:
[0024]对所述脉冲信号,执行EMD筛选,以获得多个IMF分量;
[0025]对各IMF分量,执行Hilbert变换;
[0026]基于Hilbert变换的结果,以及Hilbert谱,确定Hilbert边际谱和瞬时能量密度级,满足:
[0027][0028]Vh(ω)=h(ω
t+1
)

h(ω
t
‑1)
[0029]其中,h(ω)表示信号边际谱,Vh(ω)表示边际谱的一阶差分系数,H(ω,t)表示Hilbert谱;
[0030]基于信号边际谱确定边际谱系数。
[0031]可选的,计算MFCC系数和边际谱系数的高斯概率密度函数,以生成待识别脉冲的高斯混合模型包括:
[0032]定义M阶高斯混合模型的概率密度函数满足:
[0033][0034]其中,X是一个D维随机向量;b
i
(X
i
),i=1,L,M是子分布;ω
i
是混合权重;
[0035]将MFCC系数、第一差谱系数、边际谱系数以及边际谱的一阶差分系数,作为子分布b
i
(X
i
),以生成待识别脉冲的高斯混合模型。
[0036]可选的,基于待识别脉冲的高斯混合模型以及训练好的高斯混合模型,进行匹配,确定出最大概率所对应的脉冲信号的种类包括:
[0037]基于贝叶斯理论的最大后验概率,识别所述脉冲信号属于训练数据的种类满足:
[0038]i=argmaxP(X/λ
i
)
[0039]其中,i表示识别出的脉冲信号种类,P(X/λ
i
)表示最大后验概率。
[0040]本申请实施例还提出一种基于希尔伯特

黄变换和Mel谱变换的脉冲声识别装置,包括处理器和存储器,所述存储器上存储有计算机程序,所述计算机程序被处理器执行时实现如前述的基于希尔伯特

黄变换和Mel谱变换的脉冲声识别方法的步骤。
[0041]本申请实施例还提出一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如前述的基于希尔伯特

黄变换和Mel谱变换的脉冲声识别方法的步骤。
[0042]本申请实施例提供了一种基于希尔伯特

黄变换和Mel谱变换的脉冲声识别方法,采用希尔伯特

黄变换(HHT),提取出脉冲信号的边际谱特征,以有效识别出非线性非平稳声信号的局部时域特征,提高识别精度。
[0043]上述说明仅是本申请技术方案的概述,为了能够更清楚了解本申请的技术手段,而可依照说明书的内容予以实施,并且为了让本申请的上述和其它目的、特征和优点能够更明显易懂,以下本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于希尔伯特

黄变换和Mel谱变换的脉冲声识别方法,其特征在于,包括:预先基于训练脉冲信号生成MFCC系数和边际谱系数来训练MFCC模型和边际谱模型,以构建训练好的高斯混合模型;对于给定的脉冲信号,基于所述脉冲信号分别进行Mel谱变换处理和HHT变换处理,以生成所述脉冲信号的MFCC系数和边际谱系数;计算MFCC系数和边际谱系数的高斯概率密度函数,以生成待识别脉冲的高斯混合模型;基于待识别脉冲的高斯混合模型以及训练好的高斯混合模型,进行匹配,确定出最大概率所对应的脉冲信号的种类,即为所给定脉冲信号的脉冲类型。2.如权利要求1所述的基于希尔伯特

黄变换和Mel谱变换的脉冲声识别方法,其特征在于,预先基于训练脉冲信号生成MFCC系数和边际谱系数来训练MFCC模型和边际谱模型,以构建训练好的高斯混合模型包括:预先基于训练脉冲信号生成MFCC系数和边际谱系数构建训练序列;基于所述训练序列,GMM似然度表示为:其中,λ表示估计参数,X
i
表示训练序列;训练过程满足:采用EM算法估计出一个新的参数使得新的模型参数下的似然度迭代运算直到模型收敛。3.如权利要求1所述的基于希尔伯特

黄变换和Mel谱变换的脉冲声识别方法,其特征在于,基于所述脉冲信号分别进行Mel谱变换处理和HHT变换处理,以生成所述脉冲信号的MFCC系数和边际谱系数包括:对所述脉冲信号进行预处理之后,执行FFT变换;对每一帧FFT后的数据,计算谱线能量;对每一帧谱线能量,与美尔滤波器的频域响应相乘并相加,以确定通过美尔滤波器的能量;基于通过美尔滤波器的能量,计算DCT,以确定MFCC系数和第一差谱系数。4.如权利要求3所述的基于希尔伯特

黄变换和Mel谱变换的脉冲声识别方法,其特征在于,基于所述脉冲信号分别进行Mel谱变换处理和HHT变换处理,以生成所述脉冲信号的MFCC系数和边际谱系数包括:对所述脉冲信号,执行EMD筛选,以获得多个IMF分量;对各IMF分量,执行Hilbert变换;基于Hilbert变换的结果,以及Hilbert谱,确定Hil...

【专利技术属性】
技术研发人员:孙裕超孟东
申请(专利权)人:天津大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1