当前位置: 首页 > 专利查询>重庆大学专利>正文

一种公共场所异常声音特征提取方法技术

技术编号:9935984 阅读:173 留言:0更新日期:2014-04-18 14:40
一种公共场所异常声音特征提取方法,包括公共场所背景噪声建模与公共场所异常声音特征提取两个步骤;步骤1:所述公共场所背景噪声建模,是使用自由度为v的T分布来描述公共场所背景噪声,将自由度为v的T分布随机数据替代原始总体局部均值分解(ELMD)中的高斯白噪声,得到基于T分布的总体局部均值分解(TD?ELMD)模型;步骤2:公共场所异常声音特征提取,是利用TD?ELMD模型将公共场所异常声音信号分解为若干阶瞬时频率的乘积函数(PFi)分量;用PFi分量的能量与异常声音信号总能量相比作为公共场所异常声音特征向量;最后,将该特征向量输入支持向量机(SVM)进行分类识别。

【技术实现步骤摘要】
【专利摘要】本专利技术涉及公共场所异常声音特征提取方法,属音频信号处理
。方法采用基于T分布的随机噪声代替原始的总体局部均值分解模型中的高斯白噪声,推导出基于T分布的总体局部均值分解模型(TD-ELMD)。并利用TD-ELMD模型分解公共场所异常声音信号,得到一系列从低频到高频的乘积函数(PFi)。并将各阶PFi的能量与原始信号的总能量之比作为公共场所异常声音特征向量。最后输入支持向量机(SVM)分类器进行分类识别。本专利技术提出的TD-ELMD模型更能够反映公共场所异常声音信号的特点,与目前常用的提取方法相比,其特征描述能力更强,对公共场所异常声音的识别具有更好的鲁棒性。【专利说明】
本专利技术属于音频信号特征提取及模式识别

技术介绍
公共场所是指公众从事社会生活的各种场所如广场、车站、学校等。公共场所中所发生的各种异常事件、犯罪事件等都与人们的生命财产与安全息息相关。目前,公共场所安全监视主要以视频监视平台为核心,大多还没有音频监控功能。由于大多数公共场合所发生的异常事件都伴随有异常声音的产生如枪声、爆炸声、玻璃破碎声、尖叫声等。异常声音的产生表明异常事件已发生或即将发生。通过音频监控技术弥补视频监控平台的不足,已成为公共场所安全监控的发展方向。由于音频监控领域相关理论与技术的缺乏,使得公共场所音频监控系统几乎为空白。可见,对公共场所异常声音特征提取相关领域的理论及关键技术的研究具有重要的意义。
技术实现思路
本专利技术的目的在于提出一种适用于公共场所异常声音的特征提取方法,旨在解决公共场所异常声音特征提取中关键的理论及技术问题,即一是公共场所背景噪声建模问题;二是公共场所异常声音的特征提取问题。对于公共场所背景噪声建模问题:公共场所如广场、车站、校园的背景情况很复杂,噪声很大,有时噪声甚至会淹没待研究的信号。要解决公共场所异常声音特征提取的核心问题,首先需要获得公共场所背景噪声分布模型。我们知道,公共场所背景噪声为自然信号,往往存在一些大气噪声、人为噪声如汽车鸣笛声、脚步声等脉冲噪声的干扰。公共场所背景噪声具有较为明显的脉冲特性,其统计密度函数具有长拖尾现象。目前业界还没有有效的理论分析结果,研究人员均将公共场所背景噪声假设为高斯分布。为了获得适当的公共场所背景噪声模型,本专利技术提出通过KoImogorov-Smirnov (K-S)假设检验对目前现有的几种公共场所噪声假设模型进行拟合优度分析。根据K-S假设检验得到公共场所背景噪声模型为T分布,用T分布来描述公共场所背景噪声较传统的高斯分布和SaS分布更为合理。对于公共场所异常声音特征提取:目前异常声音的特征提取方法大多沿用传统的语音信号处理方法如mel频率倒谱系数(Melfrequency cepstrum coefficient, MFCC)、线性预测倒谱参数(Linear predictive cepstral coding, LPCC)。而公共场所异常声音不仅包含语音信号如尖叫声,还包括非语音信号如爆炸声、枪声等。由于公共场所异常声音信号的基频频率分散,信号能量在不同宽度的频率域集中分布,同时在整个频率域呈现非均匀分布的特点,上述传统方法对异常声音的特征描述能力有限。目前大多数研究人员采用各类特征融合策略来增强对异常声音特征的表征力。但从原理上看,各类融合方法仍然不能从根本上解决非语音信号特征提取的问题。本专利技术通过对目前非平稳、非线性信号处理领域新理论、新方法的分析,并充分考虑公共场合背景噪声对异常声音特征提取的影响,提出一种新的公共场所异常声音特征提取方法,即基于T分布的总体局部均值分解(Based onensemble local mean decomposition, TD-ELMD)方法,将其用于公共场所异常声音的特征描述。基于以上分析,本专利技术提出的公共场所异常声音特征提取方法包括公共场所背景噪声建模与公共场所异常声音特征提取两个步骤;步骤1:所述公共场所背景噪声建模,是使用自由度为V的T分布来描述公共场所背景噪声,将自 由度为ν的T分布随机数据替代原始总体局部均值分解(ELMD)中的高斯白噪声,得到基于T分布的总体局部均值分解(TD- E LMD)模型;步骤2:公共场所异常声音特征提取,是利用TD- E LMD模型将公共场所异常声音信号分解为若干阶瞬时频率的乘积函数(PFi)分量;用PFi分量的能量与异常声音信号总能量相比作为公共场所异常声音特征向量;最后,将该特征向量输入支持向量机(SVM)进行分类识别。所述步骤I中基于T分布的总体局部均值分解(TD- E LMD)模型为:y] PFipjt)]+—y, m{t) p=\ n i^ln r-1其中:X(t)为待分析的信号,PFp (t)是分解出来的乘积函数,U (t)是残余量,表的是一组PF分量的个数,P为序号;n代表的是每一个PF是由η次添加不同的服从T分布的噪声序列到原始信号进行TD-ELMD分解,在同一位置得到的PF分量的个数,即每个PFp(t)的个数,在这里对同一位置的PFp (t)分量进行求平均,即对η个PFp (t)分量进行求平均作为每个位置的最终PFp(t)分量,这里i是序号;同样,对Ui (t),由于每次TD-ELMD分解只会得到一个残余量u (t),所以,这里是将η次添加不同的服从T分布的噪声序列到原始信号进行TD-ELMD得到的η个u (t)进行求平均作为最终的u (t)。所述步骤2的公共场所异常声音特征提取的具体实现步骤如下:步骤2.1:用TD-ELMD模型将公共场所异常声音信号即原始异常声音信号分解成若干阶PFi分量。步骤2.2:求出各阶PFi分量的能量Ei j N-1Ei=-YjArEi其中,Ai是PFi分量的幅值,N是待分析信号的长度,i是PF分量的阶数。步骤2.3:计算各阶PFi分量的能量Ei和原始异常声音信号的能量E的比h 二I,L生成原始异常声音信号的特征向量,h则为异常声音信号的特征量。步骤2.4:将匕归一化后的公共场所异常声音特征向量输入SVM分类器,则可得到公共场所异常声音分类识别结果。本专利技术的优点在于:1、本专利技术充分考虑公共场所背景噪声对公共场所异常声音特征提取方法的影响,从理论上分析得到的T分布比传统的高斯分布更能反映公共场所背景噪声的实际情况,提出的TD-ELMD模型更能够反映公共场所异常声音信号的特点。2、用服从T分布的公共场所背景噪声代替原始ELMD方法中的高斯白噪声,建立了一种更加适合于公共场所环境的异常声音特征描述模型(TD-ELMD)。提出的将TD-ELMD分解得到的公共场所异常声音各瞬时频率的PFi的能量与异常声音信号总能量之比作为公共场所异常声音特征向量,简单有效。3、本专利技术方法通过实验验证,优于传统的基于语音信号处理的特征提取方法,其特征描述能力更强,对公共场所异常声音的识别具有更好的鲁棒性。【专利附图】【附图说明】图1:基于K-S假设检验的公共场所背景噪声分布检验流程框图;图2:本专利技术提出TD-LMD模型用于分解公共场所异常声音得到的各阶PFi结果图; 图3:本专利技术提出的公共场所异常声音特征提取及识别流程框图;图4:本专利技术与几种典型语音信号特征提取方法的接受者操作特征曲线(R本文档来自技高网...

【技术保护点】
一种公共场所异常声音特征提取方法,包括公共场所背景噪声建模与公共场所异常声音特征提取两个步骤;步骤1:所述公共场所背景噪声建模,是使用自由度为v的T分布来描述公共场所背景噪声,将自由度为v的T分布随机数据替代原始总体局部均值分解(ELMD)中的高斯白噪声,得到基于T分布的总体局部均值分解(TD?ELMD)模型;步骤2:公共场所异常声音特征提取,是利用TD?ELMD模型将公共场所异常声音信号分解为若干阶瞬时频率的乘积函数(PFi)分量;用PFi分量的能量与异常声音信号总能量相比作为公共场所异常声音特征向量;最后,将该特征向量输入支持向量机(SVM)进行分类识别。

【技术特征摘要】

【专利技术属性】
技术研发人员:李伟红李渊龚卫国
申请(专利权)人:重庆大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1