本发明专利技术公开了一种基于一致聚焦变换最小二乘法的双声源定位方法,在该方法中,用先设计的六元圆形麦克风阵列采集声源信号,并获得采集信号的协方差矩阵;利用频率范围的中心频率点定义聚焦变换矩阵,并由最小二乘方法求解聚焦变换矩阵;利用不同带宽内的中心频率点、一致聚焦矩阵及多信号分类方法,获得每个中心频率点所对应的信号空间谱,再利用频率点均值和时间快拍估计方法(MUSIC)求得信号空间谱平均估计值,从而获求声源方位角估计值。本发明专利技术方法声源定位估计准确性高,有效克服了方位模糊问题。
【技术实现步骤摘要】
一种基于一致聚焦变换最小二乘法的双声源定位方法
本专利技术涉及声源定位领域,特别是一种基于一致聚焦变换最小二乘法的双声源定位方法。
技术介绍
在阵列信号处理中,利用波达方向(DirectionofArrival,DOA)估计声源位置是一个新的研究方向,在声呐探测(见文献:王燕,邹男,梁国龙.强多途环境下水听器阵列位置近场有源校正方法[J].物理学报,2015,64(2):0243041-10),语音识别与追踪(见文献:戚聿波,周士弘,张仁和,任云.一种基于β-warping变换算子的被动声源距离估计方法[J].物理学报,2015,64(7):0743011-6),在未知环境中机器人的移动(见文献:居太亮.基于麦克风阵列声源定位算法研究[D].博士学位论文(成都:电子科技大学),2006),以及下一代助听器等(见文献:苏林,马力,宋文化,郭圣明,鹿力成.声速剖面对不同深度声源定位的影响[J].物理学报,2015,64(2):0243021-8)领域中都成为研究的热点,精确的DOA估计在许多应用中都是其中的关键要素之一(见文献:时洁,杨德森,时胜国.基于矢量阵的运动声源柱面聚焦定位方法试验研究[J].物理学报,2012,61(12):1243021-15)。其中,最常见的是在电话会议中,通过知晓说话者扬声器的位置信息来引导相机,或者利用波束形成方法来增强捕获到的源信号,以避免翻领式麦克风带来的不便(见文献:DespoinaPavlidi,AnthonyGriffin,MatthieuPuigt,AthanasiosMouchtaris.Real-timemultiplesoundsourcelocalizationandcountingusingacircularmicrophonearray[J].IEEETransactionsonAudio,Speech,andLanguageProcessing,2013,21(10):2193-2206.)。在声源定位的早期研究中,主要针对单个声源进行定位的(见文献:AliPourmohammad,SeyedMohammadAhadi.Realtimehighaccuracy3-DPHAT-basedsoundsourcelocalizationusingasimple4-microphonearrangement[J].IEEESystemsJournal,2012,6(3):455-468)。很多方法都是基于不同麦克风对间的到达时差(TimeDifferenceofArrival,TDOA)进行单声源定位的,其中广义互相关变换(GeneralizedCross-CorrelationPHAseTransform,GCC-PHAT)的方法是应用最为广泛的(见文献:QilianLiang,BaojuZhang,ChenglinZhao,YimingPi.TDOAforpassivelocalizationunderwaterversusterrestrialenvironment[J].IEEETransactionsParallelandDistributedSystems,2013,24(10):2100-2108)。文献(JingdongChen,JacobBenesty,YitengHuang.Timedelayestimationinroomacousticenvironments:anoverview[J].EURASIPJournalonAppliedSignalProcessing,2006,26503:1-19)给出了TDOA方位估计技术的综述;在单声源中,由于存在噪声、混响等的干扰,会影响麦克风对间采集的信号,使定位估计结果精度下降,文献(FrancescoNesta,MaurizioOmologo.GeneralizedstatecoherencetransformformultidimensionalTDOAestimationofmultiplesources[J].IEEETransactionsonAudio,Speech,andLanguageProcessing,2012,20(1):246-260.)给出了改进的TDOA估计方法。进一步研究发现,同时定位多个声源是一个更困难的问题。事实上,即使是一个短暂的声音都会使采集到的语音信号存在微小的重叠,可能会导致多个源信号的定位不精确(见文献:JacekP.Dmochowski,JacobBenesty,SofieneAffes.BroadbandMUSIC:Opportunitiesandchallengesformultiplesourcelocalization[C].IEEEWorkshoponApplicationsofSignalProcessingtoAudioandAcoustics,2007:18-21)。对于多声源定位问题,一种是传统的多信号分类(MultipleSignalClassification,MUSIC)方法,属于经典子空间方法,该方法针对窄带信号,根据采集到信号的子空间协方差矩阵,进行特征分解,进而估计源信号方位(见文献:DumiduS.Talagala,WenZhang.BroadbandDOAEstimationUsingSensorArraysonComplex-ShapedRigidBodies[J].IEEETransactionsonAudio,Speech,andLanguageProcessing,2013,21(8):1573-1585.),由于语音信号的频率带宽一般为[300Hz,3000Hz],经典子空间方法只是针对窄带信号的,会导致声源定位结果不准确;另一种是基于独立分量分析的源定位方法,该方法首先运用盲源分离(BlindSourceSeparation,BSS)方法获得分离后单个信号,然后再运用对单个源信号进行定位的方法进行定位估计(见文献:AnthonyLombard,YuanhangZheng,HerbertBuchner,WalterKellermann.TDOAEstimationforMultipleSoundSourcesinNoisyandReverberantEnvironmentsUsingBroadbandIndependentComponentAnalysis[J].IEEETransactionsonAudio,Speech,andLanguageProcessing,2011,19(6):1490-1503.),但此类源定位方法,由于将语音信号先分离再定位,会破坏源信号的完整性,会使定位结果不稳定、定位精确度不高。另外,随着麦克风个数的增加,波达方向(DOA)估计的定位精度也会随之提高,但在实际情况下,通常使用线性麦克风阵列模型,会产生定位模糊问题(无法准确区分声源位于阵列的前方或者后方)。如何解决现有技术的不足已成为声源定位领域亟待解决的一大难题。
技术实现思路
本专利技术所要解决的技术问题是为了克服现有技术的不足,而提供一种基于一致聚焦变换最小二乘法的双声源定位方法,本专利技术方法实时、有效地解决本文档来自技高网...
【技术保护点】
一种基于一致聚焦变换最小二乘法的双声源定位方法,其特征在于,包括如下步骤:步骤一:采用M个相同麦克风等间距的排列成半径为R的圆形麦克风阵列;步骤二:根据麦克风阵列采集到的语音信号,得到信号的协方差矩阵,并在给定频率范围内定义中心频率点kb;步骤三:根据预设的一定测量范围内的任意角度,存在一个不随角度变化的一致聚焦变换,定义一致聚焦变换矩阵,并通过最小二乘方法求得聚焦变换矩阵;步骤四:根据步骤二中定义的中心频率点,结合最小二乘法求得的一致聚焦变换矩阵,采用MUSIC方法求得每个中心频率点所对应的信号空间谱,进而求得信号空间谱的均值函数harray(θ);步骤五:采用频率点均值和时间快拍估计的方法求得信号空间谱平均估计值,进而求得声源估计角度。
【技术特征摘要】
1.一种基于一致聚焦变换最小二乘法的双声源定位方法,其特征在于,包括如下步骤:步骤一:采用M个相同麦克风等间距的排列成半径为R的圆形麦克风阵列;步骤二:根据麦克风阵列采集到的语音信号,得到信号的协方差矩阵,并在给定频率范围内定义中心频率点kb;具体如下:(201)、对第d个声源发出的语音信号sd(t)进行采样,得到第m个麦克风采集到的离散信号xdm(t),其中,t为时间,d=1,2,…,D,D表示声源的个数,m=1,2,…,M;(202)、根据(201)中采集到的离散信号xdm(t),经傅里叶变换后得到输入信号矢量X(k)为X(k)=(X1(k),…,XM(k))T,Xm(k)=(X1m(k),…,XDm(k))T,信号的协方差矩阵为CX=E[X(k)X(k)H];其中,k为波数且f为频率,c为声波传播的速度,上标T为转置运算符,Xdm(k)表示xdm(t)的傅里叶变换,E[*]为期望的运算符,上标H为厄密共轭运算符;(203)、在给定频率范围内划分频率间隔相等的B个子带,第b个子带的中心频率为kb,其中,b=1,…,B;步骤三:根据预设的一定测量范围内的任意角度,存在一个不随角度变化的一致聚焦变换,定义一致聚焦变换矩阵,并通过最小二乘方法求得聚焦变换矩阵;具体如下:(301)根据带宽内定义的任意中心频率点kb以及给定的聚焦频率点k0,定义一致聚焦变换矩阵T(r,kb),得到V(r,θ,k0)=T(r,kb)V(r,θ,kb)其中,V(r,θ,k0)表示声源距离阵列中心的距离为r、方位角度为θ、聚焦频率点为k0的导向矢量矩阵,V(r,θ,kb)表示声源距离阵列中心的距离为r、方位角度为θ、中心频率点为kb的导向矢量矩阵;(302)采用最小二乘方法,得到一致聚焦变换矩阵为T(r,kb)=R(r,kb)L(r,kb)其中,T(r,kb)表示声源距离阵列中心的距离为r,中心频率点为kb的一致聚焦变换矩阵,R(r,kb)为矩阵VH(r,θ,k0)V(r,θ,kb)的左奇异矢...
【专利技术属性】
技术研发人员:郭业才,宋宫琨琨,禹胜林,
申请(专利权)人:南京信息工程大学,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。