本发明专利技术提供了一种基于麦克风阵列的声源定位方法,依次构建麦克风阵列,构建冗余字典矩阵,从冗余字典矩阵中的匹配原子之和与可忽略的最终残差来表示声音信号;匹配跟踪的MP—MUSIC算法,将各单元麦接收到的声音信号进行信号系数近似分解,将各近似分解后的信号系数线性求和;通过特征分解计算系数协差矩阵并分解噪声空间,构造MP—MUSIC空间谱,通过寻找最值来获得DOA的估计的角度;根据预估角度得到该方向上的波束。本发明专利技术提出了改进型的MP—MUSIC算法,通过预估的声源数从接收到的声音信号中分出噪声空间,用新的噪声空间构造空间谱,寻求空间谱的极值得到DOA的估计值,使得该方法对声源具有更好的指向性,提高声源定位的精度。
【技术实现步骤摘要】
一种基于麦克风阵列的声源定位方法
本专利技术涉及语音信号检测与处理
,尤其涉及一种基于麦克风阵列的声源定位方法。
技术介绍
语音采集是语音信号处理的重要环节,基于麦克风阵列波束形成的声源定位技术是提高语音采集性能的有效手段,近年来成为信号处理的研究热点。由于声源位置的移动、声音的反射和衍射、外界背景噪声变化等因素的存在,导致对声源定位、信源数目估计困难。人们对基于特征分解的超分辨率空间谱估计算法进行了广泛深入的研究,并提出了一系列高效的处理方法,其中比较经典的是MUSIC算法。MUSIC算法是多重信号分类的英文缩写,该算法利用了信号空间与噪声空间正交性这一远离,构造空间谱函数进行搜索定位,预估语音信号的波达方向DOA。传统的MUSIC算法研究的范围比较窄,仅仅只限于不是相关的信号,因此当信号源是相关信号或者是比较小的信号噪声比的信号时,MUSIC算法的DOA性能会下降恶化,甚至完全失效,导致不能对语音信号的声源定位准确度和信源数进行可靠估算。
技术实现思路
有鉴于此,本专利技术提出了一种对MUSIC算法进行了改进、提高了声源定位精确度的基于麦克风阵列的声源定位方法。本专利技术提供了一种基于麦克风阵列的声源定位方法,包括如下步骤:S100:构建麦克风阵列,将M个单元麦构成麦克风阵列,组成麦克风阵列的各单元麦分别收到的声音信号为x(t);S200:构建冗余字典矩阵D,冗余字典矩阵D由单位规范原子组成;S300:从冗余字典矩阵D中选择一个与声音信号x(t)最相似的原子,并求解残差信号,并继续在冗余字典矩阵D中寻找与上一步残差信号最相似的原子,如此重复操作,用迭代的各原子之和与可忽略的最终残差来表示声音信号x(t),得到各单元麦接收到的声音信号x(t)对应的分解系数cl和选定原子gl;S400:匹配跟踪的MP—MUSIC算法,将各单元麦接收到的声音信号x(t)进行信号系数近似分解,将各近似分解后的信号系数线性求和;S500:通过特征分解计算系数协差矩阵并分解噪声空间,构造MP—MUSIC空间谱,通过寻找最值来获得DOA的估计的角度θ,即预估的声源的来波方向角;根据预估的声源的来波方向角θ得到加权矢量W(θ),再由加权矢量W(θ)得到θ方向上的波束,通过波束成形对声源进行定位跟踪和噪声抑制;波束表示为:y(t)=WH(θ)x(t)=aH(θ)x(t);PBF=WH(θ)RW(θ)=aH(θ)Ra(θ);y(t)为麦克风阵列的输出;R为麦克风阵列的各单元麦分别接收到的声音信号x(t)的协方差矩阵;PBF为波束的输出功率。在以上技术方案的基础上,优选的,所述从冗余字典矩阵D中迭代求解声音信号x(t)对应的分解系数cl和选定原子gl的方法为:令x[l]=x(t);l为迭代次数,初值为1;迭代找出gl∈D使得|<x[l],gl>|的内积最大;定义cl=|<x[l],gl>|,x[l+1]=x[l]-cl·gl,重复迭代过程;当最终残差可以忽略时或者达到最大迭代次数L时,停止迭代,得到对应的分解系数cl和选定原子gl;x[l]和x[l+1]均为当前和下一次迭代的信号残差。进一步优选的,所述将各近似分解后的信号系数线性求和的方法为:对得到麦克风阵列的第一个单元麦输出的信号系数x1近似分解为:其中L为最大迭代次数;是信号系数;是对应的噪声系数;对第二个到第M个麦克风输出信号系数xm近似分解为:m=2,3,4…M;是信号系数;是对应的噪声系数;将上述步骤的M个麦克风输出信号线性求和,并提取导向矢量,改写成:X为麦克风的接收信号矩阵;A为导向矢量构成的矩阵;为MP系数,G为冗余字典矩阵D中与麦克风输出信号相关性最高的原子;为噪声矩阵;原子G不包含DOA信息,上式改写为:C是M×L阶的MP系数分解矩阵。更进一步优选的,步骤S500通过寻找最值来获得DOA的估计的角度θ,是求解MP—MUSIC空间谱PMP-MUSIC的分母的极小值:其中,为通过协差矩阵RCC=CCH的特值分解得到的噪声空间MP系数;CH是MP系数分解矩阵C的共轭转秩矩阵;为的共轭转秩矩阵;a(θ)是声源的导向向量,等同于A;aH(θ)为a(θ)的共轭转秩矩阵;PMP-MUSIC为MP—MUSIC空间谱;假定有d个声源信号,a(θ)=[a(θ1),a(θ2),…a(θd)];导向向量a(θ)中的元素对应的是各声源对应的导向向量,第k列a(θk)表示第k个声源的导向向量:θk表示第k个声源的来波方向角;k=1,2,…d;λ是声源波长;声音信号x(t)的协方差矩阵R进行特值分解,将协方差矩阵R的特值进行降序排列,按顺序排列的前d个特值对应于d个声源信号;剩余的M—d个特值对应噪声信号。在以上技术方案的基础上,优选的,所述麦克风阵列为线性麦克风阵列;各单元麦呈直线排列且间隔相等。在以上技术方案的基础上,优选的,所述麦克风阵列为圆形麦克风阵列;各单元麦均匀分布在一个同心圆上。本专利技术提供的一种基于麦克风阵列的声源定位方法,相对于现有技术,具有以下有益效果:(1)本专利技术提出了改进型的MP—MUSIC算法,通过预估的声源数从接收到的声音信号中分出噪声空间,用新的噪声空间构造空间谱,寻求空间谱的极值得到DOA的估计值,使得该方法对声源具有更好的指向性,提高声源定位的精度;(2)改进型的MP—MUSIC算法通过波束成形对声源进行定位跟踪和噪声抑制,波束形成可以对声源进行实时定位,并抑制背景噪声的干扰;传统的波束成形是采用扫描形式定位,需要对每个角度进行判断,计算量大,耗时长;本专利技术的定位方法能更快速的定位;(3)本专利技术采用匹配跟踪的思想,在冗余字典中寻找与输入声音信号最相似的原子,形成一个可替代性的逼近,并求出残差信号,反复迭代和逼近,信号可由多个原子的线性和表示;(4)本专利技术对与声源相似的噪音具有较好的区分能力,较精准的预估声源信号的方向角;(5)根据需要可以采用不同结构的麦克风阵列,分别对面波声源或者空间声源获取更好的定位效果。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术一种基于麦克风阵列的声源定位方法的原理图;图2为本专利技术一种基于麦克风阵列的声源定位方法的波束成形的原理图;图3为本专利技术一种基于麦克风阵列的声源定位方法的声源定位效果示意图;图4为本专利技术一种基于麦克风阵列的声源定位方法的环境模拟仿真实验对比图。具体实施方式下面将结合本专利技术实施方式,对本专利技术实施方式中的技术方案进行清楚、完整地描述,显然,所描述的实施方式仅本文档来自技高网...
【技术保护点】
1.一种基于麦克风阵列的声源定位方法,其特征在于:包括如下步骤:/nS100:构建麦克风阵列,将M个单元麦构成麦克风阵列,组成麦克风阵列的各单元麦分别收到的声音信号为x(t);/nS200:构建冗余字典矩阵D,冗余字典矩阵D由单位规范原子组成;/nS300:从冗余字典矩阵D中选择一个与声音信号x(t)最相似的原子,并求解残差信号,并继续在冗余字典矩阵D中寻找与上一步残差信号最相似的原子,如此重复操作,用迭代的各原子之和与可忽略的最终残差来表示声音信号x(t),得到各单元麦接收到的声音信号x(t)对应的分解系数c
【技术特征摘要】
1.一种基于麦克风阵列的声源定位方法,其特征在于:包括如下步骤:
S100:构建麦克风阵列,将M个单元麦构成麦克风阵列,组成麦克风阵列的各单元麦分别收到的声音信号为x(t);
S200:构建冗余字典矩阵D,冗余字典矩阵D由单位规范原子组成;
S300:从冗余字典矩阵D中选择一个与声音信号x(t)最相似的原子,并求解残差信号,并继续在冗余字典矩阵D中寻找与上一步残差信号最相似的原子,如此重复操作,用迭代的各原子之和与可忽略的最终残差来表示声音信号x(t),得到各单元麦接收到的声音信号x(t)对应的分解系数cl和选定原子gl;
S400:匹配跟踪的MP—MUSIC算法,将各单元麦接收到的声音信号x(t)进行信号系数近似分解,将各近似分解后的信号系数线性求和;
S500:通过特征分解计算系数协差矩阵并分解噪声空间,构造MP—MUSIC空间谱,通过寻找最值来获得DOA的估计的角度θ,即预估的声源的来波方向角;
根据预估的声源的来波方向角θ得到加权矢量W(θ),再由加权矢量W(θ)得到θ方向上的波束,通过波束成形对声源进行定位跟踪和噪声抑制;波束表示为:
y(t)=WH(θ)x(t)=aH(θ)x(t);
PBF=WH(θ)RW(θ)=aH(θ)Ra(θ);
y(t)为麦克风阵列的输出;R为麦克风阵列的各单元麦分别接收到的声音信号x(t)的协方差矩阵;PBF为波束的输出功率。
2.如权利要求1所述的一种基于麦克风阵列的声源定位方法,其特征在于:所述从冗余字典矩阵D中迭代求解声音信号x(t)对应的分解系数cl和选定原子gl的方法为:令x[l]=x(t);l为迭代次数,初值为1;迭代找出gl∈D使得|<x[l],gl>|的内积最大;定义cl=|<x[l],gl>|,x[l+1]=x[l]-cl·gl,重复迭代过程;当最终残差可以忽略时或者达到最大迭代次数L时,停止迭代,得到对应的分解系数cl和选定原子gl;x[l]和x[l+1]均为当前和下一次迭代的信号残差。
3.如权利要求2所述的一种基于麦克风阵列的声源定位方...
【专利技术属性】
技术研发人员:陈红武,何流,宋翔,刘陈,章子涵,
申请(专利权)人:湖北省电力装备有限公司,
类型:发明
国别省市:湖北;42
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。