一种麦克风阵列声源定位方法、装置及存储介质制造方法及图纸

技术编号:34517475 阅读:13 留言:0更新日期:2022-08-13 21:05
本发明专利技术公开了一种麦克风阵列声源定位方法、装置及存储介质,所述方法包括获取测试信号;将所述测试信号进行预处理,得到单帧测试信号;提取所述单帧测试信号的空间定位线索,将其作为测试样本;将所述测试样本输入预先构建并训练完成的CRN模型中进行测试,获取测试信号属于每个方位角的概率,其中,取概率最大的方位作为该帧信号的方位角估计值,本发明专利技术具有较强的鲁棒性和空间信息表征能力,采用卷积残差网络构建空间定位线索和声源方位之间的映射关系,该定位模型可加速流通网络中的特征,减少了特征丢失,降低训练难度,本发明专利技术算法显著提高了复杂声学环境下的定位性能,并且对声源空间结构、混响和噪声都具有较好的泛化能力。力。力。

【技术实现步骤摘要】
一种麦克风阵列声源定位方法、装置及存储介质


[0001]本专利技术涉及一种麦克风阵列声源定位方法、装置及存储介质,属于声源定位


技术介绍

[0002]基于麦克风阵列的声源定位技术在语音识别、说话人识别系统的前端处理中,以及视频会议、智能机器人、智能家居等方面有着广泛的应用前景和潜在的经济价值。基于时延差的定位算法和基于SRP

PHAT(Steered Response Power

Phase Transform)的定位算法是两种典型的传统定位方法,这两种算法虽然易于实现,但对混响和噪声的鲁棒性较低。

技术实现思路

[0003]本专利技术的目的在于克服现有技术中的不足,提供一种麦克风阵列声源定位方法、装置及存储介质,显著提高定位性能,并且对未知的噪声和混响环境都具有较好的泛化能力。
[0004]为达到上述目的,本专利技术是采用下述技术方案实现的:
[0005]第一方面,本专利技术提供了一种麦克风阵列声源定位方法,包括:
[0006]获取测试信号;
[0007]将所述测试信号进行预处理,得到单帧测试信号;
[0008]提取所述单帧测试信号的空间定位线索,将其作为测试样本;
[0009]将所述测试样本输入预先构建并训练完成的CRN模型中进行测试,获取测试信号属于每个方位角的概率,其中,取概率最大的方位作为该帧信号的方位角估计值。
[0010]进一步的,所述CRN模型的构建和训练方法,包括:
[0011]将纯净语音信号与不同方位角的房间脉冲响应卷积,并加上不同程度的噪声和混响,生成多个麦克风阵列信号;
[0012]对所述多个麦克风阵列信号进行预处理,获得多个单帧信号;
[0013]提取多个单帧信号的空间定位线索,将其作为CRN模型的训练样本,同时标记每个样本的对应方位,将其作为样本的类别标签;
[0014]构建CRN模型,将所述训练样本和类别标签作为CRN模型的训练数据集进行训练。
[0015]进一步的,所述将纯净语音信号与不同方位角的房间脉冲响应卷积,并加上不同程度的噪声和混响,生成多个麦克风阵列信号,公式如下:
[0016]x
m
(t)=h
m
(t)*s(t)+v
m
(t),m=1,2,...,M
[0017]其中,x
m
(t)表示第m个麦克风接收到的指定方位的语音信号,m为麦克风阵元的序号,m=1,2,

,M,M为麦克风阵元的数目,s(t)为纯净语音,h
m
(t)表示从指定声源方位到第m个麦克风的房间脉冲响应,h
m
(t)与声源方位、房间混响有关,v
m
(t)表示噪声。
[0018]进一步的,所述对所述多个麦克风阵列信号进行预处理,获得多个单帧信号,包括:
[0019]预处理包括分帧和加窗,其中:
[0020]分帧方法为:采用预设分帧长度和帧移,将第m个阵元的时域信号x
m
(t)划分为多个单帧信号x
m
(iN+n),其中i为帧序号,n表示一帧内采样序号0≤n<N,N为帧长;
[0021]加窗方法为:x
m
(i,n)=w
H
(n)x
m
(iN+n)
[0022]其中,x
m
(i,n)为加窗处理后的第m个阵元的第i帧的信号,
[0023]为汉明窗。
[0024]进一步的,所述提取多个单帧信号的空间定位线索,包括:
[0025]对每个单帧信号进行离散傅里叶变换,将时域信号转换至频域信号;
[0026]离散傅里叶变换计算公式为:
[0027][0028]其中X
m
(i,k)是x
m
(i,n)的离散傅里叶变换,表示第m个阵元第i帧的频域信号,k为频率点,K为离散傅里叶变换的长度,K=2N,DFT(
·
)表示离散傅里叶变换;
[0029]设计Gammatone滤波器组,g
j
(t)为第j个Gammatone滤波器的脉冲响应函数,其表达式为:
[0030][0031]其中,j代表滤波器的序号;C是滤波器增益;t表示连续时间;a为滤波器的阶数;表示相位;f
j
表示第j个滤波器的中心频率;b
j
表示滤波器衰减因子,b
j
计算公式为:
[0032]b
j
=1.109ERB(f
j
)
[0033]ERB(f
j
)=24.7(4.37f
j
/1000+1)
[0034]对每个Gammatone滤波器进行离散傅里叶变换,得到其频域表达式:
[0035][0036]计算每帧信号的子带广义互相关函数,其计算公式如下:
[0037][0038]其中,R
mn
(i,j,τ)表示第m个阵元和第n个阵元在第i帧第j个子带的广义互相关函数;
[0039]求取每帧信号的子带时延差,其表达式如下:
[0040][0041]其中,T
mn
(i,j)表示第m个阵元和第n个阵元在第i帧第j个子带的时延差;
[0042]计算每帧信号的子带SRP

PHAT函数,计算公式如下:
[0043][0044]其中,P(i,j,r)表示阵列的波束方向为r时,第i帧信号第j个子带的SRP

PHAT功率
值;τ
mn
(r)表示声波从波束方向r传播到第m个麦克风和第n个麦克风的时间差,其计算公式为:
[0045][0046]其中r表示波束方向的坐标,r
m
表示第m个麦克风的位置坐标,c为空气中的声速,f
s
为信号采样率;
[0047]设定声源与麦克风阵列处于同一水平面,声源位于阵列的远场,则τ
mn
(r)的等价计算公式为:
[0048][0049]其中,ξ=[cosθ,sinθ]T
,θ为波束方向r的方位角,τ
mn
(r)与接收信号无关,因而可以离线计算后保存于内存中;
[0050]对子带SRP

PHAT函数进行归一化处理,计算公式如下:
[0051][0052]将同一帧内所有子带的时延差和SRP

PHAT函数组成一个特征矩阵,得到混合特征的空间线索,表达式如下:
[0053][0054]其中y
train
(i)表示第i帧信号的空间定位线索,J为子带个数。
[0055]进一步的,所述将所述测试信号进行预处理,得到单帧测试信号的方法,与所述对所述多个麦克风阵列信号本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种麦克风阵列声源定位方法,其特征在于,包括:获取测试信号;将所述测试信号进行预处理,得到单帧测试信号;提取所述单帧测试信号的空间定位线索,将其作为测试样本;将所述测试样本输入预先构建并训练完成的CRN模型中进行测试,获取测试信号属于每个方位角的概率,其中,取概率最大的方位作为该帧信号的方位角估计值。2.根据权利要求1所述的麦克风阵列声源定位方法,其特征在于,所述CRN模型的构建和训练方法,包括:将纯净语音信号与不同方位角的房间脉冲响应卷积,并加上不同程度的噪声和混响,生成多个麦克风阵列信号;对所述多个麦克风阵列信号进行预处理,获得多个单帧信号;提取多个单帧信号的空间定位线索,将其作为CRN模型的训练样本,同时标记每个样本的对应方位,将其作为样本的类别标签;构建CRN模型,将所述训练样本和类别标签作为CRN模型的训练数据集进行训练。3.根据权利要求2所述的麦克风阵列声源定位方法,其特征在于,所述将纯净语音信号与不同方位角的房间脉冲响应卷积,并加上不同程度的噪声和混响,生成多个麦克风阵列信号,公式如下:x
m
(t)=h
m
(t)*s(t)+v
m
(t),m=1,2,...,M其中,x
m
(t)表示第m个麦克风接收到的指定方位的语音信号,m为麦克风阵元的序号,m=1,2,

,M,M为麦克风阵元的数目,s(t)为纯净语音,h
m
(t)表示从指定声源方位到第m个麦克风的房间脉冲响应,h
m
(t)与声源方位、房间混响有关,v
m
(t)表示噪声。4.根据权利要求2所述的麦克风阵列声源定位方法,其特征在于,所述对所述多个麦克风阵列信号进行预处理,获得多个单帧信号,包括:预处理包括分帧和加窗,其中:分帧方法为:采用预设分帧长度和帧移,将第m个阵元的时域信号x
m
(t)划分为多个单帧信号x
m
(iN+n),其中i为帧序号,n表示一帧内采样序号0≤n<N,N为帧长;加窗方法为:x
m
(i,n)=w
H
(n)x
m
(iN+n)其中,x
m
(i,n)为加窗处理后的第m个阵元的第i帧的信号,为汉明窗。5.根据权利要求2所述的麦克风阵列声源定位方法,其特征在于,所述提取多个单帧信号的空间定位线索,包括:对每个单帧信号进行离散傅里叶变换,将时域信号转换至频域信号;离散傅里叶变换计算公式为:其中X
m
(i,k)是x
m
(i,n)的离散傅里叶变换,表示第m个阵元第i帧的频域信号,k为频率点,K为离散傅里叶变换的长度,K=2N,DFT(
·
)表示离散傅里叶变换;
设计Gammatone滤波器组,g
j
(t)为第j个Gammatone滤波器的脉冲响应函数,其表达式为:其中,j代表滤波器的序号;C是滤波器增益;t表示连续时间;a为滤波器的阶数;表示相位;f
j
表示第j个滤波器的中心频率;b
j
表示滤波器衰减因子,b
j
计算公式为:b
j
=1.109E...

【专利技术属性】
技术研发人员:王子怡赵小燕戎洪军童莹芮雄丽
申请(专利权)人:南京工程学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1