【技术实现步骤摘要】
一种麦克风阵列声源定位方法、装置及存储介质
[0001]本专利技术涉及一种麦克风阵列声源定位方法、装置及存储介质,属于声源定位
技术介绍
[0002]基于麦克风阵列的声源定位技术在语音识别、说话人识别系统的前端处理中,以及视频会议、智能机器人、智能家居等方面有着广泛的应用前景和潜在的经济价值。基于时延差的定位算法和基于SRP
‑
PHAT(Steered Response Power
‑
Phase Transform)的定位算法是两种典型的传统定位方法,这两种算法虽然易于实现,但对混响和噪声的鲁棒性较低。
技术实现思路
[0003]本专利技术的目的在于克服现有技术中的不足,提供一种麦克风阵列声源定位方法、装置及存储介质,显著提高定位性能,并且对未知的噪声和混响环境都具有较好的泛化能力。
[0004]为达到上述目的,本专利技术是采用下述技术方案实现的:
[0005]第一方面,本专利技术提供了一种麦克风阵列声源定位方法,包括:
[0006]获取测试信号;
[0007]将所述测试信号进行预处理,得到单帧测试信号;
[0008]提取所述单帧测试信号的空间定位线索,将其作为测试样本;
[0009]将所述测试样本输入预先构建并训练完成的CRN模型中进行测试,获取测试信号属于每个方位角的概率,其中,取概率最大的方位作为该帧信号的方位角估计值。
[0010]进一步的,所述CRN模型的构建和训练方法,包括:
[0 ...
【技术保护点】
【技术特征摘要】
1.一种麦克风阵列声源定位方法,其特征在于,包括:获取测试信号;将所述测试信号进行预处理,得到单帧测试信号;提取所述单帧测试信号的空间定位线索,将其作为测试样本;将所述测试样本输入预先构建并训练完成的CRN模型中进行测试,获取测试信号属于每个方位角的概率,其中,取概率最大的方位作为该帧信号的方位角估计值。2.根据权利要求1所述的麦克风阵列声源定位方法,其特征在于,所述CRN模型的构建和训练方法,包括:将纯净语音信号与不同方位角的房间脉冲响应卷积,并加上不同程度的噪声和混响,生成多个麦克风阵列信号;对所述多个麦克风阵列信号进行预处理,获得多个单帧信号;提取多个单帧信号的空间定位线索,将其作为CRN模型的训练样本,同时标记每个样本的对应方位,将其作为样本的类别标签;构建CRN模型,将所述训练样本和类别标签作为CRN模型的训练数据集进行训练。3.根据权利要求2所述的麦克风阵列声源定位方法,其特征在于,所述将纯净语音信号与不同方位角的房间脉冲响应卷积,并加上不同程度的噪声和混响,生成多个麦克风阵列信号,公式如下:x
m
(t)=h
m
(t)*s(t)+v
m
(t),m=1,2,...,M其中,x
m
(t)表示第m个麦克风接收到的指定方位的语音信号,m为麦克风阵元的序号,m=1,2,
…
,M,M为麦克风阵元的数目,s(t)为纯净语音,h
m
(t)表示从指定声源方位到第m个麦克风的房间脉冲响应,h
m
(t)与声源方位、房间混响有关,v
m
(t)表示噪声。4.根据权利要求2所述的麦克风阵列声源定位方法,其特征在于,所述对所述多个麦克风阵列信号进行预处理,获得多个单帧信号,包括:预处理包括分帧和加窗,其中:分帧方法为:采用预设分帧长度和帧移,将第m个阵元的时域信号x
m
(t)划分为多个单帧信号x
m
(iN+n),其中i为帧序号,n表示一帧内采样序号0≤n<N,N为帧长;加窗方法为:x
m
(i,n)=w
H
(n)x
m
(iN+n)其中,x
m
(i,n)为加窗处理后的第m个阵元的第i帧的信号,为汉明窗。5.根据权利要求2所述的麦克风阵列声源定位方法,其特征在于,所述提取多个单帧信号的空间定位线索,包括:对每个单帧信号进行离散傅里叶变换,将时域信号转换至频域信号;离散傅里叶变换计算公式为:其中X
m
(i,k)是x
m
(i,n)的离散傅里叶变换,表示第m个阵元第i帧的频域信号,k为频率点,K为离散傅里叶变换的长度,K=2N,DFT(
·
)表示离散傅里叶变换;
设计Gammatone滤波器组,g
j
(t)为第j个Gammatone滤波器的脉冲响应函数,其表达式为:其中,j代表滤波器的序号;C是滤波器增益;t表示连续时间;a为滤波器的阶数;表示相位;f
j
表示第j个滤波器的中心频率;b
j
表示滤波器衰减因子,b
j
计算公式为:b
j
=1.109E...
【专利技术属性】
技术研发人员:王子怡,赵小燕,戎洪军,童莹,芮雄丽,
申请(专利权)人:南京工程学院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。