一种麦克风阵列声源定位方法、装置及存储介质制造方法及图纸

技术编号：34517475 阅读：13 留言：0更新日期：2022-08-13 21:05

本发明专利技术公开了一种麦克风阵列声源定位方法、装置及存储介质，所述方法包括获取测试信号；将所述测试信号进行预处理，得到单帧测试信号；提取所述单帧测试信号的空间定位线索，将其作为测试样本；将所述测试样本输入预先构建并训练完成的CRN模型中进行测试，获取测试信号属于每个方位角的概率，其中，取概率最大的方位作为该帧信号的方位角估计值，本发明专利技术具有较强的鲁棒性和空间信息表征能力，采用卷积残差网络构建空间定位线索和声源方位之间的映射关系，该定位模型可加速流通网络中的特征，减少了特征丢失，降低训练难度，本发明专利技术算法显著提高了复杂声学环境下的定位性能，并且对声源空间结构、混响和噪声都具有较好的泛化能力。力。力。

全部详细技术资料下载

【技术实现步骤摘要】
一种麦克风阵列声源定位方法、装置及存储介质

[0001]本专利技术涉及一种麦克风阵列声源定位方法、装置及存储介质，属于声源定位

技术介绍

[0002]基于麦克风阵列的声源定位技术在语音识别、说话人识别系统的前端处理中，以及视频会议、智能机器人、智能家居等方面有着广泛的应用前景和潜在的经济价值。基于时延差的定位算法和基于SRP
‑
PHAT(Steered Response Power
‑
Phase Transform)的定位算法是两种典型的传统定位方法，这两种算法虽然易于实现，但对混响和噪声的鲁棒性较低。

技术实现思路

[0003]本专利技术的目的在于克服现有技术中的不足，提供一种麦克风阵列声源定位方法、装置及存储介质，显著提高定位性能，并且对未知的噪声和混响环境都具有较好的泛化能力。
[0004]为达到上述目的，本专利技术是采用下述技术方案实现的：
[0005]第一方面，本专利技术提供了一种麦克风阵列声源定位方法，包括：
[0006]获取测试信号；
[0007]将所述测试信号进行预处理，得到单帧测试信号；
[0008]提取所述单帧测试信号的空间定位线索，将其作为测试样本；
[0009]将所述测试样本输入预先构建并训练完成的CRN模型中进行测试，获取测试信号属于每个方位角的概率，其中，取概率最大的方位作为该帧信号的方位角估计值。
[0010]进一步的，所述CRN模型的构建和训练方法，包括：
[0...

【技术保护点】

【技术特征摘要】
1.一种麦克风阵列声源定位方法，其特征在于，包括：获取测试信号；将所述测试信号进行预处理，得到单帧测试信号；提取所述单帧测试信号的空间定位线索，将其作为测试样本；将所述测试样本输入预先构建并训练完成的CRN模型中进行测试，获取测试信号属于每个方位角的概率，其中，取概率最大的方位作为该帧信号的方位角估计值。2.根据权利要求1所述的麦克风阵列声源定位方法，其特征在于，所述CRN模型的构建和训练方法，包括：将纯净语音信号与不同方位角的房间脉冲响应卷积，并加上不同程度的噪声和混响，生成多个麦克风阵列信号；对所述多个麦克风阵列信号进行预处理，获得多个单帧信号；提取多个单帧信号的空间定位线索，将其作为CRN模型的训练样本，同时标记每个样本的对应方位，将其作为样本的类别标签；构建CRN模型，将所述训练样本和类别标签作为CRN模型的训练数据集进行训练。3.根据权利要求2所述的麦克风阵列声源定位方法，其特征在于，所述将纯净语音信号与不同方位角的房间脉冲响应卷积，并加上不同程度的噪声和混响，生成多个麦克风阵列信号，公式如下：x
m
(t)＝h
m
(t)*s(t)+v
m
(t),m＝1,2,...,M其中，x
m
(t)表示第m个麦克风接收到的指定方位的语音信号，m为麦克风阵元的序号，m＝1,2,
…
,M，M为麦克风阵元的数目,s(t)为纯净语音，h
m
(t)表示从指定声源方位到第m个麦克风的房间脉冲响应，h
m
(t)与声源方位、房间混响有关，v
m
(t)表示噪声。4.根据权利要求2所述的麦克风阵列声源定位方法，其特征在于，所述对所述多个麦克风阵列信号进行预处理，获得多个单帧信号，包括：预处理包括分帧和加窗，其中：分帧方法为：采用预设分帧长度和帧移，将第m个阵元的时域信号x
m
(t)划分为多个单帧信号x
m
(iN+n)，其中i为帧序号，n表示一帧内采样序号0≤n＜N，N为帧长；加窗方法为：x
m
(i,n)＝w
H
(n)x
m
(iN+n)其中，x
m
(i,n)为加窗处理后的第m个阵元的第i帧的信号，为汉明窗。5.根据权利要求2所述的麦克风阵列声源定位方法，其特征在于，所述提取多个单帧信号的空间定位线索，包括：对每个单帧信号进行离散傅里叶变换，将时域信号转换至频域信号；离散傅里叶变换计算公式为：其中X
m
(i,k)是x
m
(i,n)的离散傅里叶变换，表示第m个阵元第i帧的频域信号，k为频率点，K为离散傅里叶变换的长度，K＝2N，DFT(
·
)表示离散傅里叶变换；
设计Gammatone滤波器组，g
j
(t)为第j个Gammatone滤波器的脉冲响应函数，其表达式为：其中，j代表滤波器的序号；C是滤波器增益；t表示连续时间；a为滤波器的阶数；表示相位；f
j
表示第j个滤波器的中心频率；b
j
表示滤波器衰减因子，b
j
计算公式为：b
j
＝1.109E...

【专利技术属性】
技术研发人员：王子怡，赵小燕，戎洪军，童莹，芮雄丽，
申请(专利权)人：南京工程学院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人