基于OMAP-L137的麦克风阵列语音波束形成系统技术方案

技术编号:29258403 阅读:14 留言:0更新日期:2021-07-13 17:31
本发明专利技术是一种基于OMAP‑L137的麦克风阵列语音波束形成系统,该系统包括语音采集模块和语音处理平台,语音采集模块和语音处理平台中的音频扩展口通信互联,该系统还包括语音输出模块,语音输出模块包括蓝牙传输模块和蓝牙音箱。通过语音采集模块的线性麦克风阵列板采集音频信号,将模拟信号转换成数字信号,再通过I2S接口将数字值传输到开发板的音频扩展口,开发板上的音频处理模块对接收到的语音信号进行语音增强处理,最后将处理后的信号传输进行数模转换,传输到语音输出模块。本发明专利技术在技术上提高了嘈杂环境中提取清晰语音的能力,改善了通信质量,并且语音信号传输过程不受网线限制,可以远距离传输,成本更加低廉。

【技术实现步骤摘要】
基于OMAP-L137的麦克风阵列语音波束形成系统
本专利技术属于数字信号处理
,具体的说是涉及一种基于OMAP-L137的麦克风阵列语音波束形成系统。
技术介绍
智能家居是以住宅为平台,利用综合布线技术、网络通信技术、安全防范技术、自动控制技术、音视频技术将家居生活有关的设施集成,构建高效的住宅设施与家庭日程事务的管理系统,提升家居安全性、便利性、舒适性、艺术性,并实现环保节能的居住环境。随着5G时代的的到来,智能家居行业快速发展,为了使家居能够正确地接收语音指令,通常会采用能够在实时环境中提高各种噪声条件下语音的质量和清晰度的语音增强技术。与单通道语音增强技术相比,基于麦克风阵列的语音增强方法不仅提高了语音质量,而且提高了语音的可懂度。麦克风阵列可以作为一个方向感测元件,附加信号处理称为波束形成,波束形成的实质是对各阵元接收到的数据进行空域滤波,从而使阵列输出形成空间指向性,达到增强所需的期望信号、抑制干扰和噪声的目的。ZL2019107855554公开了一种基于麦克风阵列波束形成算法的语音处理系统,该系统采用了语音采集终端与语音处理平台的音频扩展口通信互联,圆形麦克风板实时采集嘈杂环境下的语音信号,并通过McASP接口将数字流传输给开发板,随后音频处理模块对音频扩展口接收到数字信号进行混响去除、语音增强处理,处理后的信号通过网络接口传输给PC端主机。虽然该处理系统提高了提取清晰语音的能力,改善了通信质量。但是目前的语音处理系统在使用过程中容易受网线限制、只能近距离传输,不利于连接,且无论是在语音采集以及语音处理过程中成本比较高。
技术实现思路
为了解决上述问题,本专利技术提供了一种基于OMAP-L137的麦克风阵列语音波束形成系统,该系统对采集到的语音信号进行语音增强处理,不受网线限制且可以远距离传输,连接灵活。为了达到上述目的,本专利技术是通过以下技术方案实现的:本专利技术是一种基于OMAP-L137的麦克风阵列语音波束形成系统,该系统包括语音采集模块和语音处理平台,语音采集模块和语音处理平台中的音频扩展口通信互联,该系统还包括语音输出模块,语音输出模块包括蓝牙传输模块和蓝牙音箱,语音采集模块采用4通道线性麦克风阵列板PCM1864LMBEVM,在所述线性麦克风阵列板上设置有作为控制核心的高度集成的高性能的音频模数转换器PCM1864和四个麦克风,线性麦克风阵列板用一个所述音频模数转换器与四个麦克风阵列连接,语音处理平台采用基于OMAP-L137处理器的OMAP-L137/TMS320C6747浮点开发板,所述音频扩展口、DSP内核和音频处理模块均设在所述浮点开发板中。与以往的开发板不同,本专利技术的浮点开发板保留OMAP-L137应用处理器、音频扩展口、300MHz定点/浮点C674x的DSP内核和音频处理模块,被设计成基于OMAP-L137的最小系统,对接收到的语音信号进行处理,效果相同,但成本更低。本专利技术的线性麦克风阵列板进行声源定位实时采集嘈杂环境下的语音信号,音频模数转换器对接收到的语音信号进行采样,将模拟语音信号转换成数字信号并通过I2S接口将数字值传输给所述音频扩展口,音频处理模块对从音频扩展口接收到数字信号应用波束形成算法放大来自所需方向的语音信号,并衰减来自其他所有方向的信号,并利用混响消除技术消除混响和回声,处理后的信号通过所述蓝牙传输模块传输给蓝牙音箱。本专利技术的进一步改进在于:四个麦克风安装在同一条线上,每相邻的两个所述麦克风之间间距相等。本专利技术的进一步改进在于:浮点开发板中设有基于DSP内核的低功耗数字信号处理器,DSP内核采用基于两级高速缓存的架构,一级程序高速缓存(L1P)是32KB的直接映射高速缓存,一级数据高速缓存(L1D)是32KB的双向集合关联高速缓存,二级程序缓存(L2P)由程序和数据空间共享的256KB内存空间组成。本专利技术的进一步改进在于:所述声源定位算法为MUSIC算法,分解任意阵列输出数据的协方差矩阵,得到信号子空间和噪声子空间,然后利用这两个子空间的正交性来估计信号的入射方向,该MUSIC算法用频率和角度分量的去耦在频域中执行平滑操作,这增加了信号互谱矩阵的秩,并使得高分辨率DOA估计子空间算法的实现成为可能,DOA和源定位的差异都取决于两个独立的部分,一个部分仅取决于信号,另一个部分仅取决于阵列的几何形状。均匀间隔的线性阵列为良好的整体性能提供很好的几何形状。本专利技术的进一步改进在于:波束形成算法为改进的GSC波束形成方法,所述GSC波束形成方法基于信号输出功率比(SPR)自适应更新滤波器系数,重写FBF输出功率,FBF的功率根据k=32到k=256的频率指数的平均值计算,公式如下:其中,αs是一个经验选择的平滑参数,Pf_o(k,l)是FBF波束形成器的输出信号,采用平滑运算减少了对弱语音的误判,从而减轻了期望信号的语音失真,所有帧中的FBF输出功率表示为本专利技术的进一步改进在于:本专利技术的音频扩展口选用型号为QSE-040-01-L-D-A的转接口,能更稳定地传输数据。本专利技术的进一步改进在于:本专利技术的音频处理模块选用型号为TVL320AIC3106的音频编解码器。本专利技术的进一步改进在于:衰减来自其他所有方向的信号的采用的是混响消除技术,该技术采用集成了多通道线性预测(MCLP)和GSC的集成旁瓣消除和线性预测(ISCLP)卡尔曼滤波器,此处,旁瓣消除(SC)滤波器和线性预测(LP)滤波器并行运行,但在不同的输入数据帧上运行,并且被联合估计。使用MCLP模型描述后期混响,作为过去L帧中D的延迟预测表示如下:其中,Wr,l(n)表示MCLP系数,L>D>1;旁瓣消除分支由下式给出:uSC(n)=BH(n)y(n)其中,BH(n)是一个分块矩阵且BH(n)g(n)=0线性预测框架的输出信号表示如下:其中,wg是固定的波束形成器系数,wSC(n)是用于消除噪声的旁瓣消除滤波器,wLP(n)是预测GSC输出处混响的多通道线性预测系数。本专利技术的有益效果是:本专利技术的波束形成系统在技术上提高了嘈杂环境中提取清晰语音的能力,改善了通信质量,并且语音信号传输过程不受网线限制,可以远距离传输,连接更加灵活,成本更加低廉。本专利技术具有结构简单、实用方便、能耗低的优势。附图说明图1是本专利技术的总体结构框图。图2是本专利技术线性麦克风阵列板的结构框图。图3是本专利技术两个麦克风间的距离和相位差作为信号到达角度的函数。图4是本专利技术四个麦克风多角度波束形成系统框图。具体实施方式以下将以图式揭露本专利技术的实施方式,为明确说明起见,许多实务上的细节将在以下叙述中一并说明。然而,应了解到,这些实务上的细节不应用以限制本专利技术。也就是说,在本专利技术的部分实施方式中,这些实务上的细节是非必要的。本专利技术是一种基于OMAP-L137的麦克风阵本文档来自技高网
...

【技术保护点】
1.一种基于OMAP-L137的麦克风阵列语音波束形成系统,该系统包括语音采集模块(1)和语音处理平台(2),所述语音采集模块(1)和所述语音处理平台(2)中的音频扩展口(5)通信互联,其特征在于:该系统还包括语音输出模块(3),所述语音输出模块(3)包括蓝牙传输模块和蓝牙音箱,所述语音处理平台(2)对从所述音频扩展口(5)接收到数字信号应用波束形成算法放大来自所需方向的语音信号,衰减来自其他所有方向的信号,并利用混响消除技术消除混响和回声,处理后的信号通过所述蓝牙传输模块传输给蓝牙音箱。/n

【技术特征摘要】
1.一种基于OMAP-L137的麦克风阵列语音波束形成系统,该系统包括语音采集模块(1)和语音处理平台(2),所述语音采集模块(1)和所述语音处理平台(2)中的音频扩展口(5)通信互联,其特征在于:该系统还包括语音输出模块(3),所述语音输出模块(3)包括蓝牙传输模块和蓝牙音箱,所述语音处理平台(2)对从所述音频扩展口(5)接收到数字信号应用波束形成算法放大来自所需方向的语音信号,衰减来自其他所有方向的信号,并利用混响消除技术消除混响和回声,处理后的信号通过所述蓝牙传输模块传输给蓝牙音箱。


2.根据权利要求1所述基于OMAP-L137的麦克风阵列语音波束形成系统,其特征在于:所述波束形成算法为改进的GSC波束形成方法,所述GSC波束形成方法基于信号输出功率比自适应更新滤波器系数,重写FBF输出功率,FBF的功率根据k=32到k=256的频率指数的平均值计算,公式如下:



其中,αs是一个经验选择的平滑参数,Pf_o(k,l)是FBF波束形成器的输出信号,所有帧中的FBF输出功率表示为





3.根据权利要求1所述基于OMAP-L137的麦克风阵列语音波束形成系统,其特征在于:所述混响消除技术采用集成了多通道线性预测和GSC的集成旁瓣消除和线性预测卡尔曼滤波器,所述旁瓣消除滤波器和线性预测滤波器并行运行,但在不同的输入数据帧上运行,并且被联合估计,使用MCLP模型描述后期混响,作为过去L帧中D的延迟预测表示如下:



其中,Wr,l(n)表示MCLP系数,L>D>1;
旁瓣消除分支由下式给出:
uSC(n)=BH(n)y(n)
其中,BH(n)是一个分块矩阵且BH(n)g(n)=0
线性预测框架的输出信号表示如下:






其中,wg是固定的波束形成器系数,wSC(n)是用于消除噪声的旁瓣消除滤波器,...

【专利技术属性】
技术研发人员:吴蒙陈圆
申请(专利权)人:南京邮电大学
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1