本发明专利技术公开音频处理方法和装置,其中,一种音频处理方法,包括:响应于异形环麦克风阵列获取到2N路第一音频,将所述2N路第一音频组成两组第二音频,其中,所述异形环麦克风阵列是由2N个方向各一个麦克风组成的异形环2N麦克风阵列,其中,N为大于1的自然数;对所述N路第二音频分别进行处理获取所述N路第二音频中的有效音频;将所述两路第二音频中的有效音频合并为一路第三音频,并对所述第三音频进行处理后输出。通过组建异形环麦克风阵列,从而可以解决传统麦克风阵列对硬件结构的严格要求,进一步地,充分利用获取到的音频,从而可以减少算法中计算维度,提高语音处理实时率。
【技术实现步骤摘要】
音频处理方法和装置
本专利技术属于音频处理
,尤其涉及音频处理方法和装置。
技术介绍
麦克风阵列方案(常见于耳机/手机/会议系统的):求得DOA(directionofarrival,波达方向)后,利用得到的角度信息进行特定方向的波束形成语音增强,如FB(fixedbeamforming,固定波束形成)、GSC(generalizedsidelobecancellation,广义旁瓣抑制器)等;传统多通道信号处理方法:不需要直接的DOA角度信息,利用BSS(blindsourceseparation,盲源分离)、MWF(multichannelwienerfilter,多通道维纳滤波)、MVDR(minimumvariancedistortionlessresponse,最小方差无失真响应)等多通道信号处。麦克风阵列方案不能解决异形麦,非标准麦克风阵列结构;多通道信号处理方法不能准确的估计短时非平稳噪声。
技术实现思路
本专利技术实施例提供一种音频处理方法和装置,用于至少解决上述技术问题之一。第一方面,本专利技术实施例提供一种音频处理方法,包括:响应于异形环麦克风阵列获取到2N路第一音频,将所述2N路第一音频组成两组第二音频,其中,所述异形环麦克风阵列是由2N个方向各一个麦克风组成的异形环2N麦克风阵列,其中,N为大于1的自然数;对所述N路第二音频分别进行处理获取所述N路第二音频中的有效音频;将所述两路第二音频中的有效音频合并为一路第三音频,并对所述第三音频进行处理后输出。第二方面,本专利技术实施例提供一种音频处理装置,包括:获取组成程序模块,配置为响应于异形环麦克风阵列获取到2N路第一音频,将所述2N路第一音频组成两组第二音频,其中,所述异形环麦克风阵列是由2N个方向各一个麦克风组成的异形环2N麦克风阵列,其中,N为大于1的自然数;处理获取程序模块,配置为对所述N路第二音频分别进行处理获取所述N路第二音频中的有效音频;合并处理模块,配置为将所述两路第二音频中的有效音频合并为一路第三音频,并对所述第三音频进行处理后输出。第三方面,提供一种电子设备,其包括:至少一个处理器,以及与所述至少一个处理器通信连接的存储器,其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本专利技术任一实施例的音频处理方法的步骤。第四方面,本专利技术实施例还提供一种计算机程序产品,所述计算机程序产品包括存储在非易失性计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,使所述计算机执行本专利技术任一实施例的音频处理方法的步骤。本申请的方法和装置通过组建异形环麦克风阵列,从而可以解决传统麦克风阵列对硬件结构的严格要求,进一步地,充分利用获取到的音频,从而可以减少算法中计算维度,提高语音处理实时率。附图说明为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术一实施例提供的一种音频处理方法的流程图;图2为本专利技术一实施例提供的音频处理方法的一个具体示例的异形环四麦克风图;图3为本专利技术一实施例提供的音频处理方法的一个具体示例的数据流图;图4为本专利技术一实施例提供的音频处理方法的一个具体示例的音频处理流程图;图5为本专利技术一实施例提供的一种音频处理装置的框图;图6是本专利技术一实施例提供的电子设备的结构示意图。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。请参考图1,其示出了本申请的音频处理方法一实施例的流程图。如图1所示,在步骤101中,响应于异形环麦克风阵列获取到2N路第一音频,将所述2N路第一音频组成两组第二音频,其中,所述异形环麦克风阵列是由2N个方向各一个麦克风组成的异形环2N麦克风阵列,其中,N为大于1的自然数;在步骤102中,对所述N路第二音频分别进行处理获取所述N路第二音频中的有效音频;在步骤103中,将所述两路第二音频中的有效音频合并为一路第三音频,并对所述第三音频进行处理后输出。在本实施例中,对于步骤101,音频处理装置响应于异形环麦克风阵列获取到2N路第一音频,将2N路第一音频组成两组第二音频,其中,异形环麦克风阵列是由2N个方向各一个麦克风组成的异形环2N麦克风阵列,其中,N为大于1的自然数,例如,将异形环麦克风阵列放到用户腰间的情况下,前后左右各有一个麦克风组成异形环四麦克风阵列,在获取到音频后,将四个麦克风通道音频相邻的两个通道的音频组成两组两通道音频,例如,前右后左四个麦克风分别为MIC1、MIC2、MIC3和MIC4,可以将MIC1和MIC2分为一组,MIC3和MIC4分为一组,也可以将MIC1和MIC4分为一组,MIC2和MIC3分为一组。之后,对于步骤102,音频处理装置对N路第二音频分别进行处理获取N路第二音频中的有效音频,例如,对N路第二音频分别进行回声消除、去混响、盲源分离、自适应波束成形和神经网络降噪等处理获取N路第二音频中的有效音频。最后,对于步骤103,音频处理装置将两路第二音频中的有效音频合并为一路第三音频,并对第三音频进行处理后输出。例如,再次对第三音频进行自适应波束成形和神经网络降噪等音频处理,最后再进行自动语音增幅,调节最终输出音频效果。本实施例的方法通过组建异形环麦克风阵列,从而可以解决传统麦克风阵列对硬件结构的严格要求,进一步地,充分利用获取到的音频,从而可以减少算法中计算维度,提高语音处理实时率。在上述实施例所述的方法中,所述将所述2N路第一音频组成两组第二音频包括:将2N路第一音频拆分成两组N通道第二音频,其中,两组N通道第二音频均由相邻通道的N路第一音频组成,例如,2N路第一音频为四路第一音频,四路第一音频分别为MIC1、MIC2、MIC3和MIC4,其中,MIC1和MIC2以及MIC4相邻,那么可以将MIC1和MIC2分为一组或将MIC1和MIC4分为一组;例如,在MIC1和MIC2分为一组的情况下,将MIC3和MIC4分为一组;在MIC1和MIC4分为一组的情况下,将MIC2和MIC3分为一组。本实施例的方法通过将将2N路第一音频拆分成两组N通道第二音频进行处理,从而可以充分利用音频信息,提高语音处理实时率。在上述实施例所述的方法中,所述对第二音频进行处理包括:前端信号处理和一级神经网络降噪。在上述实施例所述的本文档来自技高网...
【技术保护点】
1.一种音频处理方法,包括:/n响应于异形环麦克风阵列获取到2N路第一音频,将所述2N路第一音频组成两组第二音频,其中,所述异形环麦克风阵列是由2N个方向各一个麦克风组成的异形环2N麦克风阵列,其中,N为大于1的自然数;/n对所述N路第二音频分别进行处理获取所述N路第二音频中的有效音频;/n将所述两路第二音频中的有效音频合并为一路第三音频,并对所述第三音频进行处理后输出。/n
【技术特征摘要】
1.一种音频处理方法,包括:
响应于异形环麦克风阵列获取到2N路第一音频,将所述2N路第一音频组成两组第二音频,其中,所述异形环麦克风阵列是由2N个方向各一个麦克风组成的异形环2N麦克风阵列,其中,N为大于1的自然数;
对所述N路第二音频分别进行处理获取所述N路第二音频中的有效音频;
将所述两路第二音频中的有效音频合并为一路第三音频,并对所述第三音频进行处理后输出。
2.根据权利要求1所述的方法,其中,所述将所述2N路第一音频组成两组第二音频包括:
将所述2N路第一音频拆分成两组N通道第二音频,其中,两组所述N通道第二音频均由相邻通道的N路第一音频组成。
3.根据权利要求1所述的方法,其中,所述对第二音频进行处理包括:前端信号处理和一级神经网络降噪。
4.根据权利要求2所述的方法,其中,所述前端信号处理包括:回声消除、去混响、盲源分离和一级自动波束成形。
5.根据权利要求3所述的方法,其中,所述对第三音频进行处理包括:
二级自动波束成形,二级神经网络降噪和自动语音增益。
6.根据权利要求5所述的方法,其中,所述一级神经网络降噪和所述二...
【专利技术属性】
技术研发人员:李晓,
申请(专利权)人:苏州思必驰信息科技有限公司,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。