System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 时空波束成形器制造技术_技高网

时空波束成形器制造技术

技术编号:42182450 阅读:13 留言:0更新日期:2024-07-30 18:35
本公开提供了用于信号处理的方法、设备和系统。本实施方式更具体地涉及时空波束成形器。在一些方面中,波束成形系统可经由多个麦克风接收音频信号,所述音频信号包括用于所述多个麦克风中的每一个的一数量个(B个)帧,所述多个麦克风中的每一个的所述B个帧中的每一个包括一数量个(N个)时域样本。对于第一麦克风,波束成形系统可将B*N个时域样本变换为B*N/2个第一频域样本;将B*N/2个第一频域样本变换为B*N/2个第二频域样本;以及基于神经网络模型确定与B*N/2个第二频域样本相关联的语音概率。波束成形器系统可以至少部分地基于第一麦克风的语音概率来确定最小方差无失真响应(MVDR)波束成形滤波器。

【技术实现步骤摘要】

本实施方式总体上涉及信号处理,并且具体地涉及用于信号处理的时空波束成形器


技术介绍

1、波束成形是一种信号处理技术,其可以聚焦在空间方向上发射或接收的信号的能量。例如,波束成形器可以通过在麦克风输出处的信号组合来改善由麦克风阵列检测到的语音(speech)质量。更具体地,波束成形器可以将相应的权重应用于由麦克风阵列的每一个麦克风输出的音频信号,使得当音频信号被组合时,在语音的方向上增强信号强度(或在噪声的方向上抑制信号强度)。除了其他示例之外,示例波束成形技术包括最小方差无失真响应(mvdr)波束成形。

2、一些波束成形技术依赖于话音(voice)活动检测来确定语音的方向。一些话音活动检测器(vad)实现机器学习,诸如深度神经网络。用于确定语音概率的此类技术通常使用高频分辨率的信号来实现语音活动的更准确检测。因此,机器学习技术可以使用大量计算资源,诸如存储器和处理能力。然而,可利用波束成形和话音活动检测技术(例如,用于话音呼叫的头戴式耳机设备)的许多边缘设备通常具有计算资源约束。因此,存在减少话音活动检测技术的计算资源费用的需要。


技术实现思路

1、提供本
技术实现思路
是为了以简化的形式介绍下面在详细描述中进一步描述的概念的选择。本
技术实现思路
不旨在标识所要求保护的主题的关键特征或必要特征,也不旨在限制所要求保护的主题的范围。

2、本公开的主题的一个创新方面可在处理音频信号的方法中实现。所述方法包括经由多个麦克风接收第一音频信号,所述第一音频信号包括所述多个麦克风中的每一个的多个(b个)帧,所述多个麦克风中的每一个的b个帧中的每一个包括多个(n个)时域样本。该方法还包括,对于包括在多个麦克风中的第一麦克风:基于n-点快速傅立叶变换(fft)将b*n个时域样本变换为b*n/2个第一频域样本;基于b-点fft将b*n/2个第一频域样本变换为b*n/2个第二频域样本;以及基于神经网络模型确定与b*n/2个第二频域样本相关联的语音概率。该方法还包括:至少部分地基于第一麦克风的语音概率来确定最小方差无失真响应(mvdr)波束成形滤波器;以及基于mvdr波束成形滤波器来处理第一音频信号。

3、本公开的主题的另一创新方面可在包括处理系统及存储器的波束成形系统中实现。存储器存储指令,所述指令在由所述处理系统执行时使得所述波束成形系统:经由多个麦克风接收第一音频信号,所述第一音频信号包括所述多个麦克风中的每一个的多个(b个)帧,所述多个麦克风中的每一个的b个帧中的每一个包括多个(n个)时域样本;对于包括在所述多个麦克风中的第一麦克风:基于n-点快速傅立叶变换(fft)将所述b*n个时域样本变换为b*n/2个第一频域样本,基于b-点fft将所述b*n/2个第一频域样本变换为b*n/2个第二频域样本,且基于神经网络模型确定与所述b*n/2个第二频域样本相关联的语音概率;至少部分地基于所述第一麦克风的所述语音概率确定最小方差无失真响应(mvdr)波束成形滤波器;以及基于所述mvdr波束成形滤波器处理所述第一音频信号。

本文档来自技高网...

【技术保护点】

1.一种处理音频信号的方法,包括:

2.根据权利要求1所述的方法,还包括:

3.根据权利要求2所述的方法,其中所述MVDR波束成形滤波器的确定包括基于与所述第三语音信号相关联的所述语音概率来确定所述MVDR波束成形滤波器。

4.根据权利要求3所述的方法,其进一步包括基于所述B*N/2个第一频域样本生成第二音频信号,其中所述第二音频信号包括与所述第一频率区间相关联的所述第一数量个频域样本和与所述第二频率区间相关联的所述第二数量个频域样本。

5.根据权利要求4所述的方法,其进一步包括基于与所述B*N/2个第二频域样本相关联的所述语音概率而生成重构的语音概率。

6.根据权利要求5所述的方法,其中所述重构的语音概率包括:

7.根据权利要求6所述的方法,其中所述第二多个概率值中的每一个由相应的第一权重加权,且所述第三多个概率值中的每一个由相应的第二权重加权。

8.根据权利要求1所述的方法,其中将所述B*N个时域样本变换为所述B*N/2个第一频域样本包括:

9.根据权利要求1所述的方法,其中确定与所述B*N/2个第二频域样本相关联的语音概率包括:依据抽取因子(D)来抽取所述B*N/2个第二频域样本,与所述B*N/2个第二频域样本相关联的语音概率是基于B*N/2D个抽取的第二频域样本来确定的。

10.根据权利要求9所述的方法,其中D=2。

11.根据权利要求9所述的方法,其中所述B*N/2个第二频域样本的抽取包括:

12.根据权利要求1所述的方法,还包括:

13.一种波束成形系统,包括:

14.根据权利要求13所述的波束成形系统,其中所述指令的执行还使得所述波束成形系统:基于所述第一麦克风的所述语音概率和所述B*N/2个第二频域样本生成第一语音信号;

15.根据权利要求14所述的波束成形系统,其中所述指令的执行还使得所述波束成形系统基于与所述第三语音信号相关联的所述语音概率来确定所述MVDR波束成形滤波器。

16.根据权利要求15所述的波束成形系统,其中所述指令的执行还使得所述波束成形系统基于所述B*N/2个第一频域样本生成第二音频信号,其中所述第二音频信号包括与所述第一频率区间相关联的所述第一数量个频域样本和与所述第二频率区间相关联的所述第二数量个频域样本。

17.根据权利要求16所述的波束成形系统,其中所述指令的执行还使得所述波束成形系统基于与所述B*N/2个第二频域样本相关联的所述语音概率而生成重构的语音概率。

18.根据权利要求17所述的波束成形系统,其中所述重构的语音概率包括:

19.根据权利要求13所述的波束成形系统,其中所述指令的执行还使得所述波束成形系统:缓存所述B个帧;以及

20.根据权利要求13所述的波束成形系统,其中所述指令的执行还使得所述波束成形系统依据抽取因子(D)来抽取所述B*N/2个第二频域样本,与所述B*N/2个第二频域样本相关联的语音概率是基于B*N/2D个抽取的第二频域样本来确定的。

...

【技术特征摘要】

1.一种处理音频信号的方法,包括:

2.根据权利要求1所述的方法,还包括:

3.根据权利要求2所述的方法,其中所述mvdr波束成形滤波器的确定包括基于与所述第三语音信号相关联的所述语音概率来确定所述mvdr波束成形滤波器。

4.根据权利要求3所述的方法,其进一步包括基于所述b*n/2个第一频域样本生成第二音频信号,其中所述第二音频信号包括与所述第一频率区间相关联的所述第一数量个频域样本和与所述第二频率区间相关联的所述第二数量个频域样本。

5.根据权利要求4所述的方法,其进一步包括基于与所述b*n/2个第二频域样本相关联的所述语音概率而生成重构的语音概率。

6.根据权利要求5所述的方法,其中所述重构的语音概率包括:

7.根据权利要求6所述的方法,其中所述第二多个概率值中的每一个由相应的第一权重加权,且所述第三多个概率值中的每一个由相应的第二权重加权。

8.根据权利要求1所述的方法,其中将所述b*n个时域样本变换为所述b*n/2个第一频域样本包括:

9.根据权利要求1所述的方法,其中确定与所述b*n/2个第二频域样本相关联的语音概率包括:依据抽取因子(d)来抽取所述b*n/2个第二频域样本,与所述b*n/2个第二频域样本相关联的语音概率是基于b*n/2d个抽取的第二频域样本来确定的。

10.根据权利要求9所述的方法,其中d=2。

11.根据权利要求9所述的方法,其中所述b*n/2个第二频域样本的抽取包括...

【专利技术属性】
技术研发人员:S·莫萨耶布尔卡斯卡里A·马斯纳迪设拉子
申请(专利权)人:辛纳普蒂克斯公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1