用于免提通信的音频源分类制造技术

技术编号：42827282 阅读：31 留言：0更新日期：2024-09-24 21:02

本公开提供了用于音频信号处理的方法、设备和系统。本实现方式更具体地涉及利用多通道音频信号进行音频源分类的语音增强技术。在一些方面，语音增强系统可以包括自适应滤波器、特征提取器和特征分类器。自适应滤波器被配置为经由至少第一麦克风和第二麦克风接收多通道音频信号，并且基于多通道音频信号确定麦克风之间的相对脉冲响应(ReIR)。特征提取器被配置为至少部分地基于ReIR的峰值从ReIR提取特征集合。特征分类器被配置为基于高斯混合模型(GMM)将该特征集合分类为与目标源或干扰项源相关联。

全部详细技术资料下载

【技术实现步骤摘要】

本实现方式总体上涉及信号处理，并且具体地涉及用于免提通信的音频源分类。

技术介绍

1、电话通信设备包括被配置为将声波转换成可以通过通信通道发射到接收设备的音频信号的麦克风。音频信号通常包括目标语音分量(诸如来自在通信设备的方向上讲话的用户)和噪声分量(诸如来自在背景中讲话的人)。语音增强是一种信号处理技术，其试图在不使目标语音分量失真的情况下抑制接收到的音频信号的噪声分量。多通道语音增强依赖于经由麦克风阵列接收的音频信号(也称为“多通道音频信号”)中的空间分集，以将语音分量与噪声分量分离。相比之下，单通道语音增强必须跟踪经由单个麦克风接收的音频信号(也称为“单通道音频信号”)中的噪声分量。

2、一些电话通信设备(诸如互联网协议语音(voip)电话)包括可以针对特定操作模式被选择性地激活的多个麦克风。举例来说，许多voip电话包括可用于“免提呼叫”(其中经由基座中的麦克风接收音频信号)的基座及可与基座分离以用于“手持机(handset)呼叫”(其中经由手持机中的麦克风接收音频信号)的可拆卸手持机。大多数手持机被设计成当电话用于免提呼叫时搁置在基座上(诸如在“支架”中)。当在支架中时，手持机中的麦克风通常被基座阻挡。因此，许多现有的电话通信设备仅依赖于用于免提呼叫的单通道音频信号。

技术实现思路

1、提供本
技术实现思路
是为了以简化形式介绍下面在具体实施方式中进一步描述的概念的选择。本
技术实现思路
不旨在标识所要求保护的主题的关键特征或必要特征，也不旨在限制所要求保护的主题的范围。

2、本公开的主题的一个创新方面可在语音增强的方法中实现。所述方法包括以下步骤：经由多个麦克风接收多通道音频信号；基于所述多通道音频信号的帧确定所述多个麦克风之间的相对脉冲响应；至少部分地基于所述相对脉冲响应的峰值从所述相对脉冲响应提取特征集合；基于高斯混合模型(gmm)对所述特征集合进行分类；以及至少部分地基于所述特征集合的分类来处理所述多通道音频信号。

3、本公开的主题的另一创新方面可在包括处理系统及存储器的语音增强系统中实现。所述存储器存储指令，所述指令在由所述处理系统执行时使所述语音增强系统：经由多个麦克风接收多通道音频信号；基于所述多通道音频信号的帧确定所述多个麦克风之间的相对脉冲响应；至少部分地基于所述相对脉冲响应的峰值从所述相对脉冲响应提取特征集合；基于gmm对所述特征集合进行分类；以及至少部分地基于所述特征集合的分类来处理所述多通道音频信号。

本文档来自技高网...

【技术保护点】

1.一种语音增强的方法，包括：

2.根据权利要求1所述的方法，其中基于归一化最小均方NLMS滤波器确定所述第一相对脉冲响应。

3.根据权利要求1所述的方法，其中所述第一特征集合包括所述第一相对脉冲响应的尾部部分的峰度，所述尾部部分跨越从所述峰值开始的阈值持续时间。

4.根据权利要求1所述的方法，其中所述第一特征集合包括相对于所述峰值归一化的所述第一相对脉冲响应的预振铃部分的均方根RMS，所述预振铃部分跨越在所述峰值处结束的阈值持续时间。

5.根据权利要求1所述的方法，还包括：

6.根据权利要求5所述的方法，其中所述第一多通道音频信号和所述第二多通道音频信号携带来自同一用户的语音。

7.根据权利要求1所述的方法，其中所述GMM被训练以确定包括目标聚类和干扰项聚类的两个非共变量聚类。

8.根据权利要求7所述的方法，其中所述第一特征集合的分类包括：

9.根据权利要求8所述的方法，其中所述多通道音频信号的所述第一通道的处理包括：

10.根据权利要求9所述的方法，其中与当所述第一特征

11.一种语音增强系统，包括：

12.根据权利要求11所述的语音增强系统，其中所述多个麦克风包括电话通信设备的手持机麦克风和所述电话通信设备的免提麦克风。

13.根据权利要求12所述的语音增强系统，其中当所述电话通信设备以免提通信模式操作时，所述第一多通道音频信号被接收。

14.根据权利要求11所述的语音增强系统，其中所述第一相对脉冲响应是基于归一化最小均方NLMS滤波器确定的。

15.根据权利要求11所述的语音增强系统，其中所述第一特征集合包括所述第一相对脉冲响应的尾部部分的峰度，所述尾部部分跨越从所述峰值开始的阈值持续时间。

16.根据权利要求11所述的语音增强系统，其中所述第一特征集合包括相对于所述峰值归一化的所述第一相对脉冲响应的预振铃部分的均方根RMS，所述预振铃部分跨越在所述峰值处结束的阈值持续时间。

17.根据权利要求11所述的语音增强系统，其中所述指令的执行还使所述语音增强系统：经由所述多个麦克风接收第二多通道音频信号；

18.根据权利要求17所述的语音增强系统，其中所述第一多通道音频信号和所述第二多通道音频信号携带来自同一用户的语音。

19.根据权利要求11所述的语音增强系统，其中所述GMM被训练以确定包括目标聚类和干扰项聚类的两个非共变量聚类，所述第一特征集合的分类包括：

20.根据权利要求19所述的语音增强系统，其中所述第一多通道音频信号的所述第一通道的处理包括：

...

【技术特征摘要】

1.一种语音增强的方法，包括：

2.根据权利要求1所述的方法，其中基于归一化最小均方nlms滤波器确定所述第一相对脉冲响应。

4.根据权利要求1所述的方法，其中所述第一特征集合包括相对于所述峰值归一化的所述第一相对脉冲响应的预振铃部分的均方根rms，所述预振铃部分跨越在所述峰值处结束的阈值持续时间。

5.根据权利要求1所述的方法，还包括：

6.根据权利要求5所述的方法，其中所述第一多通道音频信号和所述第二多通道音频信号携带来自同一用户的语音。

7.根据权利要求1所述的方法，其中所述gmm被训练以确定包括目标聚类和干扰项聚类的两个非共变量聚类。

8.根据权利要求7所述的方法，其中所述第一特征集合的分类包括：

9.根据权利要求8所述的方法，其中所述多通道音频信号的所述第一通道的处理包括：

10.根据权利要求9所述的方法，其中与当所述第一特征集合被映射到所述目标聚类时相比，当所述第一特征集合被映射到所述干扰项聚类时，所述增益的调整导致所述第一通道的更大衰减。

11.一种语音增强系统，包括：

12.根据权利要求11所述的语音增强系统，其中所述...

【专利技术属性】
技术研发人员：J·亚瑟，
申请(专利权)人：辛纳普蒂克斯公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人