实时风冲击噪声检测制造技术

技术编号:13825835 阅读:80 留言:0更新日期:2016-10-13 00:40
实时风冲击噪声检测。使用每频率语音的概率估计以及短期和长期的低频率能量来检测麦克风信号中的风冲击噪声。使用语音存在的概率估计可以准确地检测冲击无语音条件。但语音存在的概率单独地不足以在冲击语音与无冲击条件中的任一个之间进行区分。可以假设如果风冲击正在发生,则其正在语音和非语音段两者期间发生以帮助在其他可能的状态之间区分。即,可以使用概率差异作为用于进入冲击无语音状态的标准,并且然后一旦概率差异标准不再被满足就可以使用某些其他信息(例如,低频率能量)来确定何时转变到冲击语音状态或无冲击状态中的一个。

【技术实现步骤摘要】

技术介绍
可以在没有手的使用(例如经由话音命令)的情况下或者在更广泛的意义上,在手的相对受限的使用的情况下,使用汽车中的免提(hands-free)音频系统,使得驾驶员正在驾驶汽车时不需要将电话听筒握在驾驶员的手中。汽车免提音频系统通常使用车辆的扬声器中的一个或多个以传输在电话呼叫的另一端上的人的话音,以及使用车辆中的一个或多个麦克风以在电话呼叫期间捕捉驾驶员的和/或乘客的话音。移动电话通常经由蓝牙连接到车辆中的汽车音频系统音响主机(head unit)或远程信息处理(telematics)单元。或者音响主机或远程信息处理单元可以具有它自己的网络接入设备(NAD)。在这样的系统中,当麦克风信号通过系统时,信号被处理并且通过移动电话或NAD发送到另一端上的人。来自远端的语音正在经历电话(通过蓝牙)或NAD、正在被处理并且然后从扬声器出来。在车辆中的麦克风处,可以存在近端语音、背景噪声、风噪声以及回声,其是来自音频系统扬声器的音频并且其也被麦克风拾取。当在远端上的人正在讲话时,该人不想听到它们的回声、道路噪声或风噪声。因此,回声通常被消除,道路噪声通常被抑制,这是共同特征,但用于在风冲击噪声(buffet noise)存在时标识风冲击噪声使得风冲击噪声可以被更强有力地(aggressively)抑制的改进技术将改进其中正在使用汽车免提音频系统的电话会话的远端处的声音质量。
技术实现思路
根据本专利技术的实施例,使用每频率语音的概率估计以及短期和长期的低频率能量来检测麦克风信号中的风冲击噪声。使用语音存在的概率估计可以准确地检测冲击无语音条件。但语音存在的概率单独地对用于在冲击语音与无冲击条件中的两者中的任一个之间进行区分而言是不充分的。可以假设如果风冲击正在发生,则其正在语音和非语音段两者期间发生以帮助在其他可能的状态之间进行区分。即,可以使用概率差异作为用于进入冲击无语音状态的标准,并且然后一旦概率差异标准不再被满足就可以使用某些其他信息(例如,低频率能量)来确定何时转变到冲击语音状态或无冲击状态中的一个。附图说明图1描绘了用于本专利技术的实施例的示例操作环境100。图2描绘了根据本专利技术的实施例的风冲击噪声和语音存在分类器200的框图。图3描绘了示出针对四个可能的条件或状态中的每个的期望的概率值的矩阵(matrix)。图4描绘了示出用于在四个状态之间转变的条件的状态图。具体实施方式风冲击噪声可以来自汽车中的各种情况,包括但不限于:倾斜打开的天窗(sun roof)、一个或多个车窗打开、HVAC扇处于高的设置并且指向麦克风等。风冲击噪声基本上是打击麦克风的空气的突发(burst)。冲击声音像有时来来去去的低音调的隆隆噪声。风冲击噪声一般位于低频率范围中,例如在约0-600 Hz之间。但语音也在该范围中。因此,尝试检测风冲击噪声并且然后移除它是有趣的问题。在标准窄带电话中,语音在0 - 4 kHz的范围中。采样率是8 kHz。宽带语音可以达到(go)高达8 kHz。语音本身可以达到比这更高。由于某些预先处理和麦克风的特性,低于约50 - 100 Hz的频率通常被移除或显著地衰减。风冲击噪声对于汽车环境中的免提通信而言是严重的问题。该类型的噪声常常遮蔽期望的语音声音,并且由于噪声的非稳定特性,常规的噪声抑制技术不是有效的。这导致上行链路语音在通信的远端处是不可理解的。通常,在汽车环境中,存在背景噪声。该噪声趋向于相当稳定,这意味着所述噪声不是变化的。例如,与通过卡车相关联的噪声将被称作瞬时噪声,因为其来去得相对快。传统的噪声抑制技术通常将不移除该噪声,因为这样的技术对假设是稳定的达特定时间范围(time frame)的噪声起作用。风冲击噪声是非稳定的,但通常是持续很久的(prolonged)并且在频率中是局部的。风冲击噪声使语音不可理解,因为尽管其是低频率的,但其趋向于在语音和风冲击噪声重叠的情况中是比较低频率中的语音更高的能量。根据本专利技术的实施例,使用每频率语音的概率估计以及短期和长期低频能量来检测麦克风信号中的风冲击噪声。可以使用多种信息,包括每频率语音存在的概率、低频率短期能量以及低频率长期能量,来将麦克风信号的每个输入帧分类为如下四个可能状态中的一个:冲击无语音;冲击语音;无冲击无语音;以及无冲击语音。图1描绘了用于本专利技术的实施例的示例操作环境100。在图1中示出的操作环境100包括无线通信设备102,所述无线通信设备102可由车辆104的乘客客厢或客舱的占据者使用。无线通信设备102提供包括话音通信的双向无线通信,其由与无线通信设备102兼容的无线网络108促进。在车辆104中,免提音频系统105包括麦克风112或多个麦克风(仅一个被示出)以及扬声器114或多个扬声器(一个被示出)。麦克风112转换或“拾取”来自车辆104的乘客客厢或内部103内的音频信号,并且经由用于免提音频系统105的控制器130将表示那些音频信号的电信号提供到无线通信设备102。麦克风112因此拾取正在附近被驾驶的车辆引起的道路噪声、风噪声和引擎噪声以及从客舱103中的扬声器114输出的音频信号,所述音频信号包括从电信路径的远端返回的音频信号,其被称作“回声”。免提系统105的扬声器114部分经由用于免提音频系统105的控制器130从无线通信设备102接收音频范围中的电信号。扬声器114将那些电信号转换成可以遍及车辆104的乘客客厢103听到的声波或音频信号113。由麦克风112拾取的音频信号113被转换成表示音频信号的电信号。电信号被提供到无线通信设备102。无线通信设备102将包含从麦克风获得的电信号的射频信号传输到无线通信网络108,其中将所述射频信号从网络108路由到常规的电话交换系统120。电话交换系统或网络120将从车辆104获得的音频信号113交换或路由到诸如移动电话或常规的电话听筒122之类的通信设备,所述通信设备位于远的位置124处,即以距离D远离车辆104远程定位的位置。在车辆104中的人与在远的/远程的位置124处的人之间发生的话音频率通信113因此经由在图1中由参考数字“116”标识的通信链路或信道发生。图2描绘了根据本专利技术的实施例的风冲击噪声和语音存在分类器200的框图,所述风冲击噪声和语音存在分类器200可以是图1的免提音频系统105的部分。在各种实施例中,风冲击噪声和语音存在分类器200包括存储在非瞬时存储器中并且由微控制器或微处理器执行的一个或多个计算机程序(计算机程序指令和数据或参数)。当程序指令被执行时,它们使得处理器关于表示由麦克风112检测的音频信号的数字数据212执行对风冲击噪声存在或缺乏条件以及语音存在或缺乏条件的分类,所述音频信号的至少某些可以由扬声器114提供到麦克风112。分类器200被配置成在各种语音存在或缺乏以及风冲击噪声存在或缺乏条件之间进行区分。分类器200接受作为输入的来自麦克风112或多个麦克风的输入帧202。针对麦克风112,音频硬件接口包括常规的模数(A/D)转换器。A/D转换器接收模拟电压并且输出表示模拟电压的二进制数。FFT模块204对输入帧202执行常规的快速傅立叶变换并且将输入帧的频域表示输出到语音存在的概率模块206和低频率短/长期能量模块20本文档来自技高网...

【技术保护点】
一种设备,包括:快速傅立叶变换模块,其被配置成计算数字化的语音数据的快速傅里叶变换;语音存在的概率估计器,其被配置成基于数字化的语音数据的快速傅立叶变换来计算在较低频带中的语音存在的平均概率估计和在较高频带中的语音存在的概率估计;低频率短和长期能量计算器,其被配置成基于数字化的语音数据的快速傅里叶变换和低于风冲击截止频率的能量的短期平均值来计算长期能量地板;状态分类器,其被配置成:以无冲击无语音状态开始;响应于确定针对数字化的语音数据的在较低频带中的语音存在的平均概率估计与在较高频带中的语音存在的概率估计之间的概率差异超过第一阈值,转变到冲击无语音状态;响应于确定概率差异不再超过第一阈值,从冲击无语音状态转变到选自以下的状态:冲击语音、无冲击语音和无冲击无语音;以及其中从冲击无语音状态转变到的状态至少部分地取决于在数字化的语音数据的计算的短期低频率能量与长期能量地板之间的差异。

【技术特征摘要】
2015.03.27 US 14/6708871.一种设备,包括:快速傅立叶变换模块,其被配置成计算数字化的语音数据的快速傅里叶变换;语音存在的概率估计器,其被配置成基于数字化的语音数据的快速傅立叶变换来计算在较低频带中的语音存在的平均概率估计和在较高频带中的语音存在的概率估计;低频率短和长期能量计算器,其被配置成基于数字化的语音数据的快速傅里叶变换和低于风冲击截止频率的能量的短期平均值来计算长期能量地板;状态分类器,其被配置成:以无冲击无语音状态开始;响应于确定针对数字化的语音数据的在较低频带中的语音存在的平均概率估计与在较高频带中的语音存在的概率估计之间的概率差异超过第一阈值,转变到冲击无语音状态;响应于确定概率差异不再超过第一阈值,从冲击无语音状态转变到选自以下的状态:冲击语音、无冲击语音和无冲击无语音;以及其中从冲击无语音状态转变到的状态至少部分地取决于在数字化的语音数据的计算的短期低频率能量与长期能量地板之间的差异。2. 根据权利要求1所述的设备,其中较低频带从约0 Hz到语音截止频率,并且较高频带从约语音截止频率到数字化的语音数据的采样频率的一半。3. 根据权利要求2所述的设备,其中语音截止频率是约600 Hz。4. 根据权利要求1所述的设备,其中风冲击截止频率是约300 Hz。5.根据权利要求1所述的设备,其中状态分类器被进一步配置成当在冲击无语音状态或冲击语音状态中时并且一旦概率差异不再超过第一阈值,如果短期能量大于长期能量地板,则转变到冲击语音状态。6.根据权利要求1所述的设备,其中状态分类器被进一步配置成当在冲击无语音状态或冲击语音状态中时并且一旦概率差异不再超过第一阈值,如果短期能量小于能量地板,则基于在高频率范围中的语音存在的概率小于第二阈值而转变到无冲击无语音状态。7.根据权利要求1所述的设备,其中状态分类器被进一步配置成当在冲击无语音状态或冲击语音状态中时并且一旦概率差异不再超过第一阈值,如果短期能量小于能量地板,则基于在高频率范围中的语音存在的概率大于第二阈值而转变到无冲击语音状态。8.一种方法,包括:以无冲击无语音状态开始,并且当在无冲击无语音状态中时,基于数字化的语音数据的长期低频率能量来计算能量地板;响应于确定针对数字化的语音数据的在较低的频带中的语音存在的平均概率估计与在较高的频带中的语音存在的概率估计之间的概率差异超过第一阈值,转变到冲击无语音状态;计算低于风冲击截止频率的能量的短期平均值;响应于确定概率差异不再超过第一阈值,从冲击无语音状态转变到选自以下的状态:冲击语音、无冲击语音和无冲击无语音;以及其中从冲击无语音状态转变到的状态至少部分地取决于在数字化的语音数据的计算的短期低频率能量与能量地板之间的差异。9. 根据权利要求8所述的方法,其中较低...

【专利技术属性】
技术研发人员:MR基尔施
申请(专利权)人:大陆汽车系统公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1