有效的用来检测固定功率信号的语音活动检测器制造技术

技术编号：3550954 阅读：213 留言：0更新日期：2012-04-11 18:40

本发明专利技术涉及一种语音活动检测器，该语音活动检测器使用幅度峰值和谷底的周期来识别实质上固定的功率或具有周期的信号。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术大体涉及信号处理，尤其涉及区别话音信号和非话音信号。
技术介绍
通过将模拟信号转换成数字信号，语音被承载在数字电话网络上，无论是电路交换还是分组交换的数字电话网络。在分组交换的网络的情形下，代表数字信号的音频采样被组包，并且组包的采样通过网络被电子发送。组包的采样在目的地节点被接收，该采样被拆包，模拟信号被重建并提供给另一方。在与其他方通话时，存在双方都不说话的时间段。在这种时间段中，背景噪声(可包括背景语音)可由该电话的传声器(microphone)接收到。当呼叫的任何一方都不在讲话和没有可听见的呼叫信令传送(signaling)时所接收到的比如背景噪声的音频信息，比如音(tone)，在此被称作“静音(silence)”。静音抑制是在参与电话呼叫的一方没有讲话时在网络上不传输音频信息，以此显著减少带宽使用率并协助对抖动缓冲器调整点的识别的过程。在因特网上语音协议(“VoIP”)系统中，语音活动检测(“VAD”)或话音活动检测(“SAD”)被用来动态监视背景噪声、设定合适的话音检测阈值以及识别抖动缓冲器调整点。VAD检测音频信号或其采样中人的话音的存在与否，并使用该信息识别静音期。当静音抑制生效时，在这种静音期接收到的音频信息不在网络上传输给其它(目的地)端点。在给定了在任何一个时间通常是通话中的一方在讲话的条件下，静音抑制可以在典型电话呼叫的持续过程中实现整体带宽50％的节省。-->在语声的话音和背景噪声之间进行区别是困难的。而且，VAD或SAD必须很快进行以避免削波(clip)。为了解决这些问题，已经使用了一些区别复杂度的算法。例子包括基于...

【技术保护点】
一种方法，包括：　　　　（ａ）接收多个音频采样，这些音频采样定义了采样的信号段；　　　　（ｂ）在由这些音频采样定义的信号幅度波形中识别转向点；　　　　（ｃ）确定所识别出的转向点是否代表实质上固定的功率级别的信号；以及　　　　（ｄ）当所识别出的转向点代表实质上固定的功率级别的信号时，认为所采样的信号段包括活动信号。

【技术特征摘要】
US 2006-9-19 11/523,9331.一种方法，包括：(a)接收多个音频采样，这些音频采样定义了采样的信号段；(b)在由这些音频采样定义的信号幅度波形中识别转向点；(c)确定所识别出的转向点是否代表实质上固定的功率级别的信号；以及(d)当所识别出的转向点代表实质上固定的功率级别的信号时，认为所采样的信号段包括活动信号。2.如权利要求1所述的方法，其中所采样的信号段被作为第一和第二方之间实况语音呼叫的一部分而接收，其中所述转向点对应于信号幅度波形中的峰值和谷底，其中，当所识别出的转向点代表实质上固定的功率级别的信号时，所采样的信号段被认为包括周期性的样式，其中静音抑制生效，其中，当所采样的信号段包括活动信号时，传输所述多个音频采样到目的地节点，并且其中当所采样的信号段不包括活动信号和当该段不包括第一和/或第二方的语音能量时，不将所述多个音频采样传输到目的地节点。3.如权利要求1所述的方法，其中该方法被用于确定抖动缓冲器调整点，并进一步包括：(e)识别在信号幅度波形中相邻的、所识别出的转向点之间的时间距离；(f)确定所述相邻的、所识别出的转向点之间的时间距离是否代表实质上固定的功率级别的信号；以及(g)当所述时间距离代表实质上固定的功率级别的信号和当所识别出的转向点代表实质上固定的功率级别的信号时，认为所采样的信号段包括活动信号，其中，在确定所采样的信号段是否包括活动信号时，步骤(c)的结果比步骤(f)的结果更重地被加权。4.如权利要求1所述的方法，其中转向点不是零交叉，并且...

【专利技术属性】
技术研发人员：王明盛，卢克A塔克，
申请(专利权)人：阿瓦雅技术有限公司，
类型：发明
国别省市：US[美国]

全部详细技术资料下载我是这个专利的主人