语音检测方法及其设备技术

技术编号：3822578 阅读：236 留言：0更新日期：2012-04-11 18:40

本发明专利技术涉及语音技术，公开了一种语音检测方法及其设备。本发明专利技术中，将输入帧内的输入信号变换为二进制序列，根据二进制序列计算当前输入帧的描述二进制组合的出现种类的复杂性特征值，从而检测出当前输入帧内的语音信号。由于语音信号不同于噪声信号，包含了声源的特征（具有确定的基音频率）和声道的特征（具有更大的谐波性），因此语音信号的组合种类将是非常之少的。所以，通过计算描述二进制组合的出现种类的复杂性特征值，来检测语音信号，实现了根据语音／噪声产生的模型差异，检测出语音信号，使得语音信号能较为准确地被检测出来。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及语音技术，特别涉及语音中的分析检测技术。
技术介绍
语音检测技术是指在一段语音和噪声混合的时间序列里将语音和噪声分辨出来。即语音检测的目的是在语音和噪声的混合序列中将语音和噪声区分出来。在语音通话的时候，由于说话者不可能一直都在说话，通过麦克风所录到的时间序列必然会有相当长一段时间是没有语音的，即应该被认为是噪声。如果对所有的时间序列都用语音压缩方法进行压缩，则会造成两个方面的浪费。具体地说，对噪声用语音压缩方法压缩，首先它会造成压缩比特数的浪费，对噪声的压缩并不需要像对语音压缩那么多比特，传输噪声的能量以及频谱形状即可在解码端较好的恢复。其次它会造成运算开销的浪费，语音编码解码算法比噪声编码解码算法所需要消耗的开销大得多。因此，如果能准确的检测出输入时间序列是语音还是噪声，能同时减少不必要的比特消耗和运算开销消耗。由于噪声是一直存在于语音中，并且和语音信号在某一些结构上有相似性，所以需要设计一些算法对语音和噪声进行分辨。目前，通用的语音检测方法如图1所示。语音检测系统一般包含两个主要模块，一是特征提取模块，它的主要功用是从输入信号里计算出几个参数来表征语音信号和噪声信号的区别；二是分类器决策模块，它的主要功用是根据提取的特征来完成是语音还是噪声的决定。其中，特征提取模块的传统算法有窄带语音编码标准G. 729所附带的静音检测算法中的四种特征提取算法过零率、能量、低频段能量比和线谱对距离参数。过零率是指提取当前时域信号穿过0的次数，通常部分语音信号会有较小的过零率而噪声通常具有较大过零率。能量特征则是直接计算...

【技术保护点】
一种语音检测方法，其特征在于，包含以下步骤：对输入信号进行分帧，得到每一个输入帧，每个输入帧包含预定数目的输入信号；将当前所述输入帧内的输入信号变换为二进制序列；根据所述二进制序列计算当前输入帧的描述二进制组合的出现种类的复杂性特征值，并根据计算出的复杂性特征值检测当前所述输入帧内的输入信号是否为语音信号。

【技术特征摘要】

【专利技术属性】
技术研发人员：黄鹤云，林福辉，
申请(专利权)人：展讯通信上海有限公司，
类型：发明
国别省市：31[中国|上海]

全部详细技术资料下载我是这个专利的主人