语音检测方法及其设备技术

技术编号:3822578 阅读:227 留言:0更新日期:2012-04-11 18:40
本发明专利技术涉及语音技术,公开了一种语音检测方法及其设备。本发明专利技术中,将输入帧内的输入信号变换为二进制序列,根据二进制序列计算当前输入帧的描述二进制组合的出现种类的复杂性特征值,从而检测出当前输入帧内的语音信号。由于语音信号不同于噪声信号,包含了声源的特征(具有确定的基音频率)和声道的特征(具有更大的谐波性),因此语音信号的组合种类将是非常之少的。所以,通过计算描述二进制组合的出现种类的复杂性特征值,来检测语音信号,实现了根据语音/噪声产生的模型差异,检测出语音信号,使得语音信号能较为准确地被检测出来。

【技术实现步骤摘要】

本专利技术涉及语音技术,特别涉及语音中的分析检测技术。
技术介绍
语音检测技术是指在一段语音和噪声混合的时间序列里将语音和噪声分辨出来。 即语音检测的目的是在语音和噪声的混合序列中将语音和噪声区分出来。在语音通话的时 候,由于说话者不可能一直都在说话,通过麦克风所录到的时间序列必然会有相当长一段 时间是没有语音的,即应该被认为是噪声。如果对所有的时间序列都用语音压缩方法进行 压缩,则会造成两个方面的浪费。具体地说,对噪声用语音压缩方法压缩,首先它会造成压 缩比特数的浪费,对噪声的压缩并不需要像对语音压缩那么多比特,传输噪声的能量以及 频谱形状即可在解码端较好的恢复。其次它会造成运算开销的浪费,语音编码解码算法比 噪声编码解码算法所需要消耗的开销大得多。因此,如果能准确的检测出输入时间序列是 语音还是噪声,能同时减少不必要的比特消耗和运算开销消耗。由于噪声是一直存在于语音中,并且和语音信号在某一些结构上有相似性,所以 需要设计一些算法对语音和噪声进行分辨。目前,通用的语音检测方法如图1所示。语音检测系统一般包含两个主要模块, 一是特征提取模块,它的主要功用是从输入信号里计算出几个参数来表征语音信号和噪声 信号的区别;二是分类器决策模块,它的主要功用是根据提取的特征来完成是语音还是噪 声的决定。其中,特征提取模块的传统算法有窄带语音编码标准G. 729所附带的静音检测 算法中的四种特征提取算法过零率、能量、低频段能量比和线谱对距离参数。过零率是指 提取当前时域信号穿过0的次数,通常部分语音信号会有较小的过零率而噪声通常具有较 大过零率。能量特征则是直接计算当前帧的能量,主要考虑到实际环境下语音的能量通常 较大的因素。低频段能量比是考虑到某一部分语音信号是周期性的且频率较低,它们的低 频段能量占据着信号大部分的能量,而噪声通常是在每个频段有着均勻或者较均勻的分布 的。线谱对距离参数则是描述着语音信号的频谱包络特性,噪声中这一特征并不明显。近 年来有学者提出了基于高阶统计量的方法,它的理论基础则是高斯噪声信号的某些高阶 统计量通常为零但相应的语音的却不为零。关于现有的语音检测方法也可参见专利号为 “5450484”的美国专利。然而,本专利技术的专利技术人发现,由于语音是由人的肺部或者其他发声器官发出,通过 声道或者口鼻腔调制而产生的信号。而噪声则是有多种产生方式,但和语音产生方式都会 有截然的不同。但在目前的用于表征语音信号和噪声信号的特征提取方法中,并没有一种 通过描述语音/噪声产生模型差异的特征提取方法,来用于语音检测。
技术实现思路
本专利技术的目的在于提供一种语音检测方法及其设备,能根据语音/噪声产生的模 型差异,检测出语音信号。为解决上述技术问题,本专利技术的实施方式提供了一种语音检测方法,包含以下步 骤对输入信号进行分帧,得到每一个输入帧,每个输入帧包含预定数目的输入信 号;将当前输入帧内的输入信号变换为二进制序列;根据二进制序列计算当前输入帧的描述二进制组合的出现种类的复杂性特征值, 并根据计算出的复杂性特征值检测出当前输入帧内的输入信号是否为语音信号。本专利技术的实施方式还提供了一种语音检测设备,包含分帧模块,用于对输入信号进行分帧,得到每一个输入帧,每个输入帧包含预定数 目的输入信号;二进制变换模块,用于将当前输入帧内的输入信号变换为二进制序列;计算模块,用于根据二进制变换模块变换后的二进制序列,计算当前输入帧的描 述二进制组合的出现种类的复杂性特征值;检测模块,用于根据计算模块计算出的复杂性特征值,检测出当前输入帧内的输 入信号是否为语音信号。本专利技术实施方式与现有技术相比,主要区别及其效果在于将输入帧内的输入信号变换为二进制序列,根据二进制序列计算当前输入帧的能 描述二进制组合的出现种类的复杂性特征值,从而检测出当前输入帧内的输入信号是否为 语音信号。由于语音信号不同于噪声信号,包含了声源的特征(具有确定的基音频率)和 声道的特征(具有更大的谐波性),因此语音信号的组合种类将是非常之少的。所以,通过 计算描述二进制组合的出现种类的复杂性特征值,来检测语音信号,实现了根据语音/噪 声产生的模型差异,检测出语音信号,使得语音信号能较为准确地被检测出来。进一步地,可以在对输入帧内的输入信号先进行处理后,再进行二进制序列的变 换,使得本专利技术的语音检测可适用于各种需对采样信号进行处理的情况。进一步地,直接通过与门限值的比较,将输入帧内的各信号变换为二进制序列,操 作简单,方便实现。附图说明图1是根据现有技术中的语音检测方法流程图;图2是根据本专利技术第一实施方式的语音检测方法流程图;图3是根据本专利技术第三实施方式的语音检测设备结构示意图。具体实施例方式在以下的叙述中,为了使读者更好地理解本申请而提出了许多技术细节。但是,本 领域的普通技术人员可以理解,即使没有这些技术细节和基于以下各实施方式的种种变化 和修改,也可以实现本申请各权利要求所要求保护的技术方案。为使本专利技术的目的、技术方案和优点更加清楚,下面将结合附图对本专利技术的实施 方式作进一步地详细描述。本专利技术的第一实施方式涉及一种语音检测方法,具体流程如图2所示。4在步骤210中,对输入信号进行分帧,得到每一个输入帧,每个输入帧包含预定数 目的输入信号,即将输入信号每数个采样点分成一帧,输入帧可以表示为x(l) = T{s(l)+n(l)},1 = 0,1,· · ·,L-I其中,s和η分别指输入语音信号和噪声信号,L为帧长度。比如说,以每10个输入信号分为一帧,则 L 为 10,s (0) +η (0)、s (1) +η (1)、s ⑵ +η (2).......s (9) +η (9),即为第1个、第2个......第10个采样点。符号T表示一种变换。在本实施方式中,将变换T定义为同等变换,即Τ{χ(1)} = χ(1),因此,也可以理解为在本实施方式中,无需对采样点进 行变换,直接将采样点s(l)+η (1)作为χ(1)。接着,在步骤220中,将当前输入帧内的输入信号变换为二进制序列S' (1),即 s' (1)只在0和1之间取值。在本实施方式中,通过以下方式将当前输入帧内的各输入信 号变换为二进制序列将输入信号X(I)和一个门限值进行对比,如果大于门限值则取1,否则取0 , 「1, χ(1) > ηS'(I) = ^ w ‘其中,为方便计算门限值通常取0。但在实际应用中,门限值可以为任意数。需要 说明的是,也可以通过其他任意方法,将输入信号X(I)变换为二进制序列,如fl,成/)〉;^ 或者 Χ(/)<Τ/2 s (I)= <也就是说,在实际应用中,无论通过哪种方式对χ(1)进行变换,只需将X(I)变换 为二进制序列s' (1)即可。本实施方式中的变换为二进制序列只是一个具体的例子,直接 通过与门限值的比较,将输入帧内的各信号变换为二进制序列,操作简单,方便实现。接着,在步骤230中,根据得到的二进制序列s' (1),计算当前输入帧的描述二进 制组合的出现种类的复杂性特征值C。由于语音信号的声源特征,与噪声信号的不同之处在 于,某一些语音信号是通过声带的周期性震动产生的,这些语音信号具有着确定的基音频 率。并且,语音信号的声道特征,与噪声信本文档来自技高网
...

【技术保护点】
一种语音检测方法,其特征在于,包含以下步骤:对输入信号进行分帧,得到每一个输入帧,每个输入帧包含预定数目的输入信号;将当前所述输入帧内的输入信号变换为二进制序列;根据所述二进制序列计算当前输入帧的描述二进制组合的出现种类的复杂性特征值,并根据计算出的复杂性特征值检测当前所述输入帧内的输入信号是否为语音信号。

【技术特征摘要】

【专利技术属性】
技术研发人员:黄鹤云林福辉
申请(专利权)人:展讯通信上海有限公司
类型:发明
国别省市:31[中国|上海]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1