一种噪声功率谱估计与语音活动性检测方法技术

技术编号：8023125 阅读：283 留言：1更新日期：2012-11-29 05:14

本发明专利技术涉及一种噪声功率谱估计与语音活动性检测方法，该方法基于一阶回归的序贯隐马尔可夫模型SHMM描述语音在每一频率分量上的时序相关性，最终推演出语音的在这个频率子带上的出现概率和噪声的功率谱信息，1)对于语音信号在每一个频率分量上提取对数幅度谱包络，并建立一个对应的二元隐马尔可夫模型，每一个状态均由高斯分布表示；2)对于一段语音数据，设定M帧缓存，把前M帧输入信号存入缓存中，提取缓存中M帧的对数幅度谱，采用极大似然估计算法建立一个初始化的模型；3)在得到初始化的模型λM之后，从第M+1帧开始，采用增量学习的方法，逐帧更新每一频带的HMM模型，依次递推得到噪声值和语音信号的出现概率。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及语音信号处理的
，具体的说，本专利技术涉及一种基于序贯隐马尔可夫模型的噪声谱估计与语音活动性检测方法。其中，语音活动性检测是在时间维度上判断语音出现与否的算法，它既能以“是”或“否”的形式回答存在性，也可以用语音出现概率来描述语音的存在性。
技术介绍
语音活动性检测和噪声功率谱估计是降噪算法必不可少的组成部分，它们的性能直接影响降噪算法的性能，特别是在恶劣的噪声环境下，它们间接影响了语音处理系统(如语音识别、话者识别以及语言识别器)的性能。大多数的语音应用系统不得不面对环境噪声干扰。前人提出了很多方法去除噪声对语音系统的干扰，几乎所有的方法都依赖于语音活动性检测和噪声功率谱估计。这两个模块存在着紧密的联系，它们的准确性直接影响系统的整体抗噪性能。传统的估计方法尽管性能良好，但仍然有两个地方值得提高I、充分利用连续语音/非语音信号在某一频率分量上的时序相关性，现有的算法对于时间相关性的利用不够充分，它们往往采用比较简单的一阶回归平滑器对幅度谱包络进行平滑，而且平滑器的平滑因子是固定的。而语音信号本身就是一个分段平稳的信号，它的统计特征包括时序相关性，都是随着时间在不断变化的，一个固定的模型无法反映这种时变特性。如果我们能够采用自适应的模型对时序相关性进行建模，那么算法的性能无疑将会得到提升。这一方法在以往的文献资料中没有提及。2、传统的序贯HMM的参数自适应采用高阶的回归平均方式，当前的HMM参数集依赖于上一时刻的模型、当前的观察值以及过去多个时刻的观察值，这种参数回归的方式计算量巨大。如果能够在精度损失不大的情况下把这种高阶回归简...

【技术保护点】
一种噪声功率谱估计与语音活动性检测方法，该方法基于一阶回归的序贯隐马尔可夫模型SHMM描述语音在每一频率分量上的时序相关性，并采用增量学习的方式来逐步更新SHMM，最终，推演出语音的在这个频率子带上的出现概率和噪声的功率谱信息，以准确反映语音的时序统计特征，该方法包括下列步骤：1)对于语音信号在每一个频率分量上提取对数幅度谱包络，并建立一个对应的二元隐马尔可夫模型，其中，一个分量表示语音能量的分布，另一个分量是噪声能量的分布，每一个状态均由高斯分布表示；2)对于一段语音数据，设定M帧缓存，把前M帧输入信号存入缓存中，提取缓存中M帧的对数幅度谱，采用极大似然估计算法建立一个初始化的模型；3)在得到初始化的模型λM之后，从第M+1帧开始，采用增量学习的方法，逐帧更新每一频带的HMM模型，依次递推得到噪声值和语音信号的出现概率。

【技术特征摘要】

【专利技术属性】
技术研发人员：应冬文，颜永红，付强，潘接林，李军锋，
申请(专利权)人：中国科学院声学研究所，北京中科信利技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人