当前位置: 首页 > 专利查询>苏州大学专利>正文

一种病理嗓音的识别方法技术

技术编号:10018575 阅读:254 留言:0更新日期:2014-05-08 17:16
本发明专利技术公开了一种病理嗓音的识别方法,包括特征参数输入模块、特征优化模块、病理嗓音识别模块、匹配判断模块和内容呈现模块,所述特征参数输入模块和特征优化模块对病理嗓音特征库进行采样和优化淘选,所述病理嗓音识别模块根据特征参数计算匹配度Match,所述匹配判断模块用以统计识别结果,所述内容呈现模块用以输出。本发明专利技术通过EM算法,消掉隐变量,通过特征优化组合参数,经过分类器,再运用基于期望值最大化的高斯混合模型(GMM-EM)对优化后的嗓音特征进行有效识别,明显提高正确识别率。

【技术实现步骤摘要】
【专利摘要】本专利技术公开了,包括特征参数输入模块、特征优化模块、病理嗓音识别模块、匹配判断模块和内容呈现模块,所述特征参数输入模块和特征优化模块对病理嗓音特征库进行采样和优化淘选,所述病理嗓音识别模块根据特征参数计算匹配度Match,所述匹配判断模块用以统计识别结果,所述内容呈现模块用以输出。本专利技术通过EM算法,消掉隐变量,通过特征优化组合参数,经过分类器,再运用基于期望值最大化的高斯混合模型(GMM-EM)对优化后的嗓音特征进行有效识别,明显提高正确识别率。【专利说明】
本专利技术属于声音识别领域,具体的涉及。
技术介绍
对嗓音状况的调查表明,目前我国至少有I亿人患有各种嗓音疾病,原因涉及到生理和工作环境等许多方面。如何保留和提高喉发音功能及其检测方法成为了众多信号处理及统计模式识别领域研究者共同关注的焦点。随着计算机技术及统计模式识别的迅猛发展,建立在模型统计基础上的病理嗓音自动检测也迅速成为了研究热点,经过几十年的发展,形成了众多的研究方法。在特征优化方面,本专利技术运用连接F属性的评估的属性选择的优化算法,再用两种分类器,对数据进行进一步优化分类,探讨各种病理嗓音的特征。接下来用基于期望值最大化的高斯混合模型,对优化后的嗓音特征进行有效识别。一般的利用传统的高斯混合模型识别的流程如图1所示,分为训练部分和识别部分。建模首先要提取嗓音信号的特征,特征提取之后特征优化,然后训练得到模型。识别部分首先进行特征提取,再进行特征优化,此时需要与训练好的模型进行匹配得到匹配得分,再和设定的阈值比较,最后得到判别结果。但是传统的基于极大似然估计的高斯混合模型必须要求数据处理中不含隐变量,而实际实验中嗓音特征无法避免的会存在隐变量,这就给基于极大似然估计的高斯混合模型识别语音带来了困难。
技术实现思路
本专利技术的目的是克服目前病理嗓音系统存在的上述缺点,通过EM算法,消掉隐变量,通过特征优化组合参数,经过分类器,再运用高斯混合模型,明显提高正确识别率。为实现上述技术目的,达到上述技术效果,本专利技术通过以下技术方案实现: ,包括特征参数输入模块、特征优化模块、病理嗓音识别模块、匹配判断模块和内容呈现模块,所述病理嗓音识别模块包括基于期望值最大化的高斯混合模型(GMM-EM)建立单元、模型训练单元和语音识别单元, 其中所述模型(GMM-EM)建立单元和模型训练单元包括以下步骤: 步骤2.1)确定高斯混合模型代表公式,如下:【权利要求】1.,包括特征参数输入模块、特征优化模块、病理嗓音识别模块、匹配判断模块和内容呈现模块,其特征在于,所述病理嗓音识别模块包括基于期望值最大化的高斯混合模型(GMM-EM)建立单元、模型训练单元和语音识别单元, 其中所述模型(GMM-EM)建立单元和模型训练单元包括以下步骤: 步骤2.1)确定高斯混合模型代表公式,如下: 2.根据权利要求1所述的病理嗓音的识别方法,其特征在于,所述特征参数输入模块包括数据库单元和选择单元,并且所述特征参数输入模块和特征优化模块包括以下步骤:步骤1.1)对病理嗓音特征库进行特征空间采样,生成特征子集; 步骤1.2)用连接F属性评估的属性选择算法评价特征子集,并得到其优劣程度的得分Match ; 步骤1.3)将特征子集优劣程度得分与连接F属性评估的属性选择算法中设定的阈值相比较,若Match大 于阈值则转入下一步,否则转入步骤1.1); 步骤1.4)验证特征选择的结果。【文档编号】G10L15/10GK103778913SQ201410027836【公开日】2014年5月7日 申请日期:2014年1月22日 优先权日:2014年1月22日 【专利技术者】张晓俊, 曹毅, 陶智, 黄程韦, 吴迪, 肖仲喆 申请人:苏州大学本文档来自技高网
...

【技术保护点】
一种病理嗓音的识别方法,包括特征参数输入模块、特征优化模块、病理嗓音识别模块、匹配判断模块和内容呈现模块,其特征在于,所述病理嗓音识别模块包括基于期望值最大化的高斯混合模型(GMM‑EM)建立单元、模型训练单元和语音识别单元,    其中所述模型(GMM‑EM)建立单元和模型训练单元包括以下步骤:    步骤2.1)确定高斯混合模型代表公式,如下:其中,,分别表示第i个高斯分量的权重、均值向量和方差矩阵,表示m维的特征向量,K是高斯模型的分量数目;    步骤2.2)E步计算得到初始化参数,计算公式如下:j=1,..,K, t=1,…,n;    步骤2.3)M步计算更新参数,计算公式如下:;    步骤2.4)针对各类病理嗓音种类,提取各种特征参数;步骤2.5)对每类嗓音每种特征参数进行GMM训练,得到训练的GMM矩阵;步骤2.6)运用连接F属性的评估的属性选择的算法对数据进行组合优化,提取出若干个参数;步骤2.7)运用两种分类器,对数据进行进一步特征优化;步骤2.8)将步骤2.7)中提取的特征参数输入训练好的GMM,求其似然度;步骤2.9)根据步骤2.8)算出的似然度,计算各类病理嗓音的匹配概率;步骤2.10)对步骤2.9)求出的各特征参数匹配概率加权求和得总匹配度Match;步骤2.11)将步骤2.9)求得的总匹配度Match和阈值进行比较,如果大于阈值,将进行各特征的贡献率计算,如果小于阈值,将进行计数及送入结束判断;步骤2.12)对步骤2.11)中的总匹配度Match小于阈值且不满足结束条件的嗓音信号送回进行新一轮的训练,如果满足结束条件,则训练结束;所述语音识别单元包括以下步骤:步骤2.13)输入识别嗓音信号进行特征提取;步骤2.14)运用连接F属性的评估的属性选择的算法对数据进行组合优化,提取出若干参数;步骤2.15)运用两种分类器,对数据进行进一步特征优化;步骤2.16)加载步骤2.12)中训练好的识别模型;步骤2.17)将步骤2.14)中提取的特征与加载好的识别模型进行匹配;步骤2.18)若匹配,则识别结束,若不匹配则载入下一个训练好的模型,并转入步骤2.13)。...

【技术特征摘要】

【专利技术属性】
技术研发人员:张晓俊曹毅陶智黄程韦吴迪肖仲喆
申请(专利权)人:苏州大学
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1