一种减少文本无关说话人识别系统误识率的方法技术方案

技术编号：6826182 阅读：316 留言：0更新日期：2012-04-11 18:40

一种减少文本无关说话人识别系统误识率的方法，它涉及一种减少说话人识别系统误识率的方法。本发明专利技术解决了现有的文本无关说话人识别系统在开集测试中误识率增大的问题。本方法：利用基准说话人识别系统得到闭集中已知说话人的识别阈值，将闭集中说话人分成男女两组，再将每组用阈值分段的形式把男女两组都再分为多个小组，再找到每个小组的中心分布；在基准说话人识别系统的前端加入粗筛选模块，判定测试语音的性别之后，将待测语音与同性别的小组的中心分布比较，得到待测语音的概率阈值；再用该概率阈值的语音帧进行识别。本方法的识别正确率比原系统提高2％～3％，本方法可用于文本无关说话人识别系统。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及一种减少说话人识别系统误识率的方法。
技术介绍
说话人识别是利用包含在说话人语音波形中特有的个体信息来自动识别说话人身份的过程。说话人识别按照对说话内容的要求不同可以分为文本无关，文本有关和文本提示三种。文本无关是指用户在系统注册时不要求特定的语言和内容，而且验证和注册时也不需要相同内容的语音；文本相关则要求验证语料与注册时提供的语料内容相一致；文本提示中用户按照系统指定的内容进行。文本无关的说话人识别由于其安全性和灵活性更加受到人们的重视，应用也更为广泛。目前的文本无关说话人识别系统主要是利用说话人的训练语音训练得到一个描述其语音特征分布的混合高斯模型，用测试语音在各个说话人模型上的得分来判定说话人的身份。随着开集的识别中，集外用户规模的增大，误识率从原来的2. 9%也相继增大到5. 5%，而误识的多少严重影响说话人识别系统的实用性，因此需要研究减少说话人误识率的方法。
技术实现思路
本专利技术是要解决现有的文本无关说话人识别系统在开集测试中，随着集外用户增多，误识率增大的问题，而提供。本专利技术的按以下步骤进行步骤一、利用基准说话人识别系统闭集的训练数据得到每个已知的说话人的特征矢量的高斯混合模型及其正确识别时的阈值；步骤二、将闭集中的说话人按男性和女性分为两组，将每组的正确识别时的阈值按大小排列后，将阈值分段，每段做为一个小组；步骤三、将步骤二得到的每个小组中包含的说话人用一个符合高斯分布的模型来代替，得到男性组的每个小组的中心分布和女性组的每个小组的中心分布；步骤四、将步骤二得到的每个小组中每个说话人的正确识别时阈值的加权求和作为该小...

【技术保护点】
１．一种减少文本无关说话人识别系统误识率的方法，其特征在于减少文本无关说话人识别系统误识率的方法按以下步骤进行：步骤一、利用基准说话人识别系统闭集的训练数据得到每个已知的说话人的特征矢量的高斯混合模型及其正确识别时的阈值；步骤二、将闭集中的说话人按男性和女性分为两组，将每组的正确识别时的阈值按大小排列后，将阈值分段，每段做为一个小组；步骤三、将步骤二得到的每个小组中包含的说话人用一个符合高斯分布的模型来代替，得到男性组的每个小组的中心分布和女性组的每个小组的中心分布；步骤四、将步骤二得到的每个小组中每个说话人的正确识别时阈值的加权求和作为该小组的阈值；步骤五、在基准说话人识别系统的前端加入待测语音的特征矢量序列的辨识模块，判定出待测语音为男性或者女性声音后，将待测语音与同性别的小组的中心分布比较求出似然得分，再进行概率阈值的计算；步骤六、用步骤五得到的概率阈值更新待测语音的阈值，得到新的语音帧，进入识别系统进行识别。

【技术特征摘要】

【专利技术属性】
技术研发人员：韩纪庆，王秋雯，
申请(专利权)人：哈尔滨工业大学，
类型：发明
国别省市：93

全部详细技术资料下载我是这个专利的主人