基于分类器融合的汉语方言自动辨识方法技术

技术编号：9490794 阅读：114 留言：0更新日期：2013-12-26 00:33

本发明专利技术公开一种基于分类器融合的汉语方言自动辨识方法，分为汉语方言语音特征提取、方言模型匹配打分，分类矢量提取及后端分类四个步骤。采用两级特征提取方式，将高斯混合模型（GMM）作为高级特征提取器加以使用。在计算的过程中将语音特征送入到含有方言语音先验知识的高斯混合模型中进行打分，并对所得打分进行归一化和差分计算，形成具有高类间差异度和类内聚合度的分类矢量。将其送入到后端支撑矢量机（SVM）分类器中进行分类。融合GMM在数据分布拟合，SVM在分类面建模时的技术优势，最终实现对汉语方言所属方言区种类的辨识。本发明专利技术能够稳定可靠的用于汉语电话方言语音等的辨识任务，准确率较高。

全部详细技术资料下载

【技术实现步骤摘要】
【专利摘要】本专利技术公开一种，分为汉语方言语音特征提取、方言模型匹配打分，分类矢量提取及后端分类四个步骤。采用两级特征提取方式，将高斯混合模型（GMM）作为高级特征提取器加以使用。在计算的过程中将语音特征送入到含有方言语音先验知识的高斯混合模型中进行打分，并对所得打分进行归一化和差分计算，形成具有高类间差异度和类内聚合度的分类矢量。将其送入到后端支撑矢量机（SVM）分类器中进行分类。融合GMM在数据分布拟合，SVM在分类面建模时的技术优势，最终实现对汉语方言所属方言区种类的辨识。本专利技术能够稳定可靠的用于汉语电话方言语音等的辨识任务，准确率较高。【专利说明】
本专利技术涉及多分类器融合技术的语音辨识方法，尤其涉及一种汉语方言辨识方法，属于语音信号处理领域。
技术介绍
汉语方言自动辨识是利用计算机分析一段输入的语音，判别说话人所属方言区域的语音处理技术。在我国这样一个多民族、多方言的国家，汉语方言自动辩识的研究为我国各民族间的无障碍沟通建立了基础，随着我国科学技术的快速发展，其中更是酝酿着巨大的应用价值和广阔的应用前景。作为语音识别研究的一个分支，在早期的研究中，汉语方言辨识系统往往采用单分类器单特征的设计策略，忽视了信息融合在系统设计中的应用，使得系统完全依赖于某一分类器和某一特征，制约了系统性能的提高。多信息融合是目前信息处理研究领域的热点，它不仅可以更加全面、详细地描述客观现象，还能实现深层信息的挖掘。在语音处理领域，信息融合方式主要采用两种方式:一、多特征融合；二、多分类器融合。前者采用多特征-单分类器的设计策略，通过不同特征得分的加权和...

【技术保护点】
一种基于分类器融合的汉语方言自动辨识方法，其特征在于：选用GMM和SVM为融合对象，输入汉语方言信号进行语音特征提取，在新分类特征的提取过程中，首先利用已知的训练样本集合训练方言的GMM；然后将语音数据输入到设计好的各种方言的GMM中，对语音基元进行似然打分，组成分数矢量[P(xi|μ1Σ1)P(xi|μ2Σ2)…P(xi|μNΣN)]，实现从原始语音特征空间到分数空间的映射；其次对该分数矢量进行归一化处理和差分运算；随后，基于训练分类矢量训练SVM分类器。

【技术特征摘要】

【专利技术属性】
技术研发人员：朱贺，高红民，王慧斌，
申请(专利权)人：河海大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人