一种连续语音识别结果评价的方法和装置制造方法及图纸

技术编号：3852349 阅读：248 留言：0更新日期：2012-04-11 18:40

本发明专利技术实施例公开了一种基于字词混合的连续语音识别结果评价方法，包括：根据输入的语音识别结果序列和参考序列，生成字词混合的Ｒ－Ｔ匹配平面；根据ＤＰ算法在Ｒ－Ｔ平面中进行匹配，局部匹配路径采用基于字词混合的多匹配路径，并采用多种路径得分函数；进行路径回溯，获取最佳匹配结果，统计语音识别性能相关信息。还公开了一种基于字词混合的连续语音识别结果评价装置，利用本发明专利技术实施例，能够有效降低识别结果评价中的虚假错误，有效提高基于词的连续语音识别结果评价精度。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及语音识别领域，特别是一种连续语音识别结果评价的方法和装置。
技术介绍
连续语音识别的结果评价，通常采用动态规划的方法得到最佳匹配结果，隐马尔可夫工具包(Hidden Markov ToolKit，HTK)中的HResults工具是完成这一任务的典型代表。在进行匹配时，匹配的单元可以是词，也可以是字、音素等，而且只能完成同一层次的匹配，即词词匹配或字字匹配等。在汉语连续语音识别中，通常采用字即音节作为匹配的基元，而基于音素的匹配通常是在只需要评价声学模型性能的时候使用。基于词的匹配由于会产生一些错误匹配，而很少使用。在基于词的结果匹配中，产生错误匹配的原因主要有两个，一个是分词的标准不统一，汉语与西文不同，词之间没有明显的分界，需要进行分词，但是因为汉语构词比较灵活，造成分词结果的不同，从而产生一些错误匹配。另外一个是语音识别系统的原因，语音识别输出得到的词经常和参考词不一致，即使采用了相同的分词方法(算法、参数、参考词典等等均相同)，比如，识别为，这些造成很多的虚假错误，使得识别结果的评价不可信。由于语音识别中通常采用基于词的语言模型，网络搜索也是分为词内和词间搜索进行的，因此很多时候，还是需要得到基于词的语音识别结果分析。如做语音识别的可信度研究时，相对于音节来说，词的可信度特征更容易获得，因此很多可信度研究都是在基于词来进行的，但是由于基于词的语音识别结果评价不够准确，严重影响了可信度评价的性能。专利技术人在实现本专利技术的过程中，发现现有技术中至少存在如下问题现有技术对基于词的连续语音识别结果评价不准确，产生很...

【技术保护点】
一种基于字词混合的连续语音识别结果评价方法，其特征在于，包括：　根据输入的语音识别结果序列和参考序列，生成字词混合的Ｒ－Ｔ匹配平面；　根据ＤＰ算法在Ｒ－Ｔ平面中进行匹配，局部匹配路径采用基于字词混合匹配的多匹配路径，并采用多种路径得分函数；　进行路径回溯，获取最佳匹配结果，统计语音识别性能相关信息；

【技术特征摘要】

【专利技术属性】
技术研发人员：刘刚，陈伟，郭军，国玉晶，
申请(专利权)人：北京邮电大学，
类型：发明
国别省市：11[中国|北京]

全部详细技术资料下载我是这个专利的主人