当前位置: 首页 > 专利查询>林超专利>正文

一种针对地区语言使用偏好的语音识别优化系统及其方法技术方案

技术编号：3044250 阅读：236 留言：0更新日期：2012-04-11 18:40

本发明专利技术提供针对地区语言使用偏好的语音识别优化系统，包括所述词汇表创建归类模块、语法模型初始化模块、词汇数据库、语法权重计算与语法模型生成模块、词汇使用记录模块、电话语音识别系统，词汇表创建归类模块、语法模型初始化模块、词汇数据库、语法权重计算与语法模型生成模块、词汇使用记录模块设置在计算机内；词汇表创建归类模块、语法模型初始化模块、电话语音识别系统、词汇使用记录模块、词汇数据库、语法权重计算与语法模型生成模块依次连接，且电话语音识别系统通过ＰＳＴＮ或者Ｉｎｔｅｒｎｅｔ与语音输入输出设备连接。本发明专利技术能够有效地突破算法优化的瓶颈，更加适应于行业应用的需要。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术电话语音识别技术，具体是指一种针对地区语言使用偏好的语音识别优化系统及其方法。
技术介绍
近年来，语音识别技术已经取得了巨大的进展。目前世界上最先进的电话语音识别系统一一Nuance8. 5在针对中小词汇量的孤立词(Isolate Words)的识别率已经达到95%左右。95%的识别率在满足用户使用这一层面上来说也仅仅只是合格的标准，从产品的用户体验和服务质量的角度出发，可能会要求语音识别系统有更加精准识别效果。这样，语音识别系统的优化，有效地提高语音识别系统的识别率，也成为了许多科研工作者和语音识别引擎开发厂商的一个主攻的课题。行业内对于语音识别的优化，往往着眼点都只在于识别算法的改进，然而这种识别优化的方法仍然有一定的局限性，例如，实际的识别率提升的空间比较有限，容易出现瓶颈；涉及到复杂的算法的话，CPU的占用率高、运算时间长，对于硬件设备的依赖太大。鉴于此，算法改进的语音识别优化方案在实际的行业应用中，成本较高、效益较低。
技术实现思路
本专利技术的目的就是为了解决和克服现有技术存在的问题和缺陷，提供针对地区语言使用偏好的语音识别优化系统，其经一定时间的运营后，通过统计所积累的词汇使用记录数据，按照不同地区用户对词汇选项使用偏好设置语法权重后，系统对小词汇量的孤立词的识别率能够提升至98%，能够有效地突破算法优化的瓶颈，而且更加适应于行业应用的需要。本专利技术的另一目的是提供上述系统的针对地区语言使用偏好的语音识别优化方法。本专利技术的目的通过下述技术方案实现本针对地区语言使用偏好的语音识别优化系统，包括所述...

【技术保护点】
针对地区语言使用偏好的语音识别优化系统，其特征在于：包括所述词汇表创建归类模块、语法模型初始化模块、词汇数据库、语法权重计算与语法模型生成模块、词汇使用记录模块、电话语音识别系统，所述词汇表创建归类模块、语法模型初始化模块、词汇数据库、语法权重计算与语法模型生成模块、词汇使用记录模块设置在计算机内；所述词汇表创建归类模块、语法模型初始化模块、电话语音识别系统、词汇使用记录模块、词汇数据库、语法权重计算与语法模型生成模块依次连接，且所述电话语音识别系统通过ＰＳＴＮ或者Ｉｎｔｅｒｎｅｔ与语音输入输出设备连接。

【技术特征摘要】
1、针对地区语言使用偏好的语音识别优化系统，其特征在于包括所述词汇表创建归类模块、语法模型初始化模块、词汇数据库、语法权重计算与语法模型生成模块、词汇使用记录模块、电话语音识别系统，所述词汇表创建归类模块、语法模型初始化模块、词汇数据库、语法权重计算与语法模型生成模块、词汇使用记录模块设置在计算机内；所述词汇表创建归类模块、语法模型初始化模块、电话语音识别系统、词汇使用记录模块、词汇数据库、语法权重计算与语法模型生成模块依次连接，且所述电话语音识别系统通过PSTN或者Internet与语音输入输出设备连接。2、根据权利要求l所述针对地区语言使用偏好的语音识别优化系统，其特征在于电话语音识别系统包括依次连接的IVR应用模块、自动语音识别模块、语法包模块，自动语音识别模块与所述词汇使用记录模块连接，语法包模块与所述语法模型初始化模块连接，IVR应用模块通过PSTN或者Internet与语音输入输出设备连接。3、根据权利要求2所述针对地区语言使用偏好的语音识别优化系统，其特征在于所述语音输入输出设备包括固定电话、移动电话、IP电话。4、采用权利要求1一3任一项所述针对地区语言使用偏好的语音识别优化系统的语音识别优化方法，其特征在于包括以下步骤(1)词汇表创建模块根据语音识别的归类条件，将词汇选项归入各个词汇分类中，建立词汇表数据库；(2 )语法模型初始化模块根据所述词汇表数据库中的词汇分类及词汇选项的相应数据，为每个省区的每一个词汇分类相应生成一个电话语音识别系统的语法包，所述语法包里包含着归属于此词汇分类的所有词汇选项；(3) 当用户使用电话语音识别系统时，电话语音识别系统的IVR应用模块可以根据用户呼入电话的号码判断出该号码所属的省区的信息，并连同用户所应答的语音信息、当前IVR节点所属的词汇分类信息一起推送到电话语音识别系统的自动语音识别模块，自动语音识别模块将根据省区的信息和词汇分类的信息调用相对应语法包，对电话的语音信息进行自动识别；(4) 当语法包中的某一词汇选项被成功识别后，自动语音识别模块将识别成功的词汇的信息推送到词汇使用记录模块，通过词汇使用记录模块在词汇数据库中增加一条词汇使用的记录，同时把省区以及该词汇选项所属的分类的信息写入该记录相应的字段中；(5 )语法权重计算与语法模型生成模块以省区为单位对词汇数据库的记录进行统计，计算出每个分类中各词汇选项在各自所属的分类中使用频率百分比，...

【专利技术属性】
技术研发人员：陈铮陶，林超，
申请(专利权)人：林超，
类型：发明
国别省市：81[中国|广州]

全部详细技术资料下载我是这个专利的主人