本发明专利技术提供针对地区语言使用偏好的语音识别优化系统,包括所述词汇表创建归类模块、语法模型初始化模块、词汇数据库、语法权重计算与语法模型生成模块、词汇使用记录模块、电话语音识别系统,词汇表创建归类模块、语法模型初始化模块、词汇数据库、语法权重计算与语法模型生成模块、词汇使用记录模块设置在计算机内;词汇表创建归类模块、语法模型初始化模块、电话语音识别系统、词汇使用记录模块、词汇数据库、语法权重计算与语法模型生成模块依次连接,且电话语音识别系统通过PSTN或者Internet与语音输入输出设备连接。本发明专利技术能够有效地突破算法优化的瓶颈,更加适应于行业应用的需要。
【技术实现步骤摘要】
本专利技术电话语音识别技术,具体是指一种针对地区语言使用偏好的语音识 别优化系统及其方法。
技术介绍
近年来,语音识别技术已经取得了巨大的进展。目前世界上最先进的电话语音识别系统一一Nuance8. 5在针对中小词汇量的孤立词(Isolate Words)的 识别率已经达到95%左右。95%的识别率在满足用户使用这一层面上来说也仅仅 只是合格的标准,从产品的用户体验和服务质量的角度出发,可能会要求语音 识别系统有更加精准识别效果。这样,语音识别系统的优化,有效地提高语音 识别系统的识别率,也成为了许多科研工作者和语音识别引擎开发厂商的一个 主攻的课题。行业内对于语音识别的优化,往往着眼点都只在于识别算法的改进,然而 这种识别优化的方法仍然有一定的局限性,例如,实际的识别率提升的空间比 较有限,容易出现瓶颈;涉及到复杂的算法的话,CPU的占用率高、运算时间长, 对于硬件设备的依赖太大。鉴于此,算法改进的语音识别优化方案在实际的行 业应用中,成本较高、效益较低。
技术实现思路
本专利技术的目的就是为了解决和克服现有技术存在的问题和缺陷,提供针对 地区语言使用偏好的语音识别优化系统,其经一定时间的运营后,通过统计所 积累的词汇使用记录数据,按照不同地区用户对词汇选项使用偏好设置语法权 重后,系统对小词汇量的孤立词的识别率能够提升至98%,能够有效地突破算法 优化的瓶颈,而且更加适应于行业应用的需要。本专利技术的另一 目的是提供上述系统的针对地区语言使用偏好的语音识别优 化方法。本专利技术的目的通过下述技术方案实现本针对地区语言使用偏好的语音识 别优化系统,包括所述词汇表创建归类模块、语法模型初始化模块、词汇数据库、语法权重计算与语法模型生成模块、词汇使用记录模块、电话语音识别系 统,所述词汇表创建归类模块、语法模型初始化模块、词汇数据库、语法权重计算与语法模型生成模块、词汇使用记录模块设置在计算机内;所述词汇表创 建归类模块、语法模型初始化模块、电话语音识别系统、词汇使用记录模块、 词汇数据库、语法权重计算与语法模型生成模块依次连接,且所述电话语音识 别系统通过PSTN(Public Switched Tel印hone Network,公共交换电话网络) 或者Internet (采用VoIP: Voice over Internet Protocol,互联网协议语音 技术)与语音输入输出设备连接。为更好地实现本专利技术,电话语音识别系统包括依次连接的IVR应用模块、 自动语音识别(ASR)模块、语法包模块,自动语音识别模块与所述词汇使用 记录模块连接,语法包模块与所述语法模型初始化模块连接,IVR应用模块通 过PSTN或者Internet (采用VoIP)与语音输入输出设备连接。 所述语音输入输出设备包括固定电话、移动电话、IP电话。 采用上述针对地区语言使用偏好的语音识别优化系统的语音识别优化方 法,其包括以下步骤(1)词汇表创建模块根据语音识别的归类条件,将词汇选项归入各个词汇 分类中,建立词汇表数据库;(2 )语法模型初始化模块根据所述词汇表数据库中的词汇分类及词汇选项 的相应数据,为每个省区的每一个词汇分类相应生成一个电话语音识别系统的 语法包,所述语法包里包含着归属于此词汇分类的所有词汇选项;(3) 当用户使用电话语音识别系统时,电话语音识别系统的IVR应用模块 可以根据用户呼入电话的号码判断出该号码所属的省区的信息,并连同用户所 应答的语音信息、当前IVR节点所属的词汇分类信息一起推送到电话语音识别 系统的自动语音识别模块,自动语音识别模块将根据省区的信息和词汇分类的 信息调用相对应语法包,对电话的语音信息进行自动识别;(4) 当语法包中的某一词汇选项被成功识别后,自动语音识别模块将识别 成功的词汇的信息推送到词汇使用记录模块,通过词汇使用记录模块在词汇数 据库中增加一条词汇使用的记录,同时把省区以及该词汇选项所属的分类的信 息写入该记录相应的字段中;(5) 语法权重计算与语法模型生成模块以省区为单位对词汇数据库的记录 进行统计,计算出每个分类中各词汇选项在各自所属的分类中使用频率百分比,根据这个百分比来计算出词汇选项的权重系数,并最终将带权重系数的词汇选项更新到各自的语法包中;(6)当用户再次使用该电话语音识别系统时,自动语音识别模块将根据省 区的信息和词汇分类的信息调取调整了权重参数的语法包,用户将可获得准确 率更高的语音识别的效果,从而实现针对地区语言使用偏好的语音识别优化过 程。为更好地实现本专利技术,上述步骤(1)中,所述归类条件是指根据系统的 实际应用,人为地设定词汇的分类,然后再加入省区分类,以此作为语音识别 词汇表的两个归类条件。上述步骤(1)中,所述词汇分类可根据系统使用者所提供的服务内容以及 服务应用的领域来具体进行设定。例如,提供体育资讯相关的服务可能有球 类、田径、体操、武术等等。词汇分类可以根据实际的需要进行增加、 删除或者合并。上述步骤(1)、 (2)所述词汇表数据库与步骤(4)、 (5)所述词汇数据库 可以采用大型数据库平台实现,包括SQL Server、 Oracle、 Sybase等。 上述步骤(2)中,所述语法包的层次结构可以表示为 省区i(词汇分类j[ 词汇选项1 词汇选项2词汇选项k其中,i为省区的序号,j为每个省区词汇分类的序号,k为每个词汇分类 中词汇选项的序号。上述步骤(5)中,所述语法包的层次结构可以表示为省区i( 词汇分类j [词汇选项2 (权重系数2)词汇选项k (权重系数k)其中,i为省区的序号,j为每个省区词汇分类的序号,k为每个词汇分类 中词汇选项的序号及相应的权重系数的序号。步骤(5)所述权重系数通过以下步骤得到统计出某一词汇分类在某一省区范围内词汇选项的使用频率,计算出各词 汇选项使用频率的在分类中所占的比重;对使用频率与使用频率的百分比这一 组线性数据进行加权平均数以及幂函数的运算,得到权重系数权重系数少=^。 (a) 公式(a)中x为各个词汇选项使用频率百分比;y为计算所得的权重系 数;Pa为加权平均数;其中加权平均数Pa: Z(v'xx')》' (b) 公式(b)中Pa为加权平均数;X为选项使用频率百分比;V为选项使用 频率。上述权重系数计算的方法,应用了加权平均数以及幂函数的运算,目的是 为了对数据进行缓冲处理,使计算得出的权重分布曲线显得更加平缓。本专利技术的工作原理自动语音识别(ASR)引擎在识别语法限定的范围内, 通过计算比对输入的发音信息与语音库的发音数据,优选出相似度分值最高的 词汇结果作为识别的结果。在识别语法的权重系数,可以对相似度的分值进行 调节,从而对识别结果进行优化。利用自动语音识别引擎语法权重系数调节的 原理,收集电话用户在语音识别系统所使用的词汇,建立词汇使用记录的数据 库,创建一套针对不同地区的词汇语言使用偏好自动生成识别语法权重系数的 方法,对语音识别系统的识别率进行优化。根据用户使用的数据记录进行分析, 并统计出语法中各选项的使用比率,根据使用比率来升高或者降低选项的权重系数,有助于提高自动语音识别系统的整体识别率。 相对现有技术,本专利技术具有如下优点与效果(1) 通过对用户词汇使用偏好,采用数据统计的方法,对识别本文档来自技高网...
【技术保护点】
针对地区语言使用偏好的语音识别优化系统,其特征在于:包括所述词汇表创建归类模块、语法模型初始化模块、词汇数据库、语法权重计算与语法模型生成模块、词汇使用记录模块、电话语音识别系统,所述词汇表创建归类模块、语法模型初始化模块、词汇数据库、语法权重计算与语法模型生成模块、词汇使用记录模块设置在计算机内;所述词汇表创建归类模块、语法模型初始化模块、电话语音识别系统、词汇使用记录模块、词汇数据库、语法权重计算与语法模型生成模块依次连接,且所述电话语音识别系统通过PSTN或者Internet与语音输入输出设备连接。
【技术特征摘要】
1、针对地区语言使用偏好的语音识别优化系统,其特征在于包括所述词汇表创建归类模块、语法模型初始化模块、词汇数据库、语法权重计算与语法模型生成模块、词汇使用记录模块、电话语音识别系统,所述词汇表创建归类模块、语法模型初始化模块、词汇数据库、语法权重计算与语法模型生成模块、词汇使用记录模块设置在计算机内;所述词汇表创建归类模块、语法模型初始化模块、电话语音识别系统、词汇使用记录模块、词汇数据库、语法权重计算与语法模型生成模块依次连接,且所述电话语音识别系统通过PSTN或者Internet与语音输入输出设备连接。2、 根据权利要求l所述针对地区语言使用偏好的语音识别优化系统,其特 征在于电话语音识别系统包括依次连接的IVR应用模块、自动语音识别模块、 语法包模块,自动语音识别模块与所述词汇使用记录模块连接,语法包模块与 所述语法模型初始化模块连接,IVR应用模块通过PSTN或者Internet与语音 输入输出设备连接。3、 根据权利要求2所述针对地区语言使用偏好的语音识别优化系统,其特 征在于所述语音输入输出设备包括固定电话、移动电话、IP电话。4、 采用权利要求1一3任一项所述针对地区语言使用偏好的语音识别优化 系统的语音识别优化方法,其特征在于包括以下步骤(1)词汇表创建模块根据语音识别的归类条件,将词汇选项归入各个词汇 分类中,建立词汇表数据库;(2 )语法模型初始化模块根据所述词汇表数据库中的词汇分类及词汇选项 的相应数据,为每个省区的每一个词汇分类相应生成一个电话语音识别系统的 语法包,所述语法包里包含着归属于此词汇分类的所有词汇选项;(3) 当用户使用电话语音识别系统时,电话语音识别系统的IVR应用模块 可以根据用户呼入电话的号码判断出该号码所属的省区的信息,并连同用户所 应答的语音信息、当前IVR节点所属的词汇分类信息一起推送到电话语音识别 系统的自动语音识别模块,自动语音识别模块将根据省区的信息和词汇分类的 信息调用相对应语法包,对电话的语音信息进行自动识别;(4) 当语法包中的某一词汇选项被成功识别后,自动语音识别模块将识别 成功的词汇的信息推送到词汇使用记录模块,通过词汇使用记录模块在词汇数据库中增加一条词汇使用的记录,同时把省区以及该词汇选项所属的分类的信 息写入该记录相应的字段中;(5 )语法权重计算与语法模型生成模块以省区为单位对词汇数据库的记录 进行统计,计算出每个分类中各词汇选项在各自所属的分类中使用频率百分比,...
【专利技术属性】
技术研发人员:陈铮陶,林超,
申请(专利权)人:林超,
类型:发明
国别省市:81[中国|广州]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。