语音识别装置制造方法及图纸

技术编号:3048109 阅读:268 留言:0更新日期:2012-04-11 18:40
本实用新型专利技术公开了一种语音识别装置,包括:设置目标库,设置预设的目标库的各目标;语音接收单元,用于接收待识别的用户语音;识别处理单元,用于将所述用户语音与所述各目标格式文件进行比较识别出与所述用户语音对应的目标;输出单元,用于输出所述目标。采用本实用新型专利技术减轻了语音识别的运算负荷,提高了语音识别的成功率。(*该技术在2018年保护过期,可自由使用*)

【技术实现步骤摘要】

本技术涉及语音识领域,特别涉及一种语音识别装置
技术介绍
随着科学技术日新月异的发展与层出不穷的创新,越来越多的新型智能 化电子设备不断涌现于世。因其不仅能够实现轻松办公的目的,而且具有简 化工作流程,减轻工作负荷,提高工作效率,节省人力成本,操作简便快捷 等诸多优越性,因此这些新型智能化电子设备被广泛应用于各行各业,倍受 人们关注和青睐,而语音识别设备便是这些新型智能化电子设备之一典型代 表。目前,语音识别设备从声学上分析基于使用者所发出的声音而产生语音 输入信号,然后将该语音输入信号与先前准备好的词模型的多个候选者比较, 以计算相应的声学似然性(即相似性),确定具有最高声学似然性的候选者 (以下称为第一候选者)为识别结果。当第一候选者不具有足够高的识 别可靠性时,判断没有正确的识别结果存在,用请再说一次的语音消息 执行回话操作,提示用户再发声,进行再次的识别处理,但当使用者再次发 声时,仍利用与先前所使用的相同候选者进行再次的识别处理,因此,获得 与先前相同的识别结果,所以再发声的识别率不能^f皮显著提高。另外,由于上述语音识别设备在实际应用过程中需要预先存储大量的候 选词模型,而当候选词模型库大到一定程度时会导致语音识别设备挑选出很 多相似或相近的候选者,如此一来很容易造成由于候选者的多个相似而导致识别的最终结果出现很大误差,并且当候选词模型库足够大时整个程序的遍 历时间长度会显著增加,由此使得整个语音识别设备无法真正得到实际应用。
技术实现思路
本技术解决的技术问题是语音识别装置,以避免现有技术中识别率 低,整个程序的遍历时间长的缺陷,最重要的是根据不同的使用情况、环境, 设定了有限的目标库,使得语音识别的有的放矢性更强,识别运算减少,准 确性更高。为解决上述问题,本技术提供一种语音识别装置,该装置主要包括一种语音识别装置,包括设置目标库,目标库中设置有预设的各目标 语音;语音接收单元,用于接收待识别的用户语音;识别处理单元,用于将 所述用户语音与所述各目标格式文件进行比较识别出与所述用户语音对应的 目标;输出单元,用于输出所述识别结果。所述的目标库采用有限的词和/或短语;字、词的集合;字、词、短句的 集合。是针对特定的场合、特定的使用目的而设置的有限的集合。所述的识别处理单元具体包括第一语音识别单元,用于将用户语音的格式文件与预设各目标语音的格式文件进行相似性比较,获取与所述用户语音相似的目标语音的格式文件;第二语音识别单元,用于将所述用户语音的格式文件与所述相似的目标语音的格式文件进行相异性比较,获取相异度值。相异度值可以低到高的排列方式排列。为了使准确率更高,所述的识别处理单元具体还包括加权单元,用于 对第二语音识别单元得出的准成功值与加权变量进行叠加,并得出成功值。所述的识别处理单元具体还包括语音逆转处理单元,用于将各目标语音的格式转换为预设的识别格式文件;语音转换处理单元,用于将用户语音 转换为与所述目标语音格式相适配的格式文件。所述的输出单元具体包括还原处理单元,用于还原与所述不同权重等 级对应的目标语音的格式;目标语音获取单元,获取与较高权重等级值对应 的目标语音。所述第二识别单元还包括相异度值判断处理单元,用于判断的相异度 值是否大于预设的阈值,并在判断为是后,由第一语音处理单元处理。所述加权单元中预设的加权变量根据语音信号中的语词常用度、使用频 率进行确定。输出单元输出的格式为文本格式或声音格式或图像格式等。与现有技术相比,本技术具有以下有益效果本技术的语音识 别装置由于语音存储单元设置有目标库,存储预设的各目标语音,进行语音 识别时,比较识别的目标范围限定在语音存储单元内存储的各目标语音范围 内,因而减轻了语音识别的运算负荷,提高了语音识别的成功率。附图说明图l是本技术语音识别装置的主要示意图2是本技术语音识别装置的语音转换处理单元与第一语音识别单 元和第二语音识单元的相互关系示意图3是本技术识别装置的语音逆转处理单元与第一语音识别单元和 目标库的相互关系示意图。具体实施方式下面根据附图来说明本技术。一种语音识别装置,包括设置目标库,语音存储单元用于存储预设的 目标库的各目标语音;语音接收单元,用于接收待识别的用户语音;识别处 理单元,用于将所述用户语音与所述各目标语音格式文件进行比较识别出与 所述用户语音对应的目标语音;输出单元,用于输出所述识别结果。由用户依据自身需要自由定义,实际应用中可表现为一目标库,该目标库内 的语音目标是通过对特定的使用环境以及使用目的而设定的,其数量有限且 具有很强的针对性,是有限且所述的目标库中的目标语言为字、词、短语和 其之间的结合。用户可以将希望进行比较识别的所有目标输入其中。该目标 库可以由任何一个非特定使用者进行定义操作而无需专业人员进行,可以依 据用户的需要随时设置随时更新,也可以依据用户的需要随时删除一些不需 要的目标,由此确定进行识别比较的目标范围,从而减轻了语音识别的运算 负荷,提高了语音识别的成功率。比如说,水果店的识别目标库内只有关于 水果的词汇,而不具有其他不相关的词汇,因而混淆的可能性也就4艮小。参考图1,该图为本技术语音识别装置的主要示意图,该实施例中以 用户语音信号为AA,目标库中的预设语音为文本格式文件(与后面的强调部 分呼应)TA、 TB、 TC为例进行说明,其包括目标库101,语音4矣收单元108, 语音转换处理单元102,语音逆转处理单元103,第一语音识别单元104, 第二语音识别单元105,加权处理单元106,还原处理单元107以及输出单元109。 该语音识别装置能够接收用户语音信号AA并对该语音信号AA进行识 别比较,进而输出与该语音信号AA相对应的文本信号TA。具体说明如下首先由使用者对目标库101进行定义,该目标库由^f吏用者 依据自身需要自由定义,使用者可以将希望语音识别装置进行比较识别的所 有目标输入其中。该目标库101可以依据使用者的需要随时设置随时更新, 也可以依据使用者的需要随时删除一些不需要的目标。当使用者发出语音信 号a时,语音接收转换单元102会接收使用者发出的该语音信号,并将其转 换为专用格式数字信号文件SDa;与此同时,语音逆转单元103会将目标库101中所有的目标文本文件TA、 TB、 TC等依据语音逆转单元103内预-没的语 库分别转换为专用格式文件SDA、 SDB、 SDC等。随后第一语音识别单元104 将接收到的由语音逆转单元103及语音接收转换单元102分别传送来的专用 格式文件进行相似性比较,得出一与SDa最为近似的专用格式文件SDA;紧接 着第二语音识别单元105将接收到的由第一语音识别单元104及语音接收转 换单元102分别传送来的专用格式文件进行相异性比较,并得出一准成功值 xA,然后由准成功加权值单元106接收由第二语音识别单元105传送来的准 成功值,并将其分别与准成功加权值单元内预设的加权变量yA进行对应叠加 以得出最终的成功值zA。最后,由还原处理单元107接收由准成功加^又值单 元106传送来的成功值,并依据还原处理单元107内预设的对映还原表将成 功值xA还原为由使用者事先定义好的目标库中存储本文档来自技高网...

【技术保护点】
一种语音识别装置,其特征在于,包括: 设置目标库,目标库中设置有预设的各目标; 语音接收单元,用于接收待识别的用户语音; 识别处理单元,用于将所述用户语音与所述各目标的格式文件进行比较识别出与所述用户语音对应的目标; 输出单元,用于输出所述识别结果。

【技术特征摘要】
1、一种语音识别装置,其特征在于,包括设置目标库,目标库中设置有预设的各目标;语音接收单元,用于接收待识别的用户语音;识别处理单元,用于将所述用户语音与所述各目标的格式文件进行比较识别出与所述用户语音对应的目标;输出单元,用于输出所述识别结果。2、 根据权利要求1所述的语音识别装置,其特征在于,所述的目标库采 用有限的词和/或短语;字、词的集合;字、词、短句的集合。3、 根据权利要求1所述的语音识别装置,其特征在于,所述的识别处理单元具体包括第一语音识别单元,用于将用户语音的格式文件与预设各目标语音的格 式文件进行相似性比较,获取与所述用户语音相似的目标语音的格式文件;第二语音识别单元,用于将'所述用户语音的格式文件与所述相似的目标 语音的格式文件进行相异性比较,获取两者相异度值,即准成功值。4、 根据权利要求3所述的语音识别装置,其特征在于,所述的识别处理 单元具体还包括加权单元,用于对第二语音识别单元得出的准成功值与加权变量进行叠 加,并...

【专利技术属性】
技术研发人员:管桂宝
申请(专利权)人:广州汉音电子科技有限公司
类型:实用新型
国别省市:81[中国|广州]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1