一种简捷式离线语音识别方法和系统技术方案

技术编号:25954620 阅读:30 留言:0更新日期:2020-10-17 03:47
本发明专利技术公开了一种简捷式离线语音识别方法和系统,前置词语与后置词语共同构成完整的语音控制命令,前置词语位于后置词语的前部,前置词语包含在事先预置的前置词语模型库中,后置词语包含在事先预置的后置词语模型库中。首先进行前置词语的采样流程,将前置词语的语音采样数据实时的与前置词语模型库中数据进行前置词语的模型对比,当前置词语对比通过后,再进行后置词语的采样流程,并将后置词语的语音采样数据实时的与后置词语模型库中数据进行后置词语的模型对比。本发明专利技术针对离线语音控制的电器设备实现快捷有效的精准识别,无需专门的唤醒词,直接简单的实现语音控制,具有较强的实用性和可操作性。

【技术实现步骤摘要】
一种简捷式离线语音识别方法和系统
本专利技术涉及离线语音识别应用领域,具体的说是一种简捷式离线语音识别方法和系统。
技术介绍
随着离线语音识别产品的大量应用,大部分产品都必须使用唤醒词,而频繁使用唤醒词导致用户使用的难度增大,体验感很差。因此,需要寻找一种不需要唤醒词但又能精准识别的方案。
技术实现思路
本专利技术是通过采用前置词语与后置词语共同构成完整的语音控制命令的办法,在离线语音产品上实现精准识别。技术方案:一种简捷式离线语音识别方法和系统,包括语音控制命令、前置词语模型库、后置词语模型库、前置词语的采样、前置词语的模型对比、后置词语的采样、后置词语的模型对比、输出相应的语音控制命令数据,其特征在于所述语音控制命令由前置词语与后置词语共同构成,所述前置词语数据位于所述后置词语数据的前部;语音识别的流程是:首先进行所述前置词语的采样,再将所述前置词语的语音采样数据实时的与所述前置词语模型库中数据进行所述前置词语的模型对比,当所述前置词语对比通过后,再进行所述后置词语的采样流程,并将所述后置词语的语音采样数据实时的与所述后置词语模型库中数据进行所述后置词语的模型对比,若对比无误,则执行所述输出相应的语音控制命令数据。优选地,所述前置词语为强制执行且相对固定的词语,所述前置词语与所述后置词语组成不可分割的完整控制指令词句,所述前置词语与所述后置词语之间无需反馈和等待,所述前置词语的模型数据预置于所述前置词语模型库中,预置方式包括通过机器学习和数据录入。优选地,所述后置词语为可变内容词语,所述后置词语的模型数据预置于所述后置词语模型库中,预置方式包括通过机器学习和数据录入。优选地,所述前置词语模型库中包括多个不同的事先预置的前置词语模型数据。优选地,所述后置词语模型库中包括多个不同的事先预置的后置词语模型数据。优选地,所述前置词语与所述后置词语的组合符合常规语法关系。有益效果:本专利技术针对离线语音控制的电器设备实现快捷有效的精准识别,无需专门的唤醒词,直接简单的实现语音控制,具有较强的实用性和可操作性。附图说明图1是本专利技术的语音识别流程示意图。图2是本专利技术的语音控制命令构成示意图。图3是本专利技术的前置词语模型库示意图。图4是本专利技术的后置词语模型库示意图。图中标号代表:前置词语的采样S101、前置词语的模型对比S102、后置词语的采样S103、后置词语的模型对比S104、输出相应的语音控制命令数据S105、语音控制命令1、前置词语模型库2、后置词语模型库3、前置词语11、后置词语12。具体实施方式除非另作定义,此处使用的技术术语或者科学术语应当为本专利技术所属领域内具有一般技能的人士所理解的通常意义。本专利技术专利申请说明书以及权利要求书中使用的“包括”或者“包含”等类似的词语意指出现在“包括”或者“包含”前面的元件或者物件涵盖出现在“包括”或者“包含”后面列举的元件或者物件及其等同,并不排除其他元件或者物件。“连接”或者“相连”等类似的词语并非限定于物理的或者机械的连接,而是可以包括电性的连接,不管是直接的还是间接的。见图1、图2、图3、图4所示,一种简捷式离线语音识别方法和系统及系统,包括语音控制命令1、前置词语模型库2、后置词语模型库3、前置词语的采样S101、前置词语的模型对比S102、后置词语的采样S103、后置词语的模型对比S104、输出相应的语音控制命令数据S105。所述语音控制命令1由前置词语11与后置词12语共同构成,所述前置词语11数据位于所述后置词语12数据的前部。例如:“我要”和“开灯”共同构成了“打开灯光”的控制命令,“我要”即是前置词语11,“开灯”即是后置词语12,识别顺序为“我要”“开灯”。语音识别的流程是:首先进行所述前置词语的采样S101,识别“我要”,再将前置词语11的“我要”的语音采样数据实时的与前置词语模型库2中“我要”数据进行前置词语的模型对比S102,当前置词语11“我要”对比通过后,再进行后置词语的采样流程S103,识别“开灯”,并将后置词语12“开灯”的语音采样数据实时的与后置词语模型库3中“开灯”模型数据进行后置词语的模型对比S104,若对比无误,则输出相应的语音控制命令数据S105,即控制命令“打开灯光”。前置词语11“我要”为强制执行且相对固定的词语,前置词语11“我要”与后置词语12“开灯”组成不可分割的完整控制指令“我要开灯”,前置词语11“我要”与后置词语12“开灯”之间无需反馈和等待,前置词语11“我要”的模型数据预置于前置词语模型库2中;后置词语12“开灯”为可变内容词语,如“开灯”、“打开灯”、“打开灯光”等,后置词语12“开灯”的模型数据预置于后置词语模型库3中。前置词语模型库2中包括多个不同的事先预置的前置词语模型数据,如“我要”、“我想”、“小明”等。后置词语模型库3中包括多个不同的事先预置的后置词语模型数据.如“开灯”、“关灯”、“开筒灯”、“开空调”、“关空调”、“温度26度”等。前置词语11与后置词语12的组合符合常规语法关系,如“我要开灯”、“我想开筒灯”、“小明开空调”、“我要温度26度”等。以上对本专利技术实施案例所提供了详细介绍,对于本领域的一般技术人员,依据本专利技术实施例的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本专利技术的限制。本文档来自技高网...

【技术保护点】
1.一种简捷式离线语音识别方法和系统,包括语音控制命令、前置词语模型库、后置词语模型库、前置词语的采样、前置词语的模型对比、后置词语的采样、后置词语的模型对比、输出相应的语音控制命令数据,其特征在于所述语音控制命令由前置词语与后置词语共同构成,所述前置词语数据位于所述后置词语数据的前部;/n语音识别的流程是:/n首先进行所述前置词语的采样,再将所述前置词语的语音采样数据实时的与所述前置词语模型库中数据进行所述前置词语的模型对比,当所述前置词语对比通过后,再进行所述后置词语的采样流程,并将所述后置词语的语音采样数据实时的与所述后置词语模型库中数据进行所述后置词语的模型对比,若对比无误,则执行所述输出相应的语音控制命令数据。/n

【技术特征摘要】
1.一种简捷式离线语音识别方法和系统,包括语音控制命令、前置词语模型库、后置词语模型库、前置词语的采样、前置词语的模型对比、后置词语的采样、后置词语的模型对比、输出相应的语音控制命令数据,其特征在于所述语音控制命令由前置词语与后置词语共同构成,所述前置词语数据位于所述后置词语数据的前部;
语音识别的流程是:
首先进行所述前置词语的采样,再将所述前置词语的语音采样数据实时的与所述前置词语模型库中数据进行所述前置词语的模型对比,当所述前置词语对比通过后,再进行所述后置词语的采样流程,并将所述后置词语的语音采样数据实时的与所述后置词语模型库中数据进行所述后置词语的模型对比,若对比无误,则执行所述输出相应的语音控制命令数据。


2.根据权利要求1所述的一种简捷式离线语音识别方法和系统,其特征在于:所述前置词语为强制执行且相对固定的词语,所述前置词语与所述后置词语组成不可分割的完...

【专利技术属性】
技术研发人员:黎辉赵龙
申请(专利权)人:深圳伯图康卓智能科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1