语音指令识别方法、装置、终端设备及存储介质制造方法及图纸

技术编号:26259340 阅读:87 留言:0更新日期:2020-11-06 17:53
本发明专利技术实施例公开了一种语音指令识别方法、装置、终端设备及存储介质。本发明专利技术实施例提供的语音指令识别方法包括识别用户输入的语音指令,生成语音文本;获取所述语音文本的信息槽值;根据所述信息槽值判断是否执行所述语音指令,使得终端设备接收到异常的语音指令时,用户可以方便快捷的停止语音输入。

【技术实现步骤摘要】
语音指令识别方法、装置、终端设备及存储介质
本专利技术涉及移动通信
,具体涉及一种语音指令识别方法、装置、终端设备及存储介质。
技术介绍
ASR(AutomaticSpeechRecognition,自动语音识别技术)是一种将人的语音转换为文本的技术,应用于各种各样的终端设备中,例如智能手机、笔记本电脑、平板电脑、车载终端等等,随着科学技术的发展和进步,用户对生活的便捷性要求也逐渐提高,越来越多的终端设备具有采集用户的语音,并进行语音识别的功能,终端设备利用麦克风采集用户输入的语音指令,并利用自动语音识别技术将用户输入的语音指令转化为语音文本,便于终端设备根据此语音文本做出相应的系统动作,避免用户利用文字输入或其他操作来控制终端系统做出相应的行为,使得用户可以通过语音来控制终端达到同样的目的,使用户可以更加便捷的控制终端,在对现有技术的研究和实践过程中,本专利技术的专利技术人发现,用户进行语音输入时,可能会有嘈杂的背景音,终端可能会接收到许多混乱的语音指令,用户无法方便快捷的关闭终端设备的语音输入功能。
技术实现思路
本专利技术实施例提供一种语音指令识别方法、装置、终端设备及存储介质,根据语音文本的所属领域、表达意图和信息槽值判断语音文本是否异常,使得终端设备接收到异常的语音指令时,用户可以方便快捷的停止语音输入。本专利技术实施例提供一种语音指令识别方法,包括:识别用户输入的语音指令,生成语音文本;获取所述语音文本的信息槽值;根据所述信息槽值判断是否执行所述语音指令。可选的,在本专利技术的一些实施例中,所述获取所述语音文本的信息槽值,包括:根据所述语音文本的内容确定所属领域和表达意图;根据所述所属领域和所述表达意图获取所述语音文本的信息槽;填充所述信息槽,生成信息槽值。可选的,在本专利技术的一些实施例中,所述根据所述信息槽值判断是否执行所述语音指令,包括:根据所述语音文本的所属领域判断是否执行所述语音指令。可选的,在本专利技术的一些实施例中,所述根据所述语音文本的所属领域判断是否执行所述语音指令,包括:确定所述语音文本包括至少两个不同的所属领域,不执行所述语音指令,停止语音输入;确定所述语音文本包括一所属领域,根据所述语音文本的表达意图判断是否执行所述语音指令。可选的,在本专利技术的一些实施例中,所述根据所述表达意图判断所述语音文本是否正常,包括:确定所述语音文本包括至少两个不同的所述表达意图,不执行所述语音指令,停止语音输入;确定所述语音文本包括一所述表达意图,根据所述信息槽值判断是否执行所述语音指令。可选的,在本专利技术的一些实施例中,所述根据所述信息槽值判断是否执行所述语音指令,包括:确定所述语音文本包括至少两个不同的所述信息槽值,不执行所述语音指令,停止语音输入;确定所述语音文本包括一所述信息槽值,执行所述语音指令。可选的,在本专利技术的一些实施例中,所述停止语音输入,包括:增大语音输入的停止按钮。相应的,本专利技术实施例还提供一种语音指令识别装置,包括:识别单元,用于识别用户输入的语音指令,生成语音文本;获取单元,用于获取所述语音文本的信息槽值;判断单元,用于根据所述信息槽值判断是否执行所述语音指令。同样的,本专利技术实施例还提供一种终端设备,包括:存储器,用于存储应用程序;处理器,用于在执行所述应用程序时实现语音指令识别方法任一项的步骤。此外,本专利技术实施例还提供一种存储介质,所述存储介质上存储有应用程序,所述应用程序被处理器执行时实现语音指令识别方法任一项的步骤。本专利技术实施例提供一种语音指令识别方法,用户输入语音指令,终端设备利用麦克风采集语音指令,并利用自动语音识别技术识别用户输入的语音指令,生成语音文本,终端设备利用NLU技术分析所述语音文本,确定语音文本的所属领域、表达意图和信息槽,并填充信息槽,生成信息槽值,终端先判断语音文本包括的所属领域,若语音文本包括至少两个不同的所述所属领域,确定所述语音文本异常,不执行语音指令,终端会使用户停止语音输入,若语音文本包括一所述所属领域,确定所述语音文本正常,接着终端会判断语音文本包括的表达意图,若语音文本包括至少两个不同的所述表达意图,确定所述语音文本异常,不执行语音指令,终端停止语音输入,若语音文本包括一所述表达意图,确定所述语音文本正常,然后终端会判断语音文本包括的信息槽值,语音文本包括至少两个不同的所述信息槽值,确定所述语音文本异常,不执行语音指令,终端停止语音输入,若语音文本包括一所述信息槽值,确定所述语音文本正常,终端执行此语音文本,语音文本异常时,终端会增大语音输入的停止按钮和/或暂停按钮,或者改变语音输入的停止按钮和/或暂停按钮的位置,将语音输入的停止按钮和/或暂停按钮从终端显示屏幕的边缘位置移动至中间位置,用户可以方便快捷的停止语音输入。附图说明为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术实施例提供的语音指令识别场景示意图;图2是本专利技术实施例提供的语音指令识别方法的流程图;图3是本专利技术实施例提供的语音指令识别方法的另一流程图;图4是本专利技术实施例提供的语音指令识别装置的结构示意图;图5是本专利技术实施例提供的终端的结构示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。本专利技术实施例提供一种语音指令识别方法、装置、终端设备及存储介质。其中该装置可以集成在终端中,该终端可以是手机、平板电脑、笔记本电脑、车载终端等设备。例如,如图1所示,打开终端设备的语音输入功能,终端设备打开麦克风,用户对着终端设备输入语音指令,终端设备利用麦克风采集用户输入的语音指令,然后将此语音指令传输至终端系统的识别单元,利用自动语音识别技术识别此语音指令,将此语音指令转化为语音文本,接着终端设备将此语音文本传输至终端系统的获取单元,利用NLU技术分析所述语音文本,将此语音文本进行分类,从而识别所述语音文本的表达意图和所属领域,确定所述语音文本的信息槽,对此语音文本进行序列标注,填充此语音文本的信息槽,生成信息槽值,最后终端设备将此语音文本传输至终端系统的判断单元,终端先判断语音文本包括的所属领域,若语音文本包括至少两个不同的所述所属领域,确定所述语音文本异常,不执行语音指令,终端会使用户停止语音输入,若语音文本包括一所述所属领域,确定所述语音文本正常,接着终端会判断语音文本包括的表本文档来自技高网...

【技术保护点】
1.一种语音指令识别方法,其特征在于,包括:/n识别用户输入的语音指令,生成语音文本;/n获取所述语音文本的信息槽值;/n根据所述信息槽值判断是否执行所述语音指令。/n

【技术特征摘要】
1.一种语音指令识别方法,其特征在于,包括:
识别用户输入的语音指令,生成语音文本;
获取所述语音文本的信息槽值;
根据所述信息槽值判断是否执行所述语音指令。


2.根据权利要求1所述的方法,其特征在于,所述获取所述语音文本的信息槽值,包括:
根据所述语音文本的内容确定所属领域和表达意图;
根据所述所属领域和所述表达意图获取所述语音文本的信息槽;
填充所述信息槽,生成信息槽值。


3.根据权利要求1所述的方法,其特征在于,所述根据所述信息槽值判断是否执行所述语音指令,包括:
根据所述语音文本的所属领域判断是否执行所述语音指令。


4.根据权利要求3所述的方法,其特征在于,所述根据所述语音文本的所属领域判断是否执行所述语音指令,包括:
确定所述语音文本包括至少两个不同的所属领域,不执行所述语音指令,停止语音输入;
确定所述语音文本包括一所属领域,根据所述语音文本的表达意图判断是否执行所述语音指令。


5.根据权利要求4所述的方法,其特征在于,所述根据所述表达意图判断所述语音文本是否正常,包括:
确定所述语音文本包括至少两个不同的所述表达意图,不执行所述语音...

【专利技术属性】
技术研发人员:王璐
申请(专利权)人:惠州TCL移动通信有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1