一种语音控制方法及装置制造方法及图纸

技术编号:19908771 阅读:48 留言:0更新日期:2018-12-26 04:40
本申请涉及计算机技术及互联网领域,公开了一种语音控制方法及装置,用以形成动态语音库,从而减少语音库的数据量,减小服务器的压力。该方法为:智能终端获取当前显示的第一场景界面,并获取所述第一场景界面相关的第一语音库;所述智能终端将所述第一语音库发送给语音识别设备;所述智能终端接收第一语音指令,将所述第一语音指令发送给所述语音识别设备,所述第一语音指令用于指示所述语音识别设备在所述第一语音库中查找与所述第一语音指令匹配的第一控制指令;所述智能终端接收所述语音识别设备返回的所述第一控制指令,执行与所述第一控制指令相应的操作。

【技术实现步骤摘要】
一种语音控制方法及装置
本申请实施例涉及计算机技术及互联网领域,尤其涉及一种语音控制方法及装置。
技术介绍
随着智能终端技术的发展,不同种类的智能终端进入用户的应用中。例如,智能电视。近年来,智能电视上的应用程序不断丰富,且人机交互方式越来越多样化,使智能电视成为家庭娱乐的中心。目前,除了传统的电视遥控器之外,语音控制、手势操作、人脸识别、触摸控制等交互方式都在智能电视上得到了不同程度的应用,各项技术正在不断发展、日益成熟。智能电视的语音控制是采用的语音识别技术,通过麦克接受声音,然后用计算机技术对声音进行分析,根据声音的频率、频谱与预存指令进行比对,最后确定所执行的指令。现有技术中,一种语音控制方法是:建立包含不同场景界面的云端语音服务器的语音数据库,语音控制器与云端语音服务器建立通信连接,语音控制器接收用户的语音命令,从语音数据库中调取与语音命令相匹配的场景界面,云端语音服务器接收用户的选择指令并执行选择指令对应的操作,通过语音控制器实现与智能终端的语音交互。但是,这种方案的缺点就是,需要事先在云端语音服务器中建立不同场景界面的语音数据库,一般情况下,每个场景界面对应建立一个语音数据库,通常智能终端所应用到的场景界面比较多,这样会导致不同场景界面的语音数据库可控性较低,且调用语音数据库时执行过多的冗余代码,另外,语音数据库的数据量过于庞大,从而导致云端语音服务器的负荷较重,压力较大。
技术实现思路
本申请实施例提供一种语音控制方法及装置,用以解决在语音控制智能终端时语音数据库的数据量过大且服务器负荷较重的问题。本申请实施例提供的具体技术方案如下:一种语音控制方法,包括:智能终端获取当前显示的第一场景界面,并获取所述第一场景界面相关的第一语音库;所述智能终端将所述第一语音库发送给语音识别设备;所述智能终端接收第一语音指令,将所述第一语音指令发送给所述语音识别设备,所述第一语音指令用于指示所述语音识别设备在所述第一语音库中查找与所述第一语音指令匹配的第一控制指令;所述智能终端接收所述语音识别设备返回的所述第一控制指令,执行与所述第一控制指令相应的操作。可选的,所述智能终端将所述第一语音库发送给语音识别设备,包括:所述智能终端响应于用于输入所述第一语音指令的事件启用操作,将所述第一语音库发送给语音识别设备;或者所述智能终端在历史场景界面切换到所述第一场景界面时,将所述第一语音库发送给语音识别设备,其中,所述历史场景界面为所述智能终端在显示所述第一场景界面之前所显示的场景界面。可选的,所述执行与所述第一控制指令相应的操作,包括:所述智能终端调用与所述第一控制指令相关的脚本语言,所述脚本语言用于使服务器为所述智能终端提供所述操作所需的数据信息;其中,所述智能终端与所述服务器服从于浏览器/服务器B/S网络结构模式的应用方式。可选的,在执行与所述第一控制指令相应的操作之后,还包括:智能终端获取更新显示的第二场景界面,并获取所述第二场景界面相关的第二语音库;所述智能终端将所述第二语音库发送给语音识别设备;所述智能终端接收第二语音指令,将所述第二语音指令发送给所述语音识别设备,所述第二语音指令用于指示所述语音识别设备在所述第二语音库中查找与所述第二语音指令匹配的第二控制指令;所述智能终端接收所述语音识别设备返回的所述第二控制指令,执行与所述第二控制指令相应的操作。可选的,在获取所述第一场景信息对应的第一语音库之后,还包括:所述智能终端缓存所述第一语音库;在执行与所述控制指令相应的操作之后,还包括:所述智能终端若确定更新显示的场景界面仍为所述第一场景界面,则将缓存的所述第一语音库发送给语音识别设备;所述智能终端接收第三语音指令,将所述第三语音指令发送给所述语音识别设备,所述第三语音指令用于指示所述语音识别设备在所述第一语音库中查找与所述第三语音指令匹配的第三控制指令;所述智能终端接收所述语音识别设备返回的所述第三控制指令,执行与所述第三控制指令相应的操作。一种语音控制装置,包括:处理单元,用于获取当前显示的第一场景界面,并获取所述第一场景界面相关的第一语音库;发送单元,用于将所述处理单元获取的所述第一语音库发送给语音识别设备;接收单元,用于接收第一语音指令;所述发送单元,还用于将所述第一语音指令发送给所述语音识别设备,所述第一语音指令用于指示所述语音识别设备在所述第一语音库中查找与所述第一语音指令匹配的第一控制指令;所述接收单元,还用于接收所述语音识别设备返回的所述第一控制指令;所述处理单元,还用于执行与所述第一控制指令相应的操作。可选的,所述处理单元用于:响应于用于输入所述第一语音指令的事件启用操作,通过所述发送单元将所述第一语音库发送给语音识别设备;或者在历史场景界面切换到所述第一场景界面时,通过所述发送单元将所述第一语音库发送给语音识别设备,其中,所述历史场景界面为所述智能终端在显示所述第一场景界面之前所显示的场景界面。可选的,所述处理单元用于:调用与所述第一控制指令相关的脚本语言,所述脚本语言用于使服务器为所述处理单元提供所述操作所需的数据信息;其中,所述装置与所述服务器服从于浏览器/服务器B/S网络结构模式的应用方式。可选的,所述处理单元还用于,在执行与所述第一控制指令相应的操作之后,获取更新显示的第二场景界面,并获取所述第二场景界面相关的第二语音库;所述发送单元还用于,将所述第二语音库发送给语音识别设备;所述接收单元还用于,接收第二语音指令,将所述第二语音指令发送给所述语音识别设备,所述第二语音指令用于指示所述语音识别设备在所述第二语音库中查找与所述第二语音指令匹配的第二控制指令;以及,接收所述语音识别设备返回的所述第二控制指令;所述处理单元还用于,执行与所述第二控制指令相应的操作。可选的,还包括:缓存单元,用于在所述处理单元获取所述第一场景信息对应的第一语音库之后,缓存所述第一语音库;所述处理单元还用于,在执行与所述控制指令相应的操作之后,若确定更新显示的场景界面仍为所述第一场景界面,则将所述缓存单元缓存的所述第一语音库发送给语音识别设备;所述接收单元还用于,接收第三语音指令;所述发送单元还用于,将所述第三语音指令发送给所述语音识别设备,所述第三语音指令用于指示所述语音识别设备在所述第一语音库中查找与所述第三语音指令匹配的第三控制指令;所述接收单元还用于,接收所述语音识别设备返回的所述第三控制指令;所述处理单元还用于,执行与所述第三控制指令相应的操作。附图说明图1为本申请实施例中应用系统架构示意图;图2为本申请实施例中语音控制方法流程示意图;图3为本申请实施例中语音控制装置结构示意图。具体实施方式下面将结合附图,对本申请实施例进行详细描述。如图1所示,本申请实施例应用的系统架构中包括智能终端101、服务器102和语音识别设备103。其中,智能终端101作为中间枢纽,分别与服务器102和语音识别设备103交互。智能终端101为能够实现人机交互的设备,具体包括能够接收用户输入的语音指令,并根据该语音指令执行相关的操作。智能终端101能够显示场景界面,该场景界面包括显示的各个图标、按钮、文字等元素。例如,智能终端101可以包括智能电视、智能手机等手持设备、车载设备等。服务器102能够为智能终端101本文档来自技高网...

【技术保护点】
1.一种语音控制方法,其特征在于,包括:智能终端获取当前显示的第一场景界面,并获取所述第一场景界面相关的第一语音库;所述智能终端将所述第一语音库发送给语音识别设备;所述智能终端接收第一语音指令,将所述第一语音指令发送给所述语音识别设备,所述第一语音指令用于指示所述语音识别设备在所述第一语音库中查找与所述第一语音指令匹配的第一控制指令;所述智能终端接收所述语音识别设备返回的所述第一控制指令,执行与所述第一控制指令相应的操作。

【技术特征摘要】
1.一种语音控制方法,其特征在于,包括:智能终端获取当前显示的第一场景界面,并获取所述第一场景界面相关的第一语音库;所述智能终端将所述第一语音库发送给语音识别设备;所述智能终端接收第一语音指令,将所述第一语音指令发送给所述语音识别设备,所述第一语音指令用于指示所述语音识别设备在所述第一语音库中查找与所述第一语音指令匹配的第一控制指令;所述智能终端接收所述语音识别设备返回的所述第一控制指令,执行与所述第一控制指令相应的操作。2.如权利要求1所述的方法,其特征在于,所述智能终端将所述第一语音库发送给语音识别设备,包括:所述智能终端响应于用于输入所述第一语音指令的事件启用操作,将所述第一语音库发送给语音识别设备;或者所述智能终端在历史场景界面切换到所述第一场景界面时,将所述第一语音库发送给语音识别设备,其中,所述历史场景界面为所述智能终端在显示所述第一场景界面之前所显示的场景界面。3.如权利要求1或2所述的方法,其特征在于,所述执行与所述第一控制指令相应的操作,包括:所述智能终端调用与所述第一控制指令相关的脚本语言,所述脚本语言用于使服务器为所述智能终端提供所述操作所需的数据信息;其中,所述智能终端与所述服务器服从于浏览器/服务器B/S网络结构模式的应用方式。4.如权利要求1或2所述的方法,其特征在于,在执行与所述第一控制指令相应的操作之后,还包括:智能终端获取更新显示的第二场景界面,并获取所述第二场景界面相关的第二语音库;所述智能终端将所述第二语音库发送给语音识别设备;所述智能终端接收第二语音指令,将所述第二语音指令发送给所述语音识别设备,所述第二语音指令用于指示所述语音识别设备在所述第二语音库中查找与所述第二语音指令匹配的第二控制指令;所述智能终端接收所述语音识别设备返回的所述第二控制指令,执行与所述第二控制指令相应的操作。5.如权利要求1或2所述的方法,其特征在于,在获取所述第一场景信息对应的第一语音库之后,还包括:所述智能终端缓存所述第一语音库;在执行与所述控制指令相应的操作之后,还包括:所述智能终端若确定更新显示的场景界面仍为所述第一场景界面,则将缓存的所述第一语音库发送给语音识别设备;所述智能终端接收第三语音指令,将所述第三语音指令发送给所述语音识别设备,所述第三语音指令用于指示所述语音识别设备在所述第一语音库中查找与所述第三语音指令匹配的第三控制指令;所述智能终端接收所述语音识别设备返回的所述第三控制指令,执行与所述第三控制指令相应的操作。6.一种语音控制装置,其特征在于,包括:处理单元,用于获取当前...

【专利技术属性】
技术研发人员:吴鹏鹏
申请(专利权)人:北京优朋普乐科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1