本发明专利技术涉及语音信号处理技术领域,公开了一种实现语音命令控制的方法、设备及系统。该方法包括:客户端接收用户语音信号;将所述用户语音信号发送给服务器,以使所述服务器对所述用户语音信号进行解码得到对应所述用户语音信号的文本内容,并根据所述文本内容确定命令指令;接收所述服务器返回的命令指令;根据所述命令指令执行操作。利用本发明专利技术,可以提高客户端应用程序对语音命令的响应效率。
【技术实现步骤摘要】
【专利摘要】本专利技术涉及语音信号处理
,公开了一种实现语音命令控制的方法、设备及系统。该方法包括:客户端接收用户语音信号;将所述用户语音信号发送给服务器,以使所述服务器对所述用户语音信号进行解码得到对应所述用户语音信号的文本内容,并根据所述文本内容确定命令指令;接收所述服务器返回的命令指令;根据所述命令指令执行操作。利用本专利技术,可以提高客户端应用程序对语音命令的响应效率。【专利说明】实现语音命令控制的方法、设备及系统
本专利技术涉及语音信号处理
,具体涉及一种实现语音命令控制的方法、设备及系统。
技术介绍
实现人机之间人性化、智能化的有效交互,构建高效自然的人机交流环境,已经成为当前信息技术应用和发展的迫切需求。作为一种自然人性而又高效的交互方式,语音命令控制改变了传统基于图形界面交互的应用,特别是近年来随着移动终端设备的飞速发展,语音控制在小屏幕设备上得以发挥更为重要的作用。语音命令控制进一步解放了用户的使用限制,使得用户在不方便手动操作比如开车时,依然可以实现对应用程序的有效控制。云计算时代的语音服务器,由于具有超大规模的存储空间及超强的运算能力,支持了用户任意说的语音识别,进一步提高了语音交互的便利性。然而目前语音服务器主要用于实现对用户语音信号的转换,即将语音信号转换成文字字串,然后将转换后的文本内容传输给客户端应用程序,再由客户端应用程序实现从文本到指令的转换。显然这样的运行方式对客户端应用程序使用语音命令控制的开发要求较高,需要独立开发命令解析功能,不利于资源共享。特别是当前由于语音识别技术识别水平尚不足以向用户提供100%正确的连续语音信号转换功能,传回的文本内容可能存在各种错误,更增加了应用程序对文本指令解析的难度,影响了语音命令控制效率。
技术实现思路
本专利技术实施例提供一种实现语音命令控制的方法、设备及系统,以提高客户端应用程序对语音命令的响应效率。为此,本专利技术提供如下技术方案:一种实现语音命令控制的方法,包括:客户端接收用户语音信号;将所述用户语音信号发送给服务器,以使所述服务器对所述用户语音信号进行解码得到对应所述用户语音信号的文本内容,并根据所述文本内容确定命令指令;接收所述服务器返回的命令指令;根据所述命令指令执行操作。优选地,所述方法还包括:所述客户端在接收用户语音信号后,生成语音命令解析请求,并将所述语音命令解析请求发送给服务器,以使所述服务器根据所述语音命令解析请求和所述文本内容确定命令指令;所述语音命令解析请求包括:对应当前活动页面的命令列表或命令网络,所述命令列表或命令网络用于描述当前活动页面的所有命令内容以及所述命令内容对应的命令指令。优选地,所述方法还包括:在将所述用户语音信号发送给服务器之前,对所述用户语音信号进行降噪处理;所述将所述用户语音信号发送给服务器包括:将降噪处理后的用户语音信号发送给服务器。优选地,所述方法还包括:在将所述用户语音信号发送给服务器之前,提取所述用户语音信号中的声学特征;所述将所述用户语音信号发送给服务器包括:将提取的所述用户语音信号中的声学特征发送给服务器。一种实现语音命令控制的方法,包括:服务器接收客户端发送的用户语音信号;对所述用户语音信号进行解码,得到所述语音信号对应的文本内容;确定所述文本内容对应的命令指令;将所述命令指令发送给所述客户端,以使所述客户端根据所述命令指令执行操作。优选地,所述方法还包括:所述服务器接收所述客户端发送的语音命令解析请求,所述语音命令解析请求包括:对应当前活动页面的命令列表或命令网络,所述命令列表或命令网络用于描述当前活动页面的所有命令内容以及所述命令内容对应的命令指令;根据所述语音命令解析请求构建解码网络;所述对所述用户语音信号进行解码,得到所述语音信号对应的文本内容包括:利用所述解码网络对所述用户语音信号进行解码,得到所述语音信号对应的文本内容;所述确定所述文本内容对应的命令指令包括:根据所述文本内容查询所述命令列表或命令网络,得到所述文本内容对应的命令指令。优选地,所述根据所述语音命令解析请求构建解码网络包括:根据所述命令列表或命令网络生成语义网络;利用预置的声学模型对所述语义网络进行扩展,得到解码网络。一种客户端设备,包括:语音接收模块,用于接收用户语音信号;信号发送模块,用于将所述语音接收模块接收的用户语音信号发送给服务器,以使所述服务器对所述用户语音信号进行解码得到对应所述用户语音信号的文本内容,并根据所述文本内容确定命令指令;信号接收模块,用于接收所述服务器返回的命令指令;执行模块,用于根据所述命令指令执行操作。优选地,所述客户端设备还包括:解析请求生成模块,用于在所述语音接收模块接收用户语音信号后,生成语音命令解析请求;所述信号发送模块,还用于将所述语音命令解析请求发送给服务器,以使所述服务器根据所述语音命令解析请求和所述文本内容确定命令指令;所述语音命令解析请求包括:对应当前活动页面的命令列表或命令网络,所述命令列表或命令网络用于描述当前活动页面的所有命令内容以及所述命令内容对应的命令指令。优选地,所述客户端设备还包括:降噪处理模块,用于对所述语音接收模块接收的用户语音信号进行降噪处理;所述信号发送模块具体用于将降噪处理后的用户语音信号发送给服务器。优选地,所述客户端设备还包括:声学特征提取模块,用于提取所述语音接收模块接收的用户语音信号中的声学特征;所述信号发送模块具体用于将提取的所述用户语音信号中的声学特征发送给服务器。一种服务器,包括:接收模块,用于接收客户端发送的用户语音信号;解码模块,用于对所述用户语音信号进行解码,得到所述语音信号对应的文本内容;文本转换模块,用于确定所述文本内容对应的命令指令;发送模块,用于将所述命令指令发送给所述客户端,以使所述客户端根据所述命令指令执行操作。优选地,所述接收模块,还用于接收所述客户端发送的语音命令解析请求,所述语音命令解析请求包括:对应当前活动页面的命令列表或命令网络,所述命令列表或命令网络用于描述当前活动页面的所有命令内容以及所述命令内容对应的命令指令;所述服务器还包括:解码网络构建模块,用于根据所述语音命令解析请求构建解码网络;所述解码模块,具体用于利用所述解码网络构建模块构建的解码网络对所述用户语音信号进行解码,得到所述语音信号对应的文本内容;所述文本转换模块,具体用于根据所述文本内容查询所述命令列表或命令网络,得到所述文本内容对应的命令指令。优选地,所述解码网络构建模块包括:语义网络生成单元,用于根据所述命令列表或命令网络生成语义网络;网络扩展单元,用于利用预置的声学模型对所述语义网络进行扩展,得到解码网络。一种实现语音命令控制的系统,其特征在于,包括:客户端设备和服务器,其中所述客户端设备为前面所述的客户端设备,所述服务器为前面所述的服务器。本专利技术实施例提供的实现语音命令控制的方法、设备及系统,在客户端接收用户语音信号后,将所述用户语音信号发送给服务器,由服务器对用户语音信号进行解码得到对应所述用户语音信号的文本内容,并根据所述文本内容确定命令指令,从而使客户端可以直接从服务器得到相应的命令指令,根据所述命令指令执行相应操作,而无需再由客户端应用程序进行从文本到指令的转换,不仅提高了客本文档来自技高网...
【技术保护点】
一种实现语音命令控制的方法,其特征在于,包括:客户端接收用户语音信号;将所述用户语音信号发送给服务器,以使所述服务器对所述用户语音信号进行解码得到对应所述用户语音信号的文本内容,并根据所述文本内容确定命令指令;接收所述服务器返回的命令指令;根据所述命令指令执行操作。
【技术特征摘要】
【专利技术属性】
技术研发人员:何婷婷,胡国平,胡郁,刘庆峰,
申请(专利权)人:安徽科大讯飞信息科技股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。