一种语音识别交互方法、系统、设备和存储介质技术方案

技术编号：21688488 阅读：34 留言：0更新日期：2019-07-24 15:19

本发明专利技术涉及计算机设备技术领域，特别是涉及一种语音识别交互方法、系统、设备和存储介质。方法包括：接收输入设备发送的用户操作事件信号和用户语音信息，并根据用户操作事件信号以及客户端的输入状态得到语音处理模式信息；将语音处理模式信息和用户语音信息实时发送至云端和/或服务器，通过云端和/或服务器进行处理以获取与用户语音信息对应的识别信息；根据识别信息执行文本输入操作和/或语音控制操作。本发明专利技术实施例中的语音识别交互方法、系统、设备和存储介质，通过简单的语音键操作，实现了用户和客户端之间的语音识别通信，使得可以通过语音进行输入和控制客户端，操作简单方便，拓展了语音识别的功能应用。

A Speech Recognition Interaction Method, System, Equipment and Storage Media

全部详细技术资料下载

【技术实现步骤摘要】
一种语音识别交互方法、系统、设备和存储介质
本专利技术涉及计算机设备
，特别是涉及一种语音识别交互方法、系统、设备和存储介质。
技术介绍
语音识别技术是将人类语音中的词汇内容转换为计算机可读的输入。若能将语音识别技术与计算机相结合实现语音对计算机进行控制，必将大大提升人们对计算机操控的便捷和高效程度。目前市场上出现了许多支持语音识别功能的鼠标，为了满足对电脑的多种操作，其语音相关的功能键数量较多且操控均较为复杂，两个甚至数个功能键使得人们很难上手和熟练操作，结果导致语音识别技术给鼠标带来的技术提升效果大打折扣。可见，现有技术中语音识别技术与计算机之间的交互由于鼠标功能单一，需要设置多个控制键进行语音识别操作过程，智能化程度低，无法有效快速的进行交互。
技术实现思路
基于此，提供一种语音识别交互方法、系统、设备和存储介质，解决现有技术语音识别交互过程操作繁杂、智能化低的问题。在其中一个实施例中，本专利技术提供了一种语音识别交互方法，应用于客户端，所述客户端可与具有语音采集模块的输入设备通信，所述方法包括以下步骤：接收所述输入设备发送的用户操作事件信号和用户语音信息，并根据所述用户操作事件信号以及所述客户端的输入状态得到语音处理模式信息；将所述语音处理模式信息和所述用户语音信息实时发送至云端和/或服务器，通过所述云端和/或服务器进行处理以获取与所述用户语音信息对应的识别信息；根据所述识别信息执行文本输入操作和/或语音控制操作。在其中一个实施例中，本专利技术提供了一种语音识别交互方法，应用于具有语音采集模块的输入设备，所述方法包括以下步骤：根据用户操作事件生成...

【技术保护点】
1.一种语音识别交互方法，应用于客户端，所述客户端可与具有语音采集模块的输入设备通信，其特征在于，所述方法包括以下步骤：接收所述输入设备发送的用户操作事件信号和用户语音信息，并根据所述用户操作事件信号以及所述客户端的输入状态得到语音处理模式信息；将所述语音处理模式信息和所述用户语音信息实时发送至云端和/或服务器，通过所述云端和/或服务器进行处理以获取与所述用户语音信息对应的识别信息；根据所述识别信息执行文本输入操作和/或语音控制操作。

【技术特征摘要】
1.一种语音识别交互方法，应用于客户端，所述客户端可与具有语音采集模块的输入设备通信，其特征在于，所述方法包括以下步骤：接收所述输入设备发送的用户操作事件信号和用户语音信息，并根据所述用户操作事件信号以及所述客户端的输入状态得到语音处理模式信息；将所述语音处理模式信息和所述用户语音信息实时发送至云端和/或服务器，通过所述云端和/或服务器进行处理以获取与所述用户语音信息对应的识别信息；根据所述识别信息执行文本输入操作和/或语音控制操作。2.如权利要求1所述的交互方法，其特征在于，所述接收所述输入设备发送的用户操作事件信号和用户语音信息，并根据所述用户操作事件信号以及所述客户端输入状态确定得到语音处理模式信息，具体包括：接收所述输入设备发送的用户操作事件信号，根据所述用户操作事件信号判断用户操作事件类型；根据所述用户操作事件类型以及所述客户端的输入状态，获得语音处理模式信息，所述语音处理模式信息包括所述语音处理模式为文本输入模式或语音指令模式；根据所述语音处理模式信息发送控制信号至所述输入设备，以使所述输入设备开始或停止用户语音采集。3.如权利要求2所述的交互方法，其特征在于，所述用户操作事件类型包括用户对所述输入设备上操作按键进行单击或长按；所述接收所述输入设备发送的用户操作事件信号，根据所述用户操作事件类型以及所述客户端的输入状态，获得语音处理模式信息，具体包括：接收到所述用户操作事件信号时开始计时；若所述用户操作事件信号持续时间未超过预设时间且仅发生一次，则所述用户操作事件类型为单击操作按键，与所述用户操作事件类型对应的语音处理模式为输入文本模式；若所述用户操作事件信号持续时间超过预设时间且仅发生一次，则所述用户操作事件类型为长按操作按键，与所述用户操作事件类型对应的语音处理模式为语音命令模式。4.如权利要求3所述的交互方法，其特征在于，所述文本输入模式包括直接文本输入模式和翻译文本输入模式；所述若所述用户操作事件信号持续时间未超过预设时间且仅发生一次，则所述用户操作事件类型为单击操作按键，与所述用户操作事件对应的语音处理模式为输入文本模式，具体包括：若所述客户端当前处于直接文本输入状态，则将所述语音处理模式确定为所述直接输入文本模式，以便将所述用户语音信息转换为与语音对应语言的文本信息；若所述客户端当前处于翻译文本输入状态，则将所述...

【专利技术属性】
技术研发人员：马冰，马升，朱国正，
申请(专利权)人：合肥马道信息科技有限公司，
类型：发明
国别省市：安徽,34

全部详细技术资料下载我是这个专利的主人