一种语音数据识别方法及装置制造方法及图纸

技术编号:11173125 阅读:118 留言:0更新日期:2015-03-20 02:27
本发明专利技术实施例公开了一种语音数据识别方法及装置,所述方法包括:获取语音数据;对所述语音数据进行识别,如果识别出所述语音数据为命令语音数据,则确定所述命令语音数据对应的命令代码;将所述命令代码通过命令控制信道发送给桌面云服务端,以便于所述桌面云服务端根据所述命令代码确定对应的标准语音数据,并将所述标准语音数据插入到音频重定向数据队列中进行识别。本发明专利技术实施例解决了现有技术中,采用音频有损编解码或实时传输协议方式,都会导致语音识别成功率下降的技术问题。

【技术实现步骤摘要】
一种语音数据识别方法及装置
本专利技术涉及通信
,特别涉及一种语音数据识别方法及装置。
技术介绍
在现有的桌面云重定向场景中,为了确保在网络传输的时候得到最小的带宽消 耗并降低传输时延,桌面云客户端对音频数据通常会采用有损编码方式(比如采用speex、 vobis音频编码方式等),即针对原始PCM数据进行有损压缩,然后将压缩后的数据传输给 桌面云服务器,由桌面云服务器解压后还原成PCM数据,并将还原后的PCM数据发送给音频 重定向驱动程序,以便于完成相应音频操作。 但是,在该语音识别的场景中,语音指令识别成功率,将取决于输入的PCM音频数 据是否完整清晰,然而,在现有的重定向音频编解码的过程中,由于采用了有损压缩,虽然 减小了带宽和降低传输时延,但是解压后音质都有所下降,从而导致语音指令的识别成功 率相应的下降。 当然,在现有的桌面云重定向场景中,桌面云客户端对音频数据也会采取实时传 输协议(例如RTP)来进行重定向传输。这种音频数据传输方式,虽然实时性很强,但是可靠 性较低,会造成语音指令数据存在丢包的可能行,从而降低了语音指令的完整性,进而导致 语音指令的识别成功率相应的下降。 在对现有技术的研究和实践过程中,本专利技术的专利技术人发现,现有的桌面云重定向 场景中,无论采用音频有损编解码方式,还是采用实时传输协议方式,均会导致语音识别成 功率下降的问题。
技术实现思路
本专利技术实施例中提供了一种语音数据识别方法及装置,以解决现有技术中,采用 音频有损编解码或实时传输协议方式,都会导致语音识别成功率下降的技术问题。 为了解决上述技术问题,本专利技术实施例公开了如下技术方案: 第一方面提供了一种语音数据识别方法,所述方法包括: 获取语音数据; 对所述语音数据进行识别,如果识别出所述语音数据为命令语音数据,则确定所 述命令语音数据对应的命令代码; 将所述命令代码通过命令控制信道发送给桌面云服务端,以便于所述桌面云服务 端根据所述命令代码确定对应的标准语音数据,并将所述标准语音数据插入到音频重定向 数据队列中进行识别。 在第一方面的第一种可能的实现方式中,所述方法还包括: 如果识别出所述语音数据为普通语音数据,则对所述普通语音数据进行音频编 码,并将编码后的语音数据通过数据通道发送给桌面云服务端,以便于所述桌面云服务端 将所述普通语音数插入所述音频重定向数据队列中进行识别。 结合第一方面或第一方面的第一种可能的实现方式,在第二种可能的实现方式 中,所述方法还包括: 在获取所述语音数据后,判断所述语音数据的模式; 如果所述语音数据的模式为语音识别模式,则执行所述对所述语音数据进行识别 的步骤; 如果所述语音数据的模式为普通语音模式,则执行所述对所述普通语音数据进行 音频编码的步骤。 结合第一方面或第一方面的第一种或第二种可能的实现方式,在第三种可能的实 现方式中,所述方法还包括: 预先存储配置的所述命令语音数据,以及所述命令语音数据对应的命令代码。 结合第一方面或第一方面的第一种或第二种或第三种可能的实现方式,在第四种 可能的实现方式中,所述对所述语音数据进行识别,具体包括: 将所述语音数据与存储的所述命令语音数据进行匹配,如果匹配成功,则所述语 音数据为可识别的命令语音数据。 结合第一方面或第一方面的第一种或第二种或第三种或第四种可能的实现方式, 在第五种可能的实现方式中,所述方法还包括: 接收管理系统下发的更新命令,所述更新命令包括:更新后的命令语音数据以及 所述命令语音数据对应的命令代码; 根据所述更新命令更新存储的所述命令语音数据,以及所述命令语音数据对应的 命令代码。 第二方面提供了一种语音数据识别方法,所述方法包括: 接收桌面云客户端通过命令控制信道发送的命令代码,所述命令代码对应可识别 的命令语音数据; 根据所述命令代码确定对应的标准语音数据; 将所述标准语音数据插入到音频重定向数据队列中进行识别。 在第二方面的第一种可能的实现方式中,所述方法还包括: 接收桌面云客户端通过数据信道发送的普通语音数据; 对所述普通语音数据进行音频解码,并将解码后的普通语音数据插入所述音频重 定向数据队列中进行识别。 结合第二方面或第二方面的第一种可能的实现方式,在第二种可能的实现方式 中,所述方法还包括:预先存储配置的所述命令代码,以及所述命令代码对应的标准语音数 据。 结合第二方面或第二方面的第一种或第二种可能的实现方式,在第三种可能的实 现方式中,所述方法还包括: 接收管理系统下发的更新命令,所述更新命令包括:更新的命令代码以及所述命 令代码对应的标准语音数据; 根据所述更新命令更新所述命令代码以及所述命令代码对应的标准语音数据。 第三方面提供了一种语音数据识别方法,所述方法包括: 接收桌面云客户端通过命令控制信道发送的命令代码,所述命令代码对应命令语 音数据; 根据所述命令代码调用对应的语音识别软件开发接口识别出所述命令语音数据 对应的语音数据。 第四方面提供了一种语音数据识别装置,包括: 获取单元,用于获取语音数据; 识别单元,用于对所述语音数据进行识别; 确定单元,用于在所述识别单元识别出所述语音数据为命令语音数据时,确定所 述命令语音数据对应的命令代码; 第一发送单元,用于将所述命令代码通过命令控制信道发送给桌面云服务端,以 便于所述桌面云服务端根据所述命令代码确定对应的标准语音数据,并将所述标准语音数 据插入到音频重定向数据队列中进行识别。 在第四方面的第一种可能的实现方式中,还包括: 编码单元,用于在所述识别单元识别出所述语音数据为普通语音数据时,对所述 普通语音数据进行音频编码; 第二发送单元,用于将编码后的语音数据通过数据通道发送给桌面云服务端,以 便于所述桌面云服务端将所述普通语音数插入所述音频重定向数据队列中进行识别。 结合第四方面或第四方面的第一种可能的实现方式,在第二种可能的实现方式 中,还包括: 判断单元,用于在所述获取单元获取所述语音数据后,判断所述语音数据的模式, 并将所述语音数据的模式为语音识别模式的判断结果发送给所述识别单元;将所述语音数 据的模式为普通语音模式的判断结果发送给所述编码单元; 所述识别单元,还用于在接收到所述判断单元发送的所述语音数据的模式为语音 识别模式的判断结果时,对所述语音数据进行识别; 所述编码单元,还用于在接收到所述判断单元发送的所述语音数据的模式为普通 语音模式的判断结果时,对所述普通语音数据进行音频编码。 结合第四方面或第四方面的第一种或第二种可能的实现方式,在第三种可能的实 现方式中,还包括: 存储单元,用于预先存储所述命令语音数据,以及所述命令语音数据对应的命令 代码。 结合第四方面或第四方面的第一种或第二种或第三种可能的实现方式,在第四种 可能的实现方式中,还包括: 接收单元,用于接收管理系统下发的更新命令;所述更新命令包括:更新后的命 令语音数据以及所述命令语音数据对应的命令代码; 更新单本文档来自技高网...
一种语音数据识别方法及装置

【技术保护点】
一种语音数据识别方法,其特征在于,包括:获取语音数据;对所述语音数据进行识别,如果识别出所述语音数据为命令语音数据,则确定所述命令语音数据对应的命令代码;将所述命令代码通过命令控制信道发送给桌面云服务端,以便于所述桌面云服务端根据所述命令代码确定对应的标准语音数据,并将所述标准语音数据插入到音频重定向数据队列中进行识别。

【技术特征摘要】
1. 一种语音数据识别方法,其特征在于,包括: 获取语音数据; 对所述语音数据进行识别,如果识别出所述语音数据为命令语音数据,则确定所述命 令语音数据对应的命令代码; 将所述命令代码通过命令控制信道发送给桌面云服务端,以便于所述桌面云服务端根 据所述命令代码确定对应的标准语音数据,并将所述标准语音数据插入到音频重定向数据 队列中进行识别。2. 根据权利要求1所述的方法,其特征在于,还包括: 如果识别出所述语音数据为普通语音数据,则对所述普通语音数据进行音频编码,并 将编码后的语音数据通过数据通道发送给桌面云服务端,以便于所述桌面云服务端将所述 普通语音数插入所述音频重定向数据队列中进行识别。3. 根据权利要求2所述的方法,其特征在于,还包括: 在获取所述语音数据后,判断所述语音数据的模式; 如果所述语音数据的模式为语音识别模式,则执行所述对所述语音数据进行识别的步 骤; 如果所述语音数据的模式为普通语音模式,则执行所述对所述普通语音数据进行音频 编码的步骤。4. 根据权利要求1至3任一项所述的方法,其特征在于,还包括: 预先存储配置的所述命令语音数据,以及所述命令语音数据对应的命令代码。5. 根据权利要求4所述的方法,其特征在于,所述对所述语音数据进行识别,具体包 括: 将所述语音数据与存储的所述命令语音数据进行匹配,如果匹配成功,则所述语音数 据为可识别的命令语音数据。6. 根据权利要求5所述的方法,其特征在于,还包括: 接收管理系统下发的更新命令,所述更新命令包括:更新后的命令语音数据以及所述 命令语音数据对应的命令代码; 根据所述更新命令更新存储的所述命令语音数据,以及所述命令语音数据对应的命令 代码。7. -种语音数据识别方法,其特征在于,包括: 接收桌面云客户端通过命令控制信道发送的命令代码,所述命令代码对应可识别的命 令语音数据; 根据所述命令代码确定对应的标准语音数据; 将所述标准语音数据插入到音频重定向数据队列中进行识别。8. 根据权利要求7所述的方法,其特征在于,还包括: 接收桌面云客户端通过数据信道发送的普通语音数据; 对所述普通语音数据进行音频解码,并将解码后的普通语音数据插入所述音频重定向 数据队列中进行识别。9. 根据权利要求7或8所述的方法,其特征在于,还包括: 预先存储配置的所述命令代码,以及所述命令代码对应的标准语音数据。10. 根据权利要求9所述的方法,其特征在于,还包括: 接收管理系统下发的更新命令,所述更新命令包括:更新的命令代码以及所述命令代 码对应的标准语音数据; 根据所述更新命令更新所述命令代码以及所述命令代码对应的标准语音数据。11. 一种语音数据识别方法,其特征在于,包括: 接收桌面云客户端通过命令控制信道发送的命令代码,所述命令代码对应命令语音数 据; 根据所述命令代码调用对应的语音识别软件开发接口识别出所述命令语音数据对应 的语音数据。12. -种语音数据识别装置,其特征在于,包括: 获取单元,用于获取语音数据; 识别单元,用于对所述语音数据进行识别; 确定单元,用于在所述识别单元识别出所述语音数据为命令语音数据时,确定所述命 令语音...

【专利技术属性】
技术研发人员:杜川
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1