System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于语音识别的设备控制方法、系统、设备及存储介质技术方案_技高网

基于语音识别的设备控制方法、系统、设备及存储介质技术方案

技术编号:42641464 阅读:15 留言:0更新日期:2024-09-06 01:38
本申请揭示了一种基于语音识别的设备控制方法、系统、设备及存储介质,其中方法包括:在所述目标设备的工作模式为离线识别模式时,获取目标语音特征,其中,所述目标语音特征是所述语音芯片或者移动终端基于第一语音数据提取得到的语音特征,所述第一语音数据是用户通过所述目标设备或者所述移动终端输入的语音数据;根据所述目标语音特征,在所述目标设备的本地存储空间中的语音特征库中匹配语音特征,得到第一匹配结果;根据所述第一匹配结果生成第一指令集,所述目标设备通过所述设备控制指令控制与所述设备控制指令对应的可控设备。从而提高了语音控制设备的准确度。

【技术实现步骤摘要】

本专利技术涉及语音处理,尤其涉及一种基于语音识别的设备控制方法、系统、设备及存储介质


技术介绍

1、基于语音控制设备,因简化了用户的操作,从而在智慧生活、智能家居和智能驾驶等场景得到广泛的应用。目前采用语音芯片进行语音转文本实现基于语音控制设备,因语音芯片的本地资源受限,识别模型支持的词条较少,识别精准度较低,导致语音控制设备的准确度较低。


技术实现思路

1、基于此,有必要针对现有技术的采用语音芯片进行语音转文本实现基于语音控制设备,因语音芯片的本地资源受限,识别模型支持的词条较少,识别精准度较低,导致语音控制设备的准确度较低的技术问题,提出了一种基于语音识别的设备控制方法、系统、设备及存储介质。

2、第一方面,提供了一种基于语音识别的设备控制方法,所述方法应用于目标设备,所述目标设备包括语音芯片,所述方法包括:

3、在所述目标设备的工作模式为离线识别模式时,获取目标语音特征,其中,所述目标语音特征是所述语音芯片或者移动终端基于第一语音数据提取得到的语音特征,所述第一语音数据是用户通过所述目标设备或者所述移动终端输入的语音数据;

4、根据所述目标语音特征,在所述目标设备的本地存储空间中的语音特征库中匹配语音特征,得到第一匹配结果;

5、根据所述第一匹配结果生成第一指令集,其中,所述第一指令集包括唤醒指令、回复指令和设备控制指令中的一种或多种,所述目标设备通过所述设备控制指令控制与所述设备控制指令对应的可控设备。

6、进一步地,所述方法还包括:

7、获取第一待更数据,其中,所述第一待更数据包括功能标识和语音特征;

8、根据所述第一待更数据,更新所述语音特征库;

9、其中,所述第一待更数据中的所述功能标识是用户通过所述移动终端输入的数据,所述第一待更数据中的所述语音特征是所述语音芯片或者所述移动终端基于学习语音数据提取得到的语音特征。

10、进一步地,所述方法还包括:

11、获取所述目标设备与云端平台的联网状态;

12、若所述联网状态为联网,则将所述工作模式确定为离在线识别模式;

13、若所述联网状态为未联网,则将所述工作模式确定为所述离线识别模式;

14、在所述工作模式为所述离在线识别模式时,获取目标文本,其中,所述目标文本是所述云端平台基于tts技术将第二语音数据转换得到的文本,所述第二语音数据是用户通过所述目标设备或所述移动终端输入的语音数据;

15、获取第二匹配结果,其中,所述第二匹配结果是通过执行设备根据所述目标文本在所述执行设备中的文本库中匹配文本得到的数据,所述执行设备是所述目标设备、所述移动终端和所述云端平台中的任一种;

16、根据所述第二匹配结果生成第二指令集,其中,所述第二指令集包括唤醒指令、回复指令和设备控制指令中的一种或多种。

17、进一步地,所述方法还包括:

18、获取第二待更数据,其中,所述第二待更数据包括功能标识和描述文本;

19、根据所述第二待更数据,更新所述目标设备的本地存储空间中的文本库;

20、其中,所述第二匹配结果是通过所述目标设备根据所述目标文本在所述目标设备中的所述文本库中匹配文本得到的数据。

21、进一步地,所述方法还包括:

22、获取云端平台发送的第三语音数据,其中,所述第三语音数据是所述云端平台根据第一信息合成的音频数据,所述第一信息是用户通过所述目标设备或所述移动终端输入的信息,所述第一信息包括:音色参数、音速参数、音量参数和待合成文本;

23、将所述第三语音数据存储在所述目标设备的所述本地存储空间中,其中,所述目标设备的所述本地存储空间中的所述第三语音数据用于响应所述回复指令。

24、进一步地,所述方法还包括:

25、获取下载请求;

26、根据所述下载请求,从第一平台获取第四语音数据,其中,所述第四语音数据是云端平台根据第二信息合成的音频数据,所述第二信息是用户通过第二平台输入的信息,所述第二信息包括:音色参数、音速参数、音量参数和待合成文本;

27、将所述第四语音数据存储在所述目标设备的所述本地存储空间中,其中,所述目标设备的所述本地存储空间中的所述第四语音数据用于响应所述回复指令。

28、进一步地,所述第一语音数据是人或动物的语音数据。

29、第二方面,提供了一种基于语音识别的设备控制系统,所述系统包括:目标设备和移动终端,所述目标设备和所述移动终端通信连接,所述目标设备包括:语音芯片,所述目标设备被配置为实现第一方面任一项所述基于语音识别的设备控制方法的步骤。

30、第三方面,提供了一种目标设备,所述目标设备包括语音芯片、存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述语音芯片与处理器通信连接,所述处理器执行所述计算机程序时实现第一方面任一项所述基于语音识别的设备控制方法的步骤。

31、第四方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述基于语音识别的设备控制方法的步骤。

32、本申请的基于语音识别的设备控制方法、系统、设备及存储介质,通过在所述目标设备的工作模式为离线识别模式时,获取目标语音特征,其中,所述目标语音特征是所述语音芯片或者移动终端基于第一语音数据提取得到的语音特征,所述第一语音数据是用户通过所述目标设备或者所述移动终端输入的语音数据;根据所述目标语音特征,在所述目标设备的本地存储空间中的语音特征库中匹配语音特征,得到第一匹配结果;根据所述第一匹配结果生成第一指令集,其中,所述第一指令集包括唤醒指令、回复指令和设备控制指令中的一种或多种,所述目标设备通过所述设备控制指令控制与所述设备控制指令对应的可控设备。现有的采用语音芯片进行语音转文本实现基于语音控制设备,而本申请通过提取语音特征和基于语音特征进行设备控制,在语音芯片的本地资源受限的情况下,提取语音特征的模型比语音转文本的模型能识别的语音更多,识别的准确度更高,提高了语音控制设备的准确度;另外,本申请基于提取的语音特征控制设备,使不管什么语种的语音数据均可作为第一语音数据,从而使本申请适用于任意语种、同时存在多语种的应用场景。

本文档来自技高网...

【技术保护点】

1.一种基于语音识别的设备控制方法,其特征在于,所述方法应用于目标设备,所述目标设备包括语音芯片,所述方法包括:

2.根据权利要求1所述的基于语音识别的设备控制方法,其特征在于,所述方法还包括:

3.根据权利要求1所述的基于语音识别的设备控制方法,其特征在于,所述方法还包括:

4.根据权利要求3所述的基于语音识别的设备控制方法,其特征在于,所述方法还包括:

5.根据权利要求1所述的基于语音识别的设备控制方法,其特征在于,所述方法还包括:

6.根据权利要求1所述的基于语音识别的设备控制方法,其特征在于,所述方法还包括:

7.根据权利要求1所述的基于语音识别的设备控制方法,其特征在于,所述第一语音数据是人或动物的语音数据。

8.一种基于语音识别的设备控制系统,其特征在于,所述系统包括:目标设备和移动终端,所述目标设备和所述移动终端通信连接,所述目标设备包括:语音芯片,所述目标设备被配置为实现权利要求1至7任一项所述基于语音识别的设备控制方法的步骤。

9.一种目标设备,其特征在于,所述目标设备包括语音芯片、存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述语音芯片与处理器通信连接,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述基于语音识别的设备控制方法的步骤。

10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述基于语音识别的设备控制方法的步骤。

...

【技术特征摘要】

1.一种基于语音识别的设备控制方法,其特征在于,所述方法应用于目标设备,所述目标设备包括语音芯片,所述方法包括:

2.根据权利要求1所述的基于语音识别的设备控制方法,其特征在于,所述方法还包括:

3.根据权利要求1所述的基于语音识别的设备控制方法,其特征在于,所述方法还包括:

4.根据权利要求3所述的基于语音识别的设备控制方法,其特征在于,所述方法还包括:

5.根据权利要求1所述的基于语音识别的设备控制方法,其特征在于,所述方法还包括:

6.根据权利要求1所述的基于语音识别的设备控制方法,其特征在于,所述方法还包括:

7.根据权利要求1所述的基于语音识别的设备控制方法,其特征在于,所述第一语音数据是人或动物的语音数据。...

【专利技术属性】
技术研发人员:李国军李义平周翌张加虎
申请(专利权)人:深圳唯创知音电子有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1