一种语音识别方法、装置、服务器和电子设备制造方法及图纸

技术编号:33645415 阅读:27 留言:0更新日期:2022-06-02 20:21
本申请一种语音识别方法、装置、服务器和电子设备,涉及人工智能技术领域,解决了现有技术中电视机在接收到不够明确或者有歧义的语音,电视机无法根据该语音确定出用户的用户意图,之后电视机会默认用户意图为默认意图,导致实际的用户意图的识别率较低的问题。该方法包括:接收电子设备发送的查询信息;在将语音数据输入至dialogFlow模型,确定用户意图为默认default意图的情况下,将语音数据输入至预先配置的文本卷积网络模型中,确定除default意图以外的每个意图的意图得分;确定存在意图得分大于第一阈值的意图时,将包含意图得分大于第一阈值的意图的第一显示信息发送至电子设备。送至电子设备。送至电子设备。

【技术实现步骤摘要】
一种语音识别方法、装置、服务器和电子设备


[0001]本申请涉及人工智能
,具体而言,涉及一种语音识别方法、装置、服务器和电子设备。

技术介绍

[0002]随着语音识别技术的发展,智能语音交互技术逐渐成为终端设备(如手机、平板电脑或智能家电等智能家居产品)的标准配置。在智能语音交互场景下,用户可以通过语音控制智能家电,以终端设备为电视机为例,用户可以通过语音控制电视机,实现看视频、听音乐或查天气等一系列电视控制操作。但是,通常情况下,电视机在接收到不够明确或者有歧义的语音,电视机无法根据该语音确定出用户的用户意图,之后电视机会默认用户意图为默认意图,导致实际的用户意图的识别率较低。

技术实现思路

[0003]本申请提供一种语音识别方法、装置、服务器和电子设备,解决了现有技术中电视机在接收到不够明确或者有歧义的语音,电视机无法根据该语音确定出用户的用户意图,之后电视机会默认用户意图为默认意图,导致实际的用户意图的识别率较低的问题。
[0004]为达到上述目的,本申请采用如下技术方案:
[0005]第一方面、本申请提供一种语音识别方法,包括:接收电子设备发送的查询信息;查询信息包括语音数据;在将语音数据输入至dialogFlow模型,确定用户意图为默认default意图的情况下,将语音数据输入至预先配置的文本卷积网络模型中,确定除default意图以外的每个意图的意图得分;确定存在意图得分大于第一阈值的意图时,将包含意图得分大于第一阈值的意图的第一显示信息发送至电子设备,第一显示信息用于指示电子设备执行意图得分大于第一阈值的意图,并搜索语音数据。
[0006]在一些可实施的示例中,本申请提供的语音识别方法还包括:获取至少一个default意图对应的历史查询数据;历史查询数据包括至少一条查询信息,至少一条查询信息中一条查询信息对应一个default意图;将至少一条查询信息中每条查询信息对应的语音数据输入至文本卷积网络模型中,确定每个default意图对应的最大意图得分,以及最大意图得分对应的意图;根据每个default意图对应的最大意图得分,以及最大意图得分对应的意图,确定第一阈值和第二阈值。
[0007]在一些可实施的示例中,本申请提供的语音识别方法还包括:在意图得分均小于或等于第一阈值的情况下,确定意图得分大于或等于第二阈值的意图;将包含意图得分大于或等于第二阈值的意图的第二显示信息发送至电子设备,第二显示信息用于指示电子设备显示意图得分大于或等于第二阈值的意图。
[0008]在一些可实施的示例中,本申请提供的语音识别方法还包括:确定意图得分均小于第二阈值的情况下,将包含default意图的第三显示信息发送至电子设备,第三显示信息用于指示电子设备执行default意图,并搜索语音数据。
[0009]在一些可实施的示例中,查询信息还包括国际语言代码;将语音数据输入至预先配置的文本卷积网络模型中,确定除default意图以外的每个意图的意图得分,包括:在国际语言代码对应的语言为目标语言的情况下,对语音数据进行字分类预处理,确定第一分类数据;其中,目标语言包括汉语、泰语和日语中的一项或者多项。将第一分类数据输入至预先配置的文本卷积网络模型中,确定除default意图以外的每个意图的意图得分。
[0010]在一些可实施的示例中,查询信息还包括国际语言代码;将语音数据输入至预先配置的文本卷积网络模型中,确定除default意图以外的每个意图的意图得分,包括:在国际语言代码对应的语言不是目标语言的情况下,对语音数据进行词分类预处理,确定第二分类数据;其中,目标语言包括汉语、泰语和日语中的一项或者多项。将第二分类数据输入至预先配置的文本卷积网络模型中,确定除default意图以外的每个意图的意图得分。
[0011]在一些可实施的示例中,文本卷积网络模型的训练过程如下:获取训练语句和训练语句的标记结果;其中,训练语句包括语音数据和意图;将训练语句输入至神经网络模型中;基于目标损失函数,确定神经网络模型输出的训练语句的预测结果与标记结果是否匹配;在预测结果与标记结果不匹配的情况下,循环迭代神经网络模型的配置参数,直至神经网络模型收敛,得到文本卷积网络模型。
[0012]在一些可实施的示例中,本申请提供的语音识别方法还包括:将语音数据输入至预先配置的文本卷积网络模型中,确定除default意图以外的每个意图的置信度;根据置信度,确定除default意图以外的每个意图对应的意图得分。
[0013]在一些可实施的示例中,本申请提供的语音识别方法还包括:获取除default意图以外的每个意图归属的意图类别的使用频率;根据使用频率,确定每个意图类别对应的意图系数;将语音数据输入至预先配置的文本卷积网络模型中,确定除default意图以外的每个意图的置信度;根据置信度和每个意图类别对应的意图系数,确定除default意图以外的每个意图对应的意图得分。
[0014]第二方面、本申请提供一种语音识别方法,应用于电子设备,包括:向服务器发送查询信息;查询信息包括语音数据;接收服务器发送的包含意图得分大于第一阈值的意图的第一显示信息;根据第一显示信息,执行意图得分大于第一阈值的意图,并搜索语音数据;显示执行意图得分大于第一阈值的意图,并搜索语音数据的搜索结果。
[0015]在一些可实施的示例中,本申请提供的语音识别方法还包括:接收服务器发送的包含意图得分大于或等于第二阈值的意图的第二显示信息;根据第二显示信息,显示意图得分大于或等于第二阈值的意图。
[0016]在一些可实施的示例中,根据第二显示信息,显示意图得分大于或等于第二阈值的意图,包括:根据第二显示信息,按照从大到小的顺序对意图得分进行排序,确定意图得分大于或等于第二阈值的每个意图的显示顺序;根据显示顺序,显示意图得分大于或等于第二阈值的意图。
[0017]在一些可实施的示例中,本申请提供的语音识别方法还包括:接收服务器发送的包含default意图的第三显示信息;根据第三显示信息,执行default意图,并搜索语音数据。
[0018]第三方面、本申请提供一种语音识别装置,包括:收发单元,用于接收电子设备发送的查询信息;查询信息包括语音数据;处理单元,用于在将收到单元接收的语音数据输入
至dialogFlow模型,确定用户意图为默认default意图的情况下,将语音数据输入至预先配置的文本卷积网络模型中,确定除default意图以外的每个意图的意图得分;处理单元,还用于确定存在意图得分大于第一阈值的意图时,控制收发单元将包含意图得分大于第一阈值的意图的第一显示信息发送至电子设备,第一显示信息用于指示电子设备执行意图得分大于第一阈值的意图,并搜索语音数据。
[0019]在一些可实施的示例中,收发单元,还用于获取至少一个default意图对应的历史查询数据;历史查询数据包括至少一条查询信息,至少一条查询信息中一条查询信息对应一个default意图;处理单元,还用于将收发单元获取的至本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语音识别方法,其特征在于,包括:接收电子设备发送的查询信息;所述查询信息包括语音数据;在将所述语音数据输入至dialogFlow模型,确定用户意图为默认default意图的情况下,将所述语音数据输入至预先配置的文本卷积网络模型中,确定除所述default意图以外的每个意图的意图得分;确定存在意图得分大于第一阈值的意图时,将包含所述意图得分大于第一阈值的意图的第一显示信息发送至所述电子设备,所述第一显示信息用于指示所述电子设备执行所述意图得分大于第一阈值的意图,并搜索所述语音数据。2.根据权利要求1所述的语音识别方法,其特征在于,所述语音识别方法还包括:获取至少一个default意图对应的历史查询数据;所述历史查询数据包括至少一条查询信息,所述至少一条查询信息中一条查询信息对应一个default意图;将所述至少一条查询信息中每条查询信息对应的语音数据输入至所述文本卷积网络模型中,确定每个所述default意图对应的最大意图得分,以及所述最大意图得分对应的意图;根据每个所述default意图对应的最大意图得分,以及所述最大意图得分对应的意图,确定所述第一阈值和所述第二阈值。3.根据权利要求1所述的语音识别方法,其特征在于,所述语音识别方法还包括:在所述意图得分均小于或等于所述第一阈值的情况下,确定意图得分大于或等于第二阈值的意图;将包含所述意图得分大于或等于第二阈值的意图的第二显示信息发送至所述电子设备,所述第二显示信息用于指示所述电子设备显示所述意图得分大于或等于第二阈值的意图。4.根据权利要求1所述的语音识别方法,其特征在于,所述语音识别方法还包括:确定所述意图得分均小于第二阈值的情况下,将包含所述default意图的第三显示信息发送至所述电子设备,所述第三显示信息用于指示所述电子设备执行所述default意图,并搜索所述语音数据。5.根据权利要求1所述的语音识别方法,其特征在于,所述查询信息还包括国际语言代码;所述将所述语音数据输入至预先配置的文本卷积网络模型中,确定除所述default意图以外的每个意图的意图得分,包括:在所述国际语言代码对应的语言为目标语言的情况下,对所述语音数据进行字分类预处理,确定第一分类数据;其中,所述目标语言包括汉语、泰语和日语中的一项或者多项;将所述第一分类数据输入至预先配置的文本卷积网络模型中,确定除所述default意图以外的每个意图的意图得...

【专利技术属性】
技术研发人员:张琴
申请(专利权)人:海信视像科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1