本申请提供一种显示设备及多类别指令响应方法,所述方法通过响应用户输入的语音指令,将所述语音指令输入至指令分类模型,以获取语音指令中的token,token赋予有与所述显示设备的领域相关的权重值。指令分类模型根据权重值输出语音指令的类别概率,以确定指令类别。若指令类别为功能指令,根据功能指令的语言理解结果生成第一用户界面,若指令类别为标题指令,则以标题指令为关键词搜索媒资,以生成第二用户界面。所述方法通过对语音指令中的token进行识别,以输出语音指令为功能指令的概率,从而可响应语音应用理解范围外的功能指令,提高语音指令的识别分类准确性。
【技术实现步骤摘要】
本申请涉及显示设备,尤其涉及一种显示设备及多类别指令响应方法。
技术介绍
1、语音应用是一种集成在显示设备上的人工智能技术,用户可以通过向语音应用发送语音指令,其中,语音指令包括功能指令和标题指令,功能指令如调节音量、查询天气等,可以控制显示设备执行对应的功能操作。标题指令即为所要搜索的媒资数据的名称,例如影音名称等,显示设备可以将影音名称作为关键词搜索对应的媒资数据,并控制显示设备播放。
2、语音应用可以通过指令分类模型判断语音指令的类型。由于指令分类模型的理解范围有限,当用户输入理解范围外的功能指令时,指令分类模型无法理解该功能指令,因此会将上述功能指令误判断为标题指令,降低语音识别的准确性。
技术实现思路
1、本申请部分实施例提供一种显示设备及多类别指令响应方法,以提高语音指令识别分类的准确性。
2、第一方面,本申请部分实施例提供一种显示设备,所述显示设备包括显示器、存储器和控制器,所述显示器被配置为显示用户界面,所述存储器存储有指令分类模型和语言理解模型,所述指令分类模型被配置为输出语音指令的指令类别,所述指令类别包括功能指令和标题指令;控制器,被配置为;
3、响应于用户输入的语音指令,将所述语音指令输入至指令分类模型,以获取语音指令中的token,所述token赋予有与所述显示设备的领域相关的权重值,所述权重值与所述语音指令的领域相关度呈正比例关系;
4、通过所述指令分类模型根据所述权重值输出所述语音指令的类别概率;
5、根据所述类别概率确定所述语音指令的指令类别;
6、若所述指令类别为功能指令,则通过所述语言理解模型获取所述功能指令的语言理解结果,以及,控制显示器显示第一用户界面,所述第一用户界面为根据所述语言理解结果生成的用户界面;
7、若所述指令类别为标题指令,则以所述标题指令为关键词执行媒资搜索,以得到媒资搜索结果,以及,控制所述显示器显示第二用户界面,所述第二用户界面为根据媒资搜索结果生成的用户界面。
8、在一些实施例中,所述控制器执行将所述语音指令输入所述指令分类模型前,还被配置为:
9、获取样本指令,所述样本指令包括预设比例的样本功能指令和样本标题指令;
10、将所述样本功能指令和所述样本标题指令输入所述指令分类模型,以得到样本编码,以及,对样本编码执行池化,得到池化结果;
11、通过指令分类模型的全连接层输出所述池化结果的训练类别概率;
12、计算所述训练类别概率与指令标签之间的第一分类损失,所述指令标签包括功能指令标签和标题指令标签;
13、当所述第一分类损失小于或等于分类损失阈值时,输出所述指令分类模型的当前参数。
14、在一些实施例中,语言理解模型包括语义向量层和二分类支路网络,所述语义向量层连接所述二分类支路网络,所述控制器还被配置为:
15、将所述样本功能指令和所述样本标题指令输入所述语言理解模型,获取所述二分类支路网络输出的训练类别概率;
16、计算所述训练类别概率与指令标签之间的第二分类损失,以及,计算所述语言理解模型的第一语义损失;
17、当所述第二分类损失小于或等于分类损失阈值,且所述第一语义损失小于或等于语义损失阈值时,输出所述二分类支路网络的当前参数。
18、在一些实施例中,所述控制器执行通过所述指令分类模型根据所述权重值输出所述语音指令的类别概率,被配置为:
19、对所述语音指令执行分词,得到指令词汇;
20、根据所述权重值与标准值执行加权平均运算,以输出所述类别概率;当所述指令词汇包括至少一个所述token时,所述标准值输出为1;当所述指令词汇不包括所述token时,所述标准值输出为0。
21、在一些实施例中,所述控制器还被配置为:
22、建立拟合指令集,所述拟合指令集为已响应的历史语音指令集合,所述拟合指令集包括相同数量的历史功能指令和历史标题指令;
23、通过所述指令分类模型分别对所述历史功能指令和所述历史标题指令执行相关度评分,以得到评分标量;
24、根据所述历史功能指令和所述历史标题指令建立标准值向量;
25、根据所述标准值向量和所述评分标量拟合计算所述token的权重值。
26、在一些实施例中,所述控制器执行根据所述类别概率确定所述语音指令的指令类别,被配置为:
27、设置第一阈值和第二阈值,所述第一阈值小于1且大于所述第二阈值,所述第二阈值大于0;
28、将所述类别概率大于所述第一阈值且小于1的语音指令标记为所述功能指令,以及,将所述类别概率小于所述第二阈值且大于0的语音指令标记为所述标题指令。
29、在一些实施例中,当所述类别概率小于或等于所述第一阈值,且大于或等于所述第二阈值时,所述控制器还被配置为:
30、根据所述类别概率生成提示窗口,所述提示窗口包括提示项;
31、获取用户基于所述提示项输入的类别确定指令,所述类别确定指令包括功能信息或标题信息;
32、若所述类别确定指令包括功能信息,则生成所述第一用户界面;
33、若所述类别确定指令包括标题信息,则生成所述第二用户界面。
34、在一些实施例中,若所述类别确定信息为标题信息,所述控制器还被配置为:
35、对所述语音指令执行转文本,以生成标题文本;
36、将所述标题文本存储至标题数据库,所述标题数据库用于存储所述显示设备搜索范围内的标题信息。
37、在一些实施例中,所述控制器执行将所述语音指令输入至指令分类模型前,还被配置为:
38、根据所述语音指令在标题数据库中检索目标标题,以获取标题相似度;
39、若所述标题相似度大于或等于相似度阈值,则以所述目标标题为关键词执行媒资检索,以及,根据媒资检索结果生成第二用户界面。
40、第二方面,本申请部分实施例提供一种多类别指令响应方法,应用于第一方面所述的显示设备,所述方法包括:
41、响应于用户输入的语音指令,将所述语音指令输入至指令分类模型,以获取语音指令中的token,所述token赋予有与所述显示设备的领域相关的权重值,所述权重值与所述语音指令的领域相关度呈正比例关系;
42、通过所述指令分类模型根据所述权重值输出所述语音指令的类别概率;
43、根据所述类别概率确定所述语音指令的指令类别;
44、若所述指令类别为功能指令,则通过所述语言理解模型获取所述功能指令的语言理解结果,以及,控制显示器显示第一用户界面,所述第一用户界面为根据所述语言理解结果生成的用户界面;
45、若所述指令类别为标题指令,则以所述标题指令为关键词执行媒资搜索,以得到媒资搜索结果,以及,控制所述显示器显示第二用户界面,所述第二用户界面为根据媒本文档来自技高网
...
【技术保护点】
1.一种显示设备,其特征在于,包括:
2.根据权利要求1所述的显示设备,其特征在于,所述控制器执行将所述语音指令输入所述指令分类模型前,还被配置为:
3.根据权利要求2所述的显示设备,其特征在于,语言理解模型包括语义向量层和二分类支路网络,所述语义向量层连接所述二分类支路网络,所述控制器还被配置为:
4.根据权利要求1所述的显示设备,其特征在于,所述控制器执行通过所述指令分类模型根据所述权重值输出所述语音指令的类别概率,被配置为:
5.根据权利要求4所述的显示设备,其特征在于,所述控制器还被配置为:
6.根据权利要求1所述的显示设备,其特征在于,所述控制器执行根据所述类别概率确定所述语音指令的指令类别,被配置为:
7.根据权利要求6所述的显示设备,其特征在于,当所述类别概率小于或等于所述第一阈值,且大于或等于所述第二阈值时,所述控制器还被配置为:
8.根据权利要求7所述的显示设备,其特征在于,若所述类别确定信息为标题信息,所述控制器还被配置为:
9.根据权利要求1所述的显示设备,其特征在于,所述控制器执行将所述语音指令输入至指令分类模型前,还被配置为:
10.一种多类别指令响应方法,其特征在于,应用于权利要求1-9任一项所述的显示设备,所述显示设备包括显示器、存储器和控制器,所述显示器被配置为显示用户界面,所述存储器存储有指令分类模型和语言理解模型,所述指令分类模型被配置为输出语音指令的指令类别,所述指令类别包括功能指令和标题指令;所述方法包括:
...
【技术特征摘要】
1.一种显示设备,其特征在于,包括:
2.根据权利要求1所述的显示设备,其特征在于,所述控制器执行将所述语音指令输入所述指令分类模型前,还被配置为:
3.根据权利要求2所述的显示设备,其特征在于,语言理解模型包括语义向量层和二分类支路网络,所述语义向量层连接所述二分类支路网络,所述控制器还被配置为:
4.根据权利要求1所述的显示设备,其特征在于,所述控制器执行通过所述指令分类模型根据所述权重值输出所述语音指令的类别概率,被配置为:
5.根据权利要求4所述的显示设备,其特征在于,所述控制器还被配置为:
6.根据权利要求1所述的显示设备,其特征在于,所述控制器执行根据所述类别概率确定所述语音指令的指令类别,被配置为:
...
【专利技术属性】
技术研发人员:陈楚林,朱飞,
申请(专利权)人:VIDAA国际控股荷兰公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。