语音交互方法、车辆、服务器、语音系统和存储介质技术方案

技术编号:32857969 阅读:11 留言:0更新日期:2022-03-30 19:32
本发明专利技术公开了一种语音交互方法、车辆、服务器、语音系统和存储介质。语音交互方法包括:对语音请求进行语音识别以获得文本信息;利用意图预测模型识别文本信息以判断文本信息是否为泛化地址搜索意图;在文本信息为泛化地址搜索意图的情况下,利用细分意图预测模型识别文本信息的搜索意图类别,搜索意图类别包括第一类搜索意图、第二类搜索意图和第三类搜索意图。上述语音交互方法、车辆、服务器、语音系统和存储介质中,在文本信息为泛化地址搜索意图的情况下,利用细分意图预测模型识别文本信息的搜索意图类别,从而确定文本信息是属于第一类搜索意图、第二类搜索意图还是第三类搜索意图,因此能够准确地识别用户的意图以满足用户的语音请求。的语音请求。的语音请求。

【技术实现步骤摘要】
语音交互方法、车辆、服务器、语音系统和存储介质


[0001]本专利技术涉及语音技术,特别涉及一种语音交互方法、车辆、服务器、语音系统和计算机可读存储介质。

技术介绍

[0002]在相关技术中,语音系统对用户意图的划分不精确,语音系统难以准确识别用户的意图,使得用户的语音需求得不到满足,用户体验较差。

技术实现思路

[0003]本专利技术提供一种语音交互方法、车辆、服务器、语音系统和计算机可读存储介质。
[0004]本专利技术的语音交互方法包括:对语音请求进行语音识别以获得文本信息;利用意图预测模型识别所述文本信息以判断所述文本信息是否为泛化地址搜索意图;在所述文本信息为所述泛化地址搜索意图的情况下,利用细分意图预测模型识别所述文本信息的搜索意图类别,所述搜索意图类别包括第一类搜索意图、第二类搜索意图和第三类搜索意图。
[0005]上述语音交互方法中,先利用意图预测模型识别文本信息以判断文本信息是否为泛化地址搜索意图,在文本信息为泛化地址搜索意图的情况下,利用细分意图预测模型识别文本信息的搜索意图类别,从而确定文本信息是属于第一类搜索意图、第二类搜索意图还是第三类搜索意图,因此能够准确地识别用户的意图以满足用户的语音请求。
[0006]所述语音交互方法包括:收集历史语音请求;对所述历史语音请求进行语音识别以获得历史文本信息,所述历史文本信息包括有效历史文本信息和无效历史文本信息;去除所述无效历史文本信息;利用所述有效历史文本信息对预训练模型进行训练以获得更新模型。
[0007]如此,能够结合用户的历史语音请求和预训练模型得到更新模型,既利用了强大的预训练技术,也贴合了用户的使用习惯,使得更新模型效果更佳。
[0008]所述有效历史文本信息标注有所述泛化地址搜索意图或非泛化地址搜索意图,所述有效历史文本信息包括第一训练集、第一验证集和第一测试集;所述语音交互方法包括:利用所述更新模型、所述第一训练集和所述第一验证集训练第一分类模型以获得所述意图预测模型;利用所述第一测试集测试所述意图预测模型。
[0009]如此,可以利用有效历史文本信息训练获得意图预测模型。
[0010]所述泛化地址搜索意图的有效历史文本信息标注有历史搜索意图类别,所述泛化地址搜索意图的有效历史文本信息包括第二训练集、第二验证集和第二测试集;所述语音交互方法包括:利用所述更新模型、所述第二训练集和所述第二验证集训练第二分类模型以获得所述细分意图预测模型;利用所述第二测试集测试所述细分意图预测模型。
[0011]如此,可以利用泛化地址搜索意图的有效历史文本信息训练获得细分意图预测模型。
[0012]所述文本信息包括有效文本信息和无效文本信息,所述语音交互方法包括:去除
所述无效文本信息;对所述有效文本信息进行校正以得到校正文本信息;所述利用意图预测模型识别所述文本信息以判断所述文本信息是否为泛化地址搜索意图,包括:利用所述意图预测模型识别所述校正文本信息以判断所述校正文本信息是否为所述泛化地址搜索意图。
[0013]如此,能够去除无效文本信息和对有效文本信息进行校正,从而便于后续意图预测模型更加快速、准确地判断用户意图。
[0014]所述利用意图预测模型识别所述文本信息以判断所述文本信息是否为泛化地址搜索意图,包括:利用所述意图预测模型识别所述文本信息以获得所述文本信息为所述泛化地址搜索意图的判别概率;在所述判别概率大于第一预设概率的情况下,确定所述文本信息为所述泛化地址搜索意图;在所述判别概率小于所述第一预设概率的情况下,确定所述文本信息为非泛化地址搜索意图。
[0015]如此,能够通过泛化地址搜索意图的判别概率确定文本信息是否为泛化地址搜索意图。
[0016]所述在所述文本信息为所述泛化地址搜索意图的情况下,利用细分意图预测模型识别所述文本信息的搜索意图类别,包括:在所述文本信息为所述泛化地址搜索意图的情况下,利用细分意图预测模型识别所述文本信息以获得所述文本信息为每种所述搜索意图类别的预测概率;确定所有所述预测概率中的最大预测概率;在所述最大预测概率大于第二预设概率的情况下,确定所述文本信息的搜索意图类别为所述最大预测概率对应的搜索意图类别。
[0017]如此,能够通过搜索意图类别的预测概率确定文本信息的搜索意图类别。
[0018]本专利技术的车辆包括一个或多个处理器和存储器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行的情况下,实现上述任意一种实施方式的语音交互方法的步骤。
[0019]上述车辆中,先利用意图预测模型识别文本信息以判断文本信息是否为泛化地址搜索意图,在文本信息为泛化地址搜索意图的情况下,利用细分意图预测模型识别文本信息的搜索意图类别,从而确定文本信息是属于第一类搜索意图、第二类搜索意图还是第三类搜索意图,因此能够准确地识别用户的意图以满足用户的语音请求。
[0020]本专利技术的服务器包括一个或多个处理器和存储器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行的情况下,实现上述任意一种实施方式的语音交互方法的步骤。
[0021]上述服务器中,先利用意图预测模型识别文本信息以判断文本信息是否为泛化地址搜索意图,在文本信息为泛化地址搜索意图的情况下,利用细分意图预测模型识别文本信息的搜索意图类别,从而确定文本信息是属于第一类搜索意图、第二类搜索意图还是第三类搜索意图,因此能够准确地识别用户的意图以满足用户的语音请求。
[0022]本专利技术的语音系统包括车辆和服务器。所述车辆用于采集语音请求;所述服务器用于:接收所述车辆传输的所述语音请求并对所述语音请求进行语音识别以获得文本信息,利用意图预测模型识别所述文本信息以判断所述文本信息是否为泛化地址搜索意图,在所述文本信息为所述泛化地址搜索意图的情况下,利用细分意图预测模型识别所述文本信息的搜索意图类别,所述搜索意图类别包括第一类搜索意图、第二类搜索意图和第三类
搜索意图。
[0023]上述语音系统中,先利用意图预测模型识别文本信息以判断文本信息是否为泛化地址搜索意图,在文本信息为泛化地址搜索意图的情况下,利用细分意图预测模型识别文本信息的搜索意图类别,从而确定文本信息是属于第一类搜索意图、第二类搜索意图还是第三类搜索意图,因此能够准确地识别用户的意图以满足用户的语音请求。
[0024]本专利技术的计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述任意一种实施方式的语音交互方法。
[0025]上述计算机可读存储介质中,先利用意图预测模型识别文本信息以判断文本信息是否为泛化地址搜索意图,在文本信息为泛化地址搜索意图的情况下,利用细分意图预测模型识别文本信息的搜索意图类别,从而确定文本信息是属于第一类搜索意图、第二类搜索意图还是第三类搜索意图,因此能够准确地识别用户的意图以满足用户的语音请求。
[0026]本专利技术的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本专利技术的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语音交互方法,其特征在于,所述语音交互方法包括:对语音请求进行语音识别以获得文本信息;利用意图预测模型识别所述文本信息以判断所述文本信息是否为泛化地址搜索意图;在所述文本信息为所述泛化地址搜索意图的情况下,利用细分意图预测模型识别所述文本信息的搜索意图类别,所述搜索意图类别包括第一类搜索意图、第二类搜索意图和第三类搜索意图。2.根据权利要求1所述的语音交互方法,其特征在于,所述语音交互方法包括:收集历史语音请求;对所述历史语音请求进行语音识别以获得历史文本信息,所述历史文本信息包括有效历史文本信息和无效历史文本信息;去除所述无效历史文本信息;利用所述有效历史文本信息对预训练模型进行训练以获得更新模型。3.根据权利要求2所述的语音交互方法,其特征在于,所述有效历史文本信息标注有所述泛化地址搜索意图或非泛化地址搜索意图,所述有效历史文本信息包括第一训练集、第一验证集和第一测试集;所述语音交互方法包括:利用所述更新模型、所述第一训练集和所述第一验证集训练第一分类模型以获得所述意图预测模型;利用所述第一测试集测试所述意图预测模型。4.根据权利要求3所述的语音交互方法,其特征在于,所述泛化地址搜索意图的有效历史文本信息标注有历史搜索意图类别,所述泛化地址搜索意图的有效历史文本信息包括第二训练集、第二验证集和第二测试集;所述语音交互方法包括:利用所述更新模型、所述第二训练集和所述第二验证集训练第二分类模型以获得所述细分意图预测模型;利用所述第二测试集测试所述细分意图预测模型。5.根据权利要求1所述的语音交互方法,其特征在于,所述文本信息包括有效文本信息和无效文本信息,所述语音交互方法包括:去除所述无效文本信息;对所述有效文本信息进行校正以得到校正文本信息;所述利用意图预测模型识别所述文本信息以判断所述文本信息是否为泛化地址搜索意图,包括:利用所述意图预测模型识别所述校正文本信息以判断所述校正文本信息是否为所述泛化地址搜索意图。6.根据权利要求1所述的语音交互方法,其特征在于,所述利用意图预测模型识别所述文本信息以判断所述文本信...

【专利技术属性】
技术研发人员:赵群王亭玉潘晓彤赵恒艺陈思云
申请(专利权)人:北京小鹏汽车有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1