语音交互方法、服务器和存储介质技术

技术编号:34967134 阅读:13 留言:0更新日期:2022-09-17 12:48
本发明专利技术公开了一种语音交互方法、服务器和存储介质。该语音交互方法包括:接收车辆转发的用户语音请求以进行实体抽取;从预设知识库中获取预先建立的特定实体类型和预设字符的映射关系;根据映射关系,将语音请求中抽取得到的实体替换为相应的预设字符以进行断句与改写处理;根据断句与改写处理结果生成目标语音请求;根据目标语音请求生成控制指令下发至车辆完成语音交互。本发明专利技术的语音交互方法、服务器和存储介质可以对语音请求进行断句与改写处理直接输出断句与改写处理结果,保证断句后的子句具有完整的语义。此外,本发明专利技术还进行了灵活的知识注入,可以避免特定领域词汇的错误改写及错误断句。误改写及错误断句。误改写及错误断句。

【技术实现步骤摘要】
语音交互方法、服务器和存储介质


[0001]本专利技术涉及车辆
,特别涉及一种语音交互方法、服务器和存储介质。

技术介绍

[0002]当前车载场景下存在大量复合连续指令,且复合连续指令中存在指代不明的情况。另外,在半开放域和开放域下,一些特定的知识信息会造成语义混淆,例如《我和你》是一首歌曲的名字,但在断句和改写场景下,“和”是模型判断是否改写或断句的强特征,可能会无法正确识别该歌曲名而得到错误断句和相应的车辆控制指令。

技术实现思路

[0003]本专利技术实施方式提供一种语音交互方法、服务器和存储介质。
[0004]本专利技术实施方式提供一种语音交互方法。所述语音交互方法包括:接收车辆转发的用户语音请求以进行实体抽取;从预设知识库中获取预先建立的特定实体类型和预设字符的映射关系;根据所述映射关系,将所述语音请求中抽取得到的实体替换为相应的预设字符以进行断句与改写处理;根据断句与改写处理结果生成目标语音请求;根据所述目标语音请求生成控制指令下发至车辆完成语音交互。
[0005]如此,本专利技术的语音交互方法可以对语音请求进行断句与改写处理直接输出断句与改写处理结果,保证断句后的子句具有完整的语义。此外,本专利技术还进行了灵活的知识注入,可以避免特定领域词汇的错误改写及错误断句。
[0006]所述根据所述映射关系,将所述语音请求中抽取得到的实体替换为相应的预设字符以进行断句与改写处理,包括:根据所述映射关系,将所述语音请求中抽取得到的实体替换为相应的预设字符以处理得到预处理分词;根据所述预处理分词生成嵌入特征向量;根据所述嵌入特征向量计算注意力特征得到特征矩阵;将所述特征矩阵转换为二维映射图;解码所述二维映射图得到所述断句与改写处理结果。
[0007]如此,本专利技术可以先通过知识注入层对语音请求进行处理得到预处理分词,根据预处理分词输入嵌入层生成嵌入特征向量,然后将嵌入特征向量输入注意力层得到特征矩阵,之后将特征矩阵输入至语义分割层将特征矩阵转换为二维映射图,通过解码层解码二维映射图,得到断句与改写处理结果,即,本专利技术通过语音处理模型可以直接输出断句与改写的结果,保证断句后的子句具有完整的语义。
[0008]所述根据所述映射关系,将所述语音请求中抽取得到的实体替换为相应的预设字符以处理得到预处理分词,包括:对所述语音请求进行实体抽取;在所述语音请求中抽取得到的实体与所述预设知识库中的特定实体相匹配的情况下,根据匹配的特定实体的类型和所述映射关系,将所述语音请求中抽取得到的实体替换为对应的所述预设字符;在替换后的所述语音请求句首和句尾分别添加断句字符和结束字符,并进行词法扫描处理得到所述预处理分词。
[0009]如此,本专利技术通过语音处理模型的知识注入层对用户输入的语音请求进行处理得
到预处理分词,为后续通过语音处理模型进行断句与改写处理奠定基础。
[0010]所述根据所述预处理分词生成嵌入特征向量,包括:截取所述预处理分词中所述结束字符之前的字符,以生成替换句及相应的第一嵌入特征向量;截取所述预处理分词中所述断句字符之后的字符,以生成被替换句及相应的第二嵌入特征向量。
[0011]如此,本专利技术可以基于预处理分词截取不同的字符生成替换句和被替换句,从而生成第一嵌入特征向量和第二嵌入特征向量。
[0012]所述根据所述嵌入特征向量计算注意力特征得到特征矩阵,包括:对所述第一嵌入特征向量和第二嵌入特征向量采用多个预设算法分别计算得到多个注意力特征;将多个所述注意力特征拼接生成所述特征矩阵。
[0013]如此,在语音处理模型中的embedding层得到嵌入特征向量后,通过使用多种注意力计算方法计算得到多个注意力特征,并将多个注意力特征拼接生成特征矩阵,可以丰富语音处理模型的特征抽取,提高语音处理模型的精度。
[0014]所述将所述特征矩阵转换为二维映射图,包括:将所述替换句与所述特征矩阵的纵轴对应关联,且将所述被替换句与所述特征矩阵的横轴对应关联,得到所述二维映射图。
[0015]如此,可以将特征矩阵转换为二维映射图,从而为后续解码二维映射图得到断句与改写处理结果奠定基础。
[0016]所述解码所述二维映射图得到所述断句与改写处理结果,包括:遍历所述二维映射图,根据所述二维映射图中的第一操作字符,将横轴对应所述被替换句的字符替换为纵轴对应所述替换句的字符;遍历所述二维映射图完成后,根据替换后的横轴对应所述被替换句的字符生成所述断句与改写处理结果。
[0017]如此,可以通过遍历二维映射图进行解码二维映射图得到断句与改写处理结果。
[0018]所述遍历所述二维映射图完成后,根据替换后的横轴对应所述被替换句的字符生成所述断句与改写处理结果,包括:在处理后的横轴对应所述被替换句的字符中,将所述预设字符替换为所述语音请求中抽取得到的实体得到所述断句与改写处理结果。
[0019]如此,通过将预设字符替换为语音请求中抽取得到的实体,可以得到语义清楚地断句与改写处理结果,保证断句的各个子句具有准确完整的语义,确保子句正确执行。
[0020]所述解码所述二维映射图得到所述断句与改写处理结果,包括:遍历所述二维映射图,根据所述二维映射图中的第二操作字符,在横轴对应所述被替换句的字符前增加纵轴对应所述替换句的字符以改写所述横轴对应所述被替换句的字符;遍历所述二维映射图完成后,根据改写后的横轴对应所述被替换句的字符生成所述改写结果。
[0021]如此,可以通过遍历二维映射图进行解码二维映射图得到断句与改写处理结果。
[0022]所述根据所述映射关系,将所述语音请求中抽取得到的实体替换为相应的预设字符以进行断句与改写处理,包括:利用语音处理模型和所述映射关系,将所述语音请求中抽取得到的实体替换为相应的预设字符以进行断句与改写处理;其中,所述语音处理模型通过以下步骤训练得到:获取训练语音请求并进行实体抽取;根据特定实体建立所述预设知识库以确定所述映射关系;通过预设模型和所述映射关系将所述训练语音请求中抽取的特定实体替换为相应的预设字符以进行断句与改写训练;根据断句与改写训练结果计算所述预设模型的损失值;根据所述预设模型的损失值调节所述预设模型的参数,以得到所述语音处理模型。
[0023]如此,本专利技术通过语音处理模型可以直接输出断句与改写的结果,保证断句后的子句具有完整的语义。
[0024]所述通过预设模型和所述映射关系将所述训练语音请求中的特定实体替换为相应的预设字符以进行断句与改写训练,包括:根据所述映射关系将所述训练语音请求中抽取的特定实体替换为相应的预设字符以处理得到训练预处理分词;根据所述训练预处理分词生成训练嵌入特征向量;根据所述训练嵌入特征向量计算训练注意力特征得到训练特征矩阵;将所述训练特征矩阵转换为训练二维映射图;解码所述训练二维映射图得到所述断句与改写训练结果。
[0025]如此,本专利技术的语音交互方法可以基于知识注入对预设模型进行断句与改写训练得到断句与改写训练结果,从而训练得到语音处理本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语音交互方法,其特征在于,包括:接收车辆转发的用户语音请求以进行实体抽取;从预设知识库中获取预先建立的特定实体类型和预设字符的映射关系;根据所述映射关系,将所述语音请求中抽取得到的实体替换为相应的预设字符以进行断句与改写处理;根据断句与改写处理结果生成目标语音请求;根据所述目标语音请求生成控制指令下发至车辆完成语音交互。2.根据权利要求1所述的语音交互方法,其特征在于,所述根据所述映射关系,将所述语音请求中抽取得到的实体替换为相应的预设字符以进行断句与改写处理,包括:根据所述映射关系,将所述语音请求中抽取得到的实体替换为相应的预设字符以处理得到预处理分词;根据所述预处理分词生成嵌入特征向量;根据所述嵌入特征向量计算注意力特征得到特征矩阵;将所述特征矩阵转换为二维映射图;解码所述二维映射图得到所述断句与改写处理结果。3.根据权利要求2所述的语音交互方法,其特征在于,所述根据所述映射关系,将所述语音请求中抽取得到的实体替换为相应的预设字符以处理得到预处理分词,包括:对所述语音请求进行实体抽取;在所述语音请求中抽取得到的实体与所述预设知识库中的特定实体相匹配的情况下,根据匹配的特定实体的类型和所述映射关系,将所述语音请求中抽取得到的实体替换为对应的所述预设字符;在替换后的所述语音请求句首和句尾分别添加断句字符和结束字符,并进行词法扫描处理得到所述预处理分词。4.根据权利要求3所述的语音交互方法,其特征在于,所述根据所述预处理分词生成嵌入特征向量,包括:截取所述预处理分词中所述结束字符之前的字符,以生成替换句及相应的第一嵌入特征向量;截取所述预处理分词中所述断句字符之后的字符,以生成被替换句及相应的第二嵌入特征向量。5.根据权利要求4所述的语音交互方法,其特征在于,所述根据所述嵌入特征向量计算注意力特征得到特征矩阵,包括:对所述第一嵌入特征向量和第二嵌入特征向量采用多个预设算法分别计算得到多个注意力特征;将多个所述注意力特征拼接生成所述特征矩阵。6.根据权利要求4所述的语音交互方法,其特征在于,所述将所述特征矩阵转换为二维映射图,包括:将所述替换句与所述特征矩阵的纵轴对应关联,且将所述被替换句与所述特征矩阵的横轴对应关联,得到所述二维映射图。7.根据权利要求6所述的语音交互方法,其特征在于,所述解码所述二维映射图得到所
述断句与改写处理结果,包括:遍历所述二维映射图,根据所述二维映射图中的第一操作字符,将横轴对应所述被替换句的字符替换为纵轴对应所述替换句的字符;遍历所述二维映射图完成后,根据替换后的横轴对应所述被替换句的字符生成所述断句与改写处理结果。8.根据权利要求7所述的语音交互方法,其特征在于,所述遍历所述二维映射图完成后,根据替换后的横轴对应所述被替换句的字符生成所述断句与改写处理结果,包括:在处理后的横轴对应所述被替换句的字符中,将所述预设字符替换为所述语音请求中抽取得到的实体得到所述断句与改写处理结果。9.根据权利要求6所述的语音交互方法,其特征在于,所述解码所述二维映射图得到所述断句与改写处理结果,包括:遍历所述二维映射图,根据所述二维映射图中的第二操作...

【专利技术属性】
技术研发人员:李晨延赵耀张煜易晖翁志伟
申请(专利权)人:广州小鹏汽车科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1