语音交互方法、服务器和存储介质技术

技术编号：34967134 阅读：13 留言：0更新日期：2022-09-17 12:48

本发明专利技术公开了一种语音交互方法、服务器和存储介质。该语音交互方法包括：接收车辆转发的用户语音请求以进行实体抽取；从预设知识库中获取预先建立的特定实体类型和预设字符的映射关系；根据映射关系，将语音请求中抽取得到的实体替换为相应的预设字符以进行断句与改写处理；根据断句与改写处理结果生成目标语音请求；根据目标语音请求生成控制指令下发至车辆完成语音交互。本发明专利技术的语音交互方法、服务器和存储介质可以对语音请求进行断句与改写处理直接输出断句与改写处理结果，保证断句后的子句具有完整的语义。此外，本发明专利技术还进行了灵活的知识注入，可以避免特定领域词汇的错误改写及错误断句。误改写及错误断句。误改写及错误断句。

全部详细技术资料下载

【技术实现步骤摘要】
语音交互方法、服务器和存储介质

[0001]本专利技术涉及车辆
，特别涉及一种语音交互方法、服务器和存储介质。

技术介绍

[0002]当前车载场景下存在大量复合连续指令，且复合连续指令中存在指代不明的情况。另外，在半开放域和开放域下，一些特定的知识信息会造成语义混淆，例如《我和你》是一首歌曲的名字，但在断句和改写场景下，“和”是模型判断是否改写或断句的强特征，可能会无法正确识别该歌曲名而得到错误断句和相应的车辆控制指令。

技术实现思路

[0003]本专利技术实施方式提供一种语音交互方法、服务器和存储介质。
[0004]本专利技术实施方式提供一种语音交互方法。所述语音交互方法包括：接收车辆转发的用户语音请求以进行实体抽取；从预设知识库中获取预先建立的特定实体类型和预设字符的映射关系；根据所述映射关系，将所述语音请求中抽取得到的实体替换为相应的预设字符以进行断句与改写处理；根据断句与改写处理结果生成目标语音请求；根据所述目标语音请求生成控制指令下发至车辆完成语音交互。
[0005]如此，本专利技术的语音交互方法可以对语音请求进行断句与改写处理直接输出断句与改写处理结果，保证断句后的子句具有完整的语义。此外，本专利技术还进行了灵活的知识注入，可以避免特定领域词汇的错误改写及错误断句。
[0006]所述根据所述映射关系，将所述语音请求中抽取得到的实体替换为相应的预设字符以进行断句与改写处理，包括：根据所述映射关系，将所述语音请求中抽取得到的实体替换为相应的预设字符以处理得到预处理...

【技术保护点】

【技术特征摘要】
1.一种语音交互方法，其特征在于，包括：接收车辆转发的用户语音请求以进行实体抽取；从预设知识库中获取预先建立的特定实体类型和预设字符的映射关系；根据所述映射关系，将所述语音请求中抽取得到的实体替换为相应的预设字符以进行断句与改写处理；根据断句与改写处理结果生成目标语音请求；根据所述目标语音请求生成控制指令下发至车辆完成语音交互。2.根据权利要求1所述的语音交互方法，其特征在于，所述根据所述映射关系，将所述语音请求中抽取得到的实体替换为相应的预设字符以进行断句与改写处理，包括：根据所述映射关系，将所述语音请求中抽取得到的实体替换为相应的预设字符以处理得到预处理分词；根据所述预处理分词生成嵌入特征向量；根据所述嵌入特征向量计算注意力特征得到特征矩阵；将所述特征矩阵转换为二维映射图；解码所述二维映射图得到所述断句与改写处理结果。3.根据权利要求2所述的语音交互方法，其特征在于，所述根据所述映射关系，将所述语音请求中抽取得到的实体替换为相应的预设字符以处理得到预处理分词，包括：对所述语音请求进行实体抽取；在所述语音请求中抽取得到的实体与所述预设知识库中的特定实体相匹配的情况下，根据匹配的特定实体的类型和所述映射关系，将所述语音请求中抽取得到的实体替换为对应的所述预设字符；在替换后的所述语音请求句首和句尾分别添加断句字符和结束字符，并进行词法扫描处理得到所述预处理分词。4.根据权利要求3所述的语音交互方法，其特征在于，所述根据所述预处理分词生成嵌入特征向量，包括：截取所述预处理分词中所述结束字符之前的字符，以生成替换句及相应的第一嵌入特征向量；截取所述预处理分词中所述断句字符之后的字符，以生成被替换句及相应的第二嵌入特征向量。5.根据权利要求4所述的语音交互方法，其特征在于，所述根据所述嵌入特征向量计算注意力特征得到特征矩阵，包括：对所述第一嵌入特征向量和第二嵌入特征向量采用多个预设算法分别计算得到多个注意力特征；将多个所述注意力特征拼接生成所述特征矩阵。6.根据权利要求4所述的语音交互方法，其特征在于，所述将所述特征矩阵转换为二维映射图，包括：将所述替换句与所述特征矩阵的纵轴对应关联，且将所述被替换句与所述特征矩阵的横轴对应关联，得到所述二维映射图。7.根据权利要求6所述的语音交互方法，其特征在于，所述解码所述二维映射图得到所
述断句与改写处理结果，包括：遍历所述二维映射图，根据所述二维映射图中的第一操作字符，将横轴对应所述被替换句的字符替换为纵轴对应所述替换句的字符；遍历所述二维映射图完成后，根据替换后的横轴对应所述被替换句的字符生成所述断句与改写处理结果。8.根据权利要求7所述的语音交互方法，其特征在于，所述遍历所述二维映射图完成后，根据替换后的横轴对应所述被替换句的字符生成所述断句与改写处理结果，包括：在处理后的横轴对应所述被替换句的字符中，将所述预设字符替换为所述语音请求中抽取得到的实体得到所述断句与改写处理结果。9.根据权利要求6所述的语音交互方法，其特征在于，所述解码所述二维映射图得到所述断句与改写处理结果，包括：遍历所述二维映射图，根据所述二维映射图中的第二操作...

【专利技术属性】
技术研发人员：李晨延，赵耀，张煜，易晖，翁志伟，
申请(专利权)人：广州小鹏汽车科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人