System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 语音交互方法、服务器和可读存储介质技术_技高网

语音交互方法、服务器和可读存储介质技术

技术编号:44494528 阅读:0 留言:0更新日期:2025-03-04 18:01
本申请公开了一种语音交互方法、服务器和包含有计算机程序的非易失性计算机可读存储介质。方法包括:接收车辆顺次转发的语音请求片段。对当前接收到的全部语音请求片段进行自然语言识别,得到第一自然语言识别结果。根据第一自然语言识别结果,得到第一自然语言理解结果。对接收到的语音请求进行自然语言识别,得到第二自然语言识别结果,语音请求由全部语音请求片段拼接得到。根据第一自然语言识别结果、第二自然语言识别结果、第一自然语言理解结果和语音请求,完成语音交互。如此,在端到端架构中,通过大语言模型与流式对话技术相结合,实现大语言模型的流式自然语言处理能力,减少等待整个语音请求完成所需的时间,从而缩短了响应时间。

【技术实现步骤摘要】

本专利技术涉及语音交互,特别涉及一种语音交互方法、服务器和包含有计算机程序的非易失性计算机可读存储介质。


技术介绍

1、相关技术中,车载智能系统通常基于完整的语音请求的自动语音识别结果进行人车交互。然而如此,需要等待对语音请求进行声音活动检测完成后,再进行自动语音识别,随后再进行自然语言理解,整体耗时较长,用户体验较差。


技术实现思路

1、本申请提供了一种语音交互方法、服务器和包含有计算机程序的非易失性计算机可读存储介质。

2、本申请实施方式提供一种语音交互方法,所述方法包括:

3、接收车辆顺次转发的语音请求片段;

4、对当前接收到的全部所述语音请求片段进行自然语言识别,得到第一自然语言识别结果;

5、根据所述第一自然语言识别结果,得到第一自然语言理解结果;

6、对接收到的语音请求进行自然语言识别,得到第二自然语言识别结果,所述语音请求由全部所述语音请求片段拼接得到;

7、根据所述第一自然语言识别结果、所述第二自然语言识别结果、所述第一自然语言理解结果和所述语音请求,完成所述语音交互。

8、如此,服务器接收车辆顺次转发的语音请求片段。接着,服务器对当前接收到的全部语音请求片段进行自然语言识别,得到第一自然语言识别结果。然后,服务器根据第一自然语言识别结果,得到第一自然语言理解结果。服务器再对接收到的语音请求进行自然语言识别,得到第二自然语言识别结果,语音请求由全部语音请求片段拼接得到。最后,服务器根据第一自然语言识别结果、第二自然语言识别结果、第一自然语言理解结果和语音请求,完成语音交互。这样,在端到端架构中,通过大语言模型与流式对话技术相结合,实现大语言模型的流式自然语言识别和流式自然语言理解能力,减少了等待整个语音请求完成所需的资源和时间,从而大大缩短了服务器的响应时间。并且,通过分阶段的自然语言识别和自然语言理解,大语言模型能够更准确地理解用户的意图,从而提高语音交互的效率和准确性。

9、在某些实施方式中,所述根据所述第一自然语言识别结果,得到第一自然语言理解结果,包括:

10、根据第一预设标记,对所述第一自然语言识别结果进行标记处理,得到目标标记语音识别结果;

11、对所述目标标记语音识别结果进行自然语言理解,得到所述第一自然语言理解结果。

12、如此,服务器根据第一预设标记,对第一自然语言识别结果进行标记处理,得到目标标记语音识别结果。接着,服务器对目标标记语音识别结果进行自然语言理解,得到第一自然语言理解结果。这样,通过使用第一预设标记对第一自然语言识别结果进行标记处理,大语言模型可以准确地识别输入的自然语言识别结果,准确地响应用户的请求,从而提高自然语言理解的准确性,并提供良好的用户体验。

13、在某些实施方式中,所述方法还包括:

14、根据第二预设标记,对所述第一自然语言理解结果进行标记处理,得到目标标记语音理解结果。

15、如此,服务器根据第二预设标记,对第一自然语言理解结果进行标记处理,得到目标标记语音理解结果。这样,通过使用第二预设标记对自然语言理解结果进行标记处理,能够使大语言模型优化自然语言理解过程,忽略已用第二预设标记标记的自然语言理解结果,减少错误在对话过程中的累积,从而提高整体的理解准确性。并且,还能够减少需要考虑的信息量,以使系统可以更快地处理后续的输入,从而提高整体的响应速度。

16、在某些实施方式中,所述对所述目标标记语音理解结果进行自然语言理解,得到所述第一自然语言理解结果,包括:

17、对所述目标标记语音识别结果进行槽位识别,得到槽位识别结果;

18、对所述目标标记语音识别结果进行应用程序接口预测,得到预测应用接口;

19、根据所述槽位识别结果和所述预测应用接口、选择所述预测应用接口执行应用程序接口参数填充,得到所述第一自然语言理解结果。

20、如此,服务器对目标标记语音识别结果进行槽位识别,得到槽位识别结果。接着,服务器对目标标记语音识别结果进行应用程序接口预测,得到预测应用接口。最后,服务器根据槽位识别结果和预测应用接口、选择预测应用接口执行应用程序接口参数填充,得到第一自然语言理解结果。这样,通过槽位识别和应用程序接口预测,系统能够更准确地理解用户的请求,并选择最合适的应用接口来执行任务,从而能够减少误解和错误,并提供良好的用户体验。

21、在某些实施方式中,所述对所述目标标记语音理解结果进行自然语言理解,得到所述第一自然语言理解结果,包括:

22、基于预训练完成的大语言模型,对所述目标标记语音理解结果进行自然语言理解,得到所述第一自然语言理解结果。

23、如此,基于预训练完成的大语言模型,服务器对目标标记语音识别结果进行自然语言理解,得到第一自然语言理解结果。这样,通过预训练的大语言模型对目标标记语音识别结果进行自然语言理解,能够提高自然语言理解的准确性和效率。

24、在某些实施方式中,所述基于预训练完成的大语言模型,对所述目标标记语音理解结果进行自然语言理解,得到所述第一自然语言理解结果,包括:

25、基于所述预训练完成的大语言模型,得到预测应用接口和应用程序接口参数填充结果,以得到所述第一自然语言理解结果,其中,所述应用程序接口参数填充结果基于所述预测应用接口得到。

26、如此,基于预训练完成的大语言模型,服务器得到预测应用接口和应用程序接口参数填充结果,以得到第一自然语言理解结果,其中,应用程序接口参数填充结果基于预测应用接口得到。这样,通过大语言模型提供的实体识别技术、槽位填充技术和应用接口预测技术,大语言模型对目标标记语音识别结果中的参数进行识别和提取,填充到应用接口的参数中,从而能够更好地理解对话的上下文,并提供更连贯和相关的回应。

27、在某些实施方式中,所述根据所述第一自然语言识别结果、所述第二自然语言识别结果和所述第一自然语言理解结果,完成所述语音交互,包括:

28、对所述第一自然语言识别结果和所述第二自然语言识别结果进行匹配处理;

29、在所述第一自然语言识别结果和所述第二自然语言相匹配的情况下,将所述第一自然语言理解结果下发至所述车辆完成语音交互。

30、如此,服务器对第一自然语言识别结果和第二自然语言识别结果进行匹配处理。接着,在第一自然语言识别结果和第二自然语言相匹配的情况下,服务器将第一自然语言理解结果下发至车辆完成语音交互。这样,通过对第一自然语言识别结果和第二自然语言识别结果进行匹配处理,确保下发的自然语言理解结果是正确的,从而能够减少错误识别的风险,并提高系统的可靠性。

31、在某些实施方式中,所述根据所述第一自然语言识别结果、所述第二自然语言识别结果和所述第一自然语言理解结果,完成所述语音交互,包括:

32、在所述第一自然语言识别结果和所述第二自然语言识别结果不匹本文档来自技高网...

【技术保护点】

1.一种语音交互方法,其特征在于,所述方法包括:

2.根据权利要求1所述的语音交互方法,其特征在于,所述根据所述第一自然语言识别结果,得到第一自然语言理解结果,包括:

3.根据权利要求2所述的语音交互方法,其特征在于,所述方法还包括:

4.根据权利要求2所述的语音交互方法,其特征在于,所述对所述目标标记语音识别结果进行自然语言理解,得到所述第一自然语言理解结果,包括:

5.根据权利要求2所述的语音交互方法,其特征在于,所述对所述目标标记语音识别结果进行自然语言理解,得到所述第一自然语言理解结果,包括:

6.根据权利要求5所述的语音交互方法,其特征在于,所述基于预训练完成的大语言模型,对所述目标标记语音识别结果进行自然语言理解,得到所述第一自然语言理解结果,包括:

7.根据权利要求1所述的语音交互方法,其特征在于,所述根据所述第一自然语言识别结果、所述第二自然语言识别结果和所述第一自然语言理解结果,完成所述语音交互,包括:

8.根据权利要求7所述的语音交互方法,其特征在于,所述根据所述第一自然语言识别结果、所述第二自然语言识别结果和所述第一自然语言理解结果,完成所述语音交互,包括:

9.一种服务器,其特征在于,所述服务器包括处理器和存储器,所述存储器上存储有计算机程序,当所述计算机程序被所述处理器执行时,实现权利要求1-8任一项所述的语音交互方法。

10.一种包含有计算机程序的非易失性计算机可读存储介质,其特征在于,当所述计算机程序被一个或多个处理器执行时,实现权利要求1-8任一项所述的语音交互方法。

...

【技术特征摘要】

1.一种语音交互方法,其特征在于,所述方法包括:

2.根据权利要求1所述的语音交互方法,其特征在于,所述根据所述第一自然语言识别结果,得到第一自然语言理解结果,包括:

3.根据权利要求2所述的语音交互方法,其特征在于,所述方法还包括:

4.根据权利要求2所述的语音交互方法,其特征在于,所述对所述目标标记语音识别结果进行自然语言理解,得到所述第一自然语言理解结果,包括:

5.根据权利要求2所述的语音交互方法,其特征在于,所述对所述目标标记语音识别结果进行自然语言理解,得到所述第一自然语言理解结果,包括:

6.根据权利要求5所述的语音交互方法,其特征在于,所述基于预训练完成的大语言模型,对所述目标标记语音识别结果进行自然语言理解,得到所述第一自然语言...

【专利技术属性】
技术研发人员:樊骏锋赵群孟菲李晓辰支淑婷王小平李华庆
申请(专利权)人:广州小鹏汽车科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1