对话生成方法、装置、设备及存储介质制造方法及图纸

技术编号：41955514 阅读：8 留言：0更新日期：2024-07-10 16:41

本申请公开了一种对话生成方法、装置、设备及存储介质，属于人工智能技术领域。本申请会为每个会话分别建立一个特征向量库，该特征向量库用于存储相应会话中多条对话记录的特征向量。这样，针对任一会话，在获取到互动对象最新的输入内容后，该方案首先生成一个对话摘要，该对话摘要是基于该会话中被保留的对话记录生成的；之后，该方案会对该输入内容和该对话摘要进行向量化处理，并基于向量化结果在特征向量库中进行检索；最终基于向量化结果和检索结果，生成应答内容。由于在对话生成过程中既考虑了被保留的对话记录，也通过向量化处理加向量检索的方式考虑了未被保留的对话记录，因此应答内容更符合用户需求，确保了人机对话质量。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及人工智能，特别涉及一种对话生成方法、装置、设备及存储介质。

技术介绍

1、随着人工智能技术的发展，聊天机器人逐渐进入了人们的视野，并为人们的日常生活带来了诸多便利。

2、在人工智能领域，聊天机器人大多建立在大型预训练语言模型(也称大型语言模型或大模型)上，进而实现理解和生成自然语言，与用户进行流畅对话。

3、众所周知，聊天机器人提供的应答是否满足用户需求会严重影响用户体验。换言之，聊天机器人的人工智能交互能力是影响用户体验的关键所在。因此，目前还需进一步优化聊天机器人的对话质量。

技术实现思路

1、本申请实施例提供了一种对话生成方法、装置、设备及存储介质。所述技术方案如下：

2、一方面，提供了一种对话生成方法，所述方法包括：

3、获取目标会话中互动对象的输入内容；

4、为所述目标会话中被保留的第一对话记录生成对话摘要；

5、对所述输入内容和所述对话摘要进行向量化处理，得到第一特征向量；

6、基于所述第一特征向量在特征向量库中进行检索，得到检索结果；其中，所述特征向量库用于存储所述目标会话中多条对话记录的特征向量；所述检索结果包括所述目标会话中未被保留的第二对话记录的特征向量；

7、基于所述第一特征向量和所述检索结果，生成所述输入内容的应答内容。

8、在一些实施例中，所述基于所述第一特征向量在特征向量库中进行检索，得到检索结果，包括：

9、获取所述第一特征

10、根据相关性阈值和所述语义相关性，在所述特征向量库存储的特征向量中进行筛选，得到第一数目条对话记录的特征向量；

11、在所述语义相关性和对话记录对应的时间戳的约束下，在所述第一数目条对话记录的特征向量中进行筛选，得到所述检索结果。

12、在一些实施例中，所述在所述语义相关性和对话记录对应的时间戳的约束下，在所述第一数目条对话记录的特征向量中进行筛选，得到所述检索结果，包括：

13、在所述第一数目条对话记录中过滤掉部分对话记录，得到第二数目条对话记录；其中，被过滤掉的对话记录为情感极性为负向的对话记录；

14、在所述语义相关性和所述时间戳的约束下，在所述第二数目条对话记录的特征向量中进行筛选，得到所述检索结果。

15、在一些实施例中，所述在所述语义相关性和所述时间戳的约束下，在所述第二数目条对话记录的特征向量中进行筛选，得到所述检索结果，包括：

16、按照语义相关性由大到小的顺序，对所述第二数目条对话记录进行排序；

17、基于所述第二数目条对话记录对应的时间戳，对得到的排序结果进行调整；

18、在调整后的排序结果中确定排在前预设数目位的对话记录，得到所述第二对话记录；

19、将所述第二对话记录的特征向量作为所述检索结果。

20、在一些实施例中，所述基于所述第二数目条对话记录对应的时间戳，对得到的排序结果进行调整，包括以下至少一项：

21、按照时间戳标记的时间越新排序越靠前的规则，对所述排序结果进行调整；

22、删除所述排序结果中时间戳标记的时间早于时间阈值的对话记录。

23、在一些实施例中，所述基于所述第一特征向量和所述检索结果，生成所述输入内容的应答内容，包括：

24、将所述第一特征向量和所述检索结果作为输入数据输入预训练语言模型；

25、获取所述预训练语言模型基于所述输入数据输出的所述应答内容。

26、在一些实施例中，在所述输入内容为语音的情况下，所述方法还包括：

27、基于所述输入内容，对所述互动对象进行情感极性分析，得到所述互动对象当前的情感极性；

28、基于所述输入内容，对所述互动对象当前所处的场景进行识别，得到场景类型；

29、基于所述互动对象当前的情感极性和所述场景类型，确定语音播报参数；

30、向所述互动对象反馈所述应答内容和所述语音播报参数；

31、其中，所述语音播报参数用于指示在基于所述应答内容进行语音播报时的播报音量和播报声音类型。

32、在一些实施例中，所述预训练语言模型的训练过程，包括：

33、获取第一训练数据集和用于人机对话任务的第二训练数据集；

34、基于未被标注的第一训练数据集，对初始语言模型进行训练，得到经过预训练的语言模型；

35、基于已被标注的第二训练数据集，对经过预训练的语言模型进行再训练，得到用于人机对话任务的预训练语言模型；

36、其中，所述第一训练数据集在数据规模上大于所述第二训练数据集。

37、在一些实施例中，所述方法还包括：

38、对所述目标会话中的各条对话记录分别进行向量化处理；

39、将所述各条对话记录的特征向量存储至所述特征向量库中；

40、其中，每条所述对话记录中均包括对话内容和时间戳；所述对话内容为来自所述互动对象的历史输入内容或系统历史生成的应答内容。

41、在一些实施例中，在所述输入内容为文本的情况下，所述对所述输入内容和所述对话摘要进行向量化处理，得到第一特征向量，包括：

42、对所述输入内容进行文本向量化处理，得到第二特征向量；

43、对所述对话摘要进行文本向量化处理，得到第三特征向量；

44、对所述第二特征向量和所述第三特征向量进行特征拼接，得到所述第一特征向量。

45、在一些实施例中，在所述输入内容为文本的情况下，所述对所述输入内容和所述对话摘要进行向量化处理，得到第一特征向量，包括：

46、将所述输入内容与所述对话摘要进行文本拼装，得到拼装后文本；

47、对所述拼装后文本进行文本向量化处理，得到所述第一特征向量。

48、另一方面，提供了一种对话生成装置，所述装置包括：

49、获取模块，被配置为获取目标会话中互动对象的输入内容；

50、第一生成模块，被配置为为所述目标会话中被保留的第一对话记录生成对话摘要；

51、第一处理模块，被配置为对所述输入内容和所述对话摘要进行向量化处理，得到第一特征向量；

52、检索模块，被配置为基于所述第一特征向量在特征向量库中进行检索，得到检索结果；其中，所述特征向量库用于存储所述目标会话中多条对话记录的特征向量；所述检索结果包括所述目标会话中未被保留的第二对话记录的特征向量；

53、第二生成模块，被配置为基于所述第一特征向量和所述检索结果，生成所述输入内容的应答内容。

54、在一些实施例中，所述检索模块，被配置为：

55、获取所述第一特征向量与所述特征向量库中存储的各个特征向量之间的语义相关性；

56、根据相关性阈值本文档来自技高网...

【技术保护点】

1.一种对话生成方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述基于所述第一特征向量在特征向量库中进行检索，得到检索结果，包括：

3.根据权利要求2所述的方法，其特征在于，所述在所述语义相关性和对话记录对应的时间戳的约束下，在所述第一数目条对话记录的特征向量中进行筛选，得到所述检索结果，包括：

4.根据权利要求3所述的方法，其特征在于，所述在所述语义相关性和所述时间戳的约束下，在所述第二数目条对话记录的特征向量中进行筛选，得到所述检索结果，包括：

5.根据权利要求4所述的方法，其特征在于，所述基于所述第二数目条对话记录对应的时间戳，对得到的排序结果进行调整，包括以下至少一项：

6.根据权利要求1所述的方法，其特征在于，所述基于所述第一特征向量和所述检索结果，生成所述输入内容的应答内容，包括：

7.根据权利要求1或6所述的方法，其特征在于，在所述输入内容为语音的情况下，所述方法还包括：

8.根据权利要求6所述的方法，其特征在于，所述预训练语言模型的训练过程，包括：p>

9.根据权利要求1所述的方法，其特征在于，所述方法还包括：

10.根据权利要求1所述的方法，其特征在于，在所述输入内容为文本的情况下，所述对所述输入内容和所述对话摘要进行向量化处理，得到第一特征向量，包括：

11.根据权利要求1所述的方法，其特征在于，在所述输入内容为文本的情况下，所述对所述输入内容和所述对话摘要进行向量化处理，得到第一特征向量，包括：

12.一种对话生成装置，其特征在于，所述装置包括：

13.一种计算机设备，其特征在于，所述设备包括处理器和存储器，所述存储器中存储有至少一条程序代码，所述至少一条程序代码由所述处理器加载并执行以实现如权利要求1至11中任一项权利要求所述的对话生成方法。

14.一种计算机可读存储介质，其特征在于，所述存储介质中存储有至少一条程序代码，所述至少一条程序代码由处理器加载并执行以实现如权利要求1至11中任一项权利要求所述的对话生成方法。

15.一种计算机程序产品或计算机程序，其特征在于，所述计算机程序产品或计算机程序包括计算机程序代码，所述计算机程序代码存储在计算机可读存储介质中，计算机设备的处理器从所述计算机可读存储介质读取所述计算机程序代码，所述处理器执行所述计算机程序代码，使得所述计算机设备执行如权利要求1至11中任一项权利要求所述的对话生成方法。

...

【技术特征摘要】

1.一种对话生成方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述基于所述第一特征向量在特征向量库中进行检索，得到检索结果，包括：

5.根据权利要求4所述的方法，其特征在于，所述基于所述第二数目条对话记录对应的时间戳，对得到的排序结果进行调整，包括以下至少一项：

6.根据权利要求1所述的方法，其特征在于，所述基于所述第一特征向量和所述检索结果，生成所述输入内容的应答内容，包括：

7.根据权利要求1或6所述的方法，其特征在于，在所述输入内容为语音的情况下，所述方法还包括：

8.根据权利要求6所述的方法，其特征在于，所述预训练语言模型的训练过程，包括：

9.根据权利要求1所述的方法，其特征在于，所述方法还包括：

10.根据权利要求...

【专利技术属性】
技术研发人员：于鑫，
申请(专利权)人：北京声智科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人