System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及人工智能,特别涉及一种对话生成方法、装置、设备及存储介质。
技术介绍
1、随着人工智能技术的发展,聊天机器人逐渐进入了人们的视野,并为人们的日常生活带来了诸多便利。
2、在人工智能领域,聊天机器人大多建立在大型预训练语言模型(也称大型语言模型或大模型)上,进而实现理解和生成自然语言,与用户进行流畅对话。
3、众所周知,聊天机器人提供的应答是否满足用户需求会严重影响用户体验。换言之,聊天机器人的人工智能交互能力是影响用户体验的关键所在。因此,目前还需进一步优化聊天机器人的对话质量。
技术实现思路
1、本申请实施例提供了一种对话生成方法、装置、设备及存储介质。所述技术方案如下:
2、一方面,提供了一种对话生成方法,所述方法包括:
3、获取目标会话中互动对象的输入内容;
4、为所述目标会话中被保留的第一对话记录生成对话摘要;
5、对所述输入内容和所述对话摘要进行向量化处理,得到第一特征向量;
6、基于所述第一特征向量在特征向量库中进行检索,得到检索结果;其中,所述特征向量库用于存储所述目标会话中多条对话记录的特征向量;所述检索结果包括所述目标会话中未被保留的第二对话记录的特征向量;
7、基于所述第一特征向量和所述检索结果,生成所述输入内容的应答内容。
8、在一些实施例中,所述基于所述第一特征向量在特征向量库中进行检索,得到检索结果,包括:
9、获取所述第一特征
10、根据相关性阈值和所述语义相关性,在所述特征向量库存储的特征向量中进行筛选,得到第一数目条对话记录的特征向量;
11、在所述语义相关性和对话记录对应的时间戳的约束下,在所述第一数目条对话记录的特征向量中进行筛选,得到所述检索结果。
12、在一些实施例中,所述在所述语义相关性和对话记录对应的时间戳的约束下,在所述第一数目条对话记录的特征向量中进行筛选,得到所述检索结果,包括:
13、在所述第一数目条对话记录中过滤掉部分对话记录,得到第二数目条对话记录;其中,被过滤掉的对话记录为情感极性为负向的对话记录;
14、在所述语义相关性和所述时间戳的约束下,在所述第二数目条对话记录的特征向量中进行筛选,得到所述检索结果。
15、在一些实施例中,所述在所述语义相关性和所述时间戳的约束下,在所述第二数目条对话记录的特征向量中进行筛选,得到所述检索结果,包括:
16、按照语义相关性由大到小的顺序,对所述第二数目条对话记录进行排序;
17、基于所述第二数目条对话记录对应的时间戳,对得到的排序结果进行调整;
18、在调整后的排序结果中确定排在前预设数目位的对话记录,得到所述第二对话记录;
19、将所述第二对话记录的特征向量作为所述检索结果。
20、在一些实施例中,所述基于所述第二数目条对话记录对应的时间戳,对得到的排序结果进行调整,包括以下至少一项:
21、按照时间戳标记的时间越新排序越靠前的规则,对所述排序结果进行调整;
22、删除所述排序结果中时间戳标记的时间早于时间阈值的对话记录。
23、在一些实施例中,所述基于所述第一特征向量和所述检索结果,生成所述输入内容的应答内容,包括:
24、将所述第一特征向量和所述检索结果作为输入数据输入预训练语言模型;
25、获取所述预训练语言模型基于所述输入数据输出的所述应答内容。
26、在一些实施例中,在所述输入内容为语音的情况下,所述方法还包括:
27、基于所述输入内容,对所述互动对象进行情感极性分析,得到所述互动对象当前的情感极性;
28、基于所述输入内容,对所述互动对象当前所处的场景进行识别,得到场景类型;
29、基于所述互动对象当前的情感极性和所述场景类型,确定语音播报参数;
30、向所述互动对象反馈所述应答内容和所述语音播报参数;
31、其中,所述语音播报参数用于指示在基于所述应答内容进行语音播报时的播报音量和播报声音类型。
32、在一些实施例中,所述预训练语言模型的训练过程,包括:
33、获取第一训练数据集和用于人机对话任务的第二训练数据集;
34、基于未被标注的第一训练数据集,对初始语言模型进行训练,得到经过预训练的语言模型;
35、基于已被标注的第二训练数据集,对经过预训练的语言模型进行再训练,得到用于人机对话任务的预训练语言模型;
36、其中,所述第一训练数据集在数据规模上大于所述第二训练数据集。
37、在一些实施例中,所述方法还包括:
38、对所述目标会话中的各条对话记录分别进行向量化处理;
39、将所述各条对话记录的特征向量存储至所述特征向量库中;
40、其中,每条所述对话记录中均包括对话内容和时间戳;所述对话内容为来自所述互动对象的历史输入内容或系统历史生成的应答内容。
41、在一些实施例中,在所述输入内容为文本的情况下,所述对所述输入内容和所述对话摘要进行向量化处理,得到第一特征向量,包括:
42、对所述输入内容进行文本向量化处理,得到第二特征向量;
43、对所述对话摘要进行文本向量化处理,得到第三特征向量;
44、对所述第二特征向量和所述第三特征向量进行特征拼接,得到所述第一特征向量。
45、在一些实施例中,在所述输入内容为文本的情况下,所述对所述输入内容和所述对话摘要进行向量化处理,得到第一特征向量,包括:
46、将所述输入内容与所述对话摘要进行文本拼装,得到拼装后文本;
47、对所述拼装后文本进行文本向量化处理,得到所述第一特征向量。
48、另一方面,提供了一种对话生成装置,所述装置包括:
49、获取模块,被配置为获取目标会话中互动对象的输入内容;
50、第一生成模块,被配置为为所述目标会话中被保留的第一对话记录生成对话摘要;
51、第一处理模块,被配置为对所述输入内容和所述对话摘要进行向量化处理,得到第一特征向量;
52、检索模块,被配置为基于所述第一特征向量在特征向量库中进行检索,得到检索结果;其中,所述特征向量库用于存储所述目标会话中多条对话记录的特征向量;所述检索结果包括所述目标会话中未被保留的第二对话记录的特征向量;
53、第二生成模块,被配置为基于所述第一特征向量和所述检索结果,生成所述输入内容的应答内容。
54、在一些实施例中,所述检索模块,被配置为:
55、获取所述第一特征向量与所述特征向量库中存储的各个特征向量之间的语义相关性;
56、根据相关性阈值本文档来自技高网...
【技术保护点】
1.一种对话生成方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述基于所述第一特征向量在特征向量库中进行检索,得到检索结果,包括:
3.根据权利要求2所述的方法,其特征在于,所述在所述语义相关性和对话记录对应的时间戳的约束下,在所述第一数目条对话记录的特征向量中进行筛选,得到所述检索结果,包括:
4.根据权利要求3所述的方法,其特征在于,所述在所述语义相关性和所述时间戳的约束下,在所述第二数目条对话记录的特征向量中进行筛选,得到所述检索结果,包括:
5.根据权利要求4所述的方法,其特征在于,所述基于所述第二数目条对话记录对应的时间戳,对得到的排序结果进行调整,包括以下至少一项:
6.根据权利要求1所述的方法,其特征在于,所述基于所述第一特征向量和所述检索结果,生成所述输入内容的应答内容,包括:
7.根据权利要求1或6所述的方法,其特征在于,在所述输入内容为语音的情况下,所述方法还包括:
8.根据权利要求6所述的方法,其特征在于,所述预训练语言模型的训练过程,包括:
...【技术特征摘要】
1.一种对话生成方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述基于所述第一特征向量在特征向量库中进行检索,得到检索结果,包括:
3.根据权利要求2所述的方法,其特征在于,所述在所述语义相关性和对话记录对应的时间戳的约束下,在所述第一数目条对话记录的特征向量中进行筛选,得到所述检索结果,包括:
4.根据权利要求3所述的方法,其特征在于,所述在所述语义相关性和所述时间戳的约束下,在所述第二数目条对话记录的特征向量中进行筛选,得到所述检索结果,包括:
5.根据权利要求4所述的方法,其特征在于,所述基于所述第二数目条对话记录对应的时间戳,对得到的排序结果进行调整,包括以下至少一项:
6.根据权利要求1所述的方法,其特征在于,所述基于所述第一特征向量和所述检索结果,生成所述输入内容的应答内容,包括:
7.根据权利要求1或6所述的方法,其特征在于,在所述输入内容为语音的情况下,所述方法还包括:
8.根据权利要求6所述的方法,其特征在于,所述预训练语言模型的训练过程,包括:
9.根据权利要求1所述的方法,其特征在于,所述方法还包括:
10.根据权利要求...
【专利技术属性】
技术研发人员:于鑫,
申请(专利权)人:北京声智科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。