用于对话机器人的知识库优化方法及装置制造方法及图纸

技术编号:39033326 阅读:8 留言:0更新日期:2023-10-10 11:46
本说明书实施例提供用于对话机器人的知识库优化方法及装置。响应于缺陷对话的缺陷类型指示对话机器人未返回正确答案且正确答案存在于对话机器人的知识库中,基于多模型融合方式来从知识库的至少一个候选答案中确定缺陷对话的用户问题的正确答案;以及将用户问题挂载到所确定出的正确答案所在知识点的扩展问列表。响应于缺陷类型指示对话机器人未返回正确答案且正确答案未存在于知识库中,根据用户问题执行基于知识点创建的知识库优化。户问题执行基于知识点创建的知识库优化。户问题执行基于知识点创建的知识库优化。

【技术实现步骤摘要】
用于对话机器人的知识库优化方法及装置


[0001]本说明书实施例通常涉及人工智能领域,尤其涉及用于对话机器人的知识库优化方法及装置。

技术介绍

[0002]人机对话相关技术已经被广泛地应用于各种智能服务场景的业务支持,并且构建具有不同功能、覆盖不同领域的对话机器人,比如,主站客服机器人、外呼机器人、理财助理、保险管家等。然而基于先验知识配置的对话机器人的对话效果不佳,比如,不能很好地理解各式各样的用户表达、与用户对话不流畅、为用户提供的回复满意度不佳等,由此需要进行对话效果优化。
[0003]对话效果优化方案通过对机器人的人机对话日志和知识库进行分析、检测和标注,自动给出优化建议,辅助运营人员优化机器人相关配置,从而优化机器人对话效果,提升机器人智能解决效率。
[0004]在常规的对话效果优化方案中,在对话机器人模型发布后,采用人员反馈的方式收集线上错误对话案例,并且对所收集的错误对话案例进行人工错误分析和数据标注。然后,使用标注后的对话案例作为训练数据来训练对话机器人模型,并在离线验证模型结果后对线上对话机器人模型进行迭代。在上述对话效果优化方案中,需要投入很大时间/精力进行错误分析和数据标注,并且花费较长的时间来进行对话机器人模型训练和迭代验证,从而导致优化流程长,不能实现对话效果的快速优化。
[0005]在一些对话效果优化方案中,从对话机器人所产生的人机对话日志中检测出缺陷对话,并根据所检测出的缺陷对话中的用户问题优化对话机器人的知识库,由此实现对话机器人效果优化。知识库优化效率对于对话机器人的对话效果优化至关重要。

技术实现思路

[0006]本说明书实施例提供用于对话机器人的知识库优化方法及装置。利用该知识库优化方法,通过使用多模型融合方式来进行知识库中的候选答案与用户问题之间的文本匹配,可以降低部分字面匹配对文本匹配造成的不利影响,由此提升从知识库中找寻出的答案的准确度,进而提升知识库优化效率。
[0007]根据本说明书实施例的一个方面,提供一种用于对话机器人的知识库优化方法,包括:响应于缺陷对话的缺陷类型指示对话机器人未返回正确答案且正确答案存在于对话机器人的知识库中,基于多模型融合方式来从所述知识库的至少一个候选答案中确定所述缺陷对话的用户问题的正确答案;以及将所述用户问题挂载到所述正确答案所在知识点的扩展问列表。
[0008]可选地,在上述方面的一个示例中,基于多模型融合方式来从至少一个候选答案中确定与所述缺陷对话的用户问题匹配的正确答案可以包括:使用对字面匹配具有不同敏感度的至少两个文本匹配模型来分别预测所述用户问题与所述至少一个候选答案之间的
匹配结果;以及对所得到的多种匹配结果进行多模型融合来从所述至少一个候选答案中确定出所述用户问题的正确答案。
[0009]可选地,在上述方面的一个示例中,所述至少两个文本匹配模型包括文本分类模型、文本表征模型和文本交互匹配模型。
[0010]可选地,在上述方面的一个示例中,所述多模型融合可以包括下述多模型融合中的一种:基于软投票的多模型融合;基于排名平均的多模型融合;基于分层的多模型融合;和基于动态模型选择的多模型融合。
[0011]可选地,在上述方面的一个示例中,所述知识库优化方法还可以包括:从所述知识库的知识点的答案中召回所述至少一个候选答案。
[0012]可选地,在上述方面的一个示例中,从所述知识库的知识点的答案中召回所述至少一个候选答案可以包括:使用文本敏感召回策略和语义敏感召回策略的组合召回策略,从所述知识库的知识点的答案中召回所述至少一个候选答案。
[0013]可选地,在上述方面的一个示例中,所述知识库优化方法还可以包括:响应于所述缺陷类型指示所述对话机器人未返回正确答案且正确答案未存在于所述知识库中,根据所述用户问题来执行基于知识点创建的知识库优化。
[0014]可选地,在上述方面的一个示例中,根据所述用户问题来执行基于知识点创建的知识库优化可以包括:对所述缺陷对话的用户问题进行问题聚类;根据人人对话日志,生成每个问题聚类的代表性问题的答案;以及根据每个问题聚类的用户问题和代表性问题的答案创建知识点添加到所述知识库中,每个问题聚类的代表性问题作为所创建的知识点的标准问,非代表性问题作为所创建的知识点的扩展问。
[0015]可选地,在上述方面的一个示例中,所述缺陷对话通过对从所述对话机器人的人机对话日志的对话片段中提取的每轮对话进行缺陷检测得到。
[0016]根据本说明书的实施例的另一方面,提供一种用于对话机器人的知识库优化装置,包括:知识库答案确定单元,响应于缺陷对话的缺陷类型指示对话机器人未返回正确答案且正确答案存在于对话机器人的知识库中,基于多模型融合方式来从所述知识库的至少一个候选答案中确定所述缺陷对话的用户问题的正确答案;以及问题挂载单元,将所述用户问题挂载到所述正确答案所在知识点的扩展问列表。
[0017]可选地,在上述方面的一个示例中,所述知识库答案确定单元可以包括:模型匹配模块,使用对字面匹配具有不同敏感度的至少两个文本匹配模型来分别预测所述用户问题与所述至少一个候选答案之间的匹配结果;以及多模型融合模块,对所得到的多种匹配结果进行多模型融合来从所述至少一个候选答案中确定出所述用户问题的正确答案。
[0018]可选地,在上述方面的一个示例中,所述知识库优化装置还可以包括:答案召回单元,从所述知识库的知识点的答案中召回所述至少一个候选答案。
[0019]可选地,在上述方面的一个示例中,所述答案召回单元使用文本敏感召回策略和语义敏感召回策略的组合召回策略,从所述知识库的知识点的答案中召回所述至少一个候选答案。
[0020]可选地,在上述方面的一个示例中,所述知识库优化装置还可以包括:知识点创建单元,响应于所述缺陷类型指示所述对话机器人未返回正确答案且正确答案未存在于所述知识库中,根据所述用户问题来执行基于知识点创建的知识库优化。
[0021]可选地,在上述方面的一个示例中,所述知识点创建单元可以包括:问题聚类模块,对所述缺陷对话的用户问题进行问题聚类;答案生成模块,根据人人对话日志,生成每个问题聚类的代表性问题的答案;以及知识点创建模块,根据每个问题聚类的用户问题和代表性问题的答案创建知识点添加到所述知识库中,每个问题聚类的代表性问题作为所创建的知识点的标准问,非代表性问题作为所创建的知识点的扩展问。
[0022]根据本说明书的实施例的另一方面,提供一种用于对话机器人的知识库优化装置,包括:至少一个处理器;与所述至少一个处理器耦合的存储器;以及存储在所述存储器中的计算机程序,所述至少一个处理器执行所述计算机程序来实现上所述的用于对话机器人的知识库优化方法。
[0023]根据本说明书的实施例的另一方面,提供一种计算机可读存储介质,其存储有可执行指令,所述指令当被执行时使得处理器执行如上所述的用于对话机器人的知识库优化方法。
[0024]根据本说明书的实施例的另一方面,提供一种计算机本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于对话机器人的知识库优化方法,包括:响应于缺陷对话的缺陷类型指示对话机器人未返回正确答案且正确答案存在于对话机器人的知识库中,基于多模型融合方式来从所述知识库的至少一个候选答案中确定所述缺陷对话的用户问题的正确答案;以及将所述用户问题挂载到所述正确答案所在知识点的扩展问列表。2.如权利要求1所述的知识库优化方法,其中,基于多模型融合方式来从至少一个候选答案中确定与所述缺陷对话的用户问题匹配的正确答案包括:使用对字面匹配具有不同敏感度的至少两个文本匹配模型来分别预测所述用户问题与所述至少一个候选答案之间的匹配结果;以及对所得到的多种匹配结果进行多模型融合来从所述至少一个候选答案中确定出所述用户问题的正确答案。3.如权利要求2所述的知识库优化方法,其中,所述至少两个文本匹配模型包括文本分类模型、文本表征模型和文本交互匹配模型。4.如权利要求2所述的知识库优化方法,其中,所述多模型融合包括下述多模型融合中的一种:基于软投票的多模型融合;基于排名平均的多模型融合;基于分层的多模型融合;基于动态模型选择的多模型融合。5.如权利要求1所述的知识库优化方法,还包括:从所述知识库的知识点的答案中召回所述至少一个候选答案。6.如权利要求5所述的知识库优化方法,其中,从所述知识库的知识点的答案中召回所述至少一个候选答案包括:使用文本敏感召回策略和语义敏感召回策略的组合召回策略,从所述知识库的知识点的答案中召回所述至少一个候选答案。7.如权利要求1所述的知识库优化方法,还包括:响应于所述缺陷类型指示所述对话机器人未返回正确答案且正确答案未存在于所述知识库中,根据所述用户问题来执行基于知识点创建的知识库优化。8.如权利要求7所述的知识库优化方法,其中,根据所述用户问题来执行基于知识点创建的知识库优化包括:对所述缺陷对话的用户问题进行问题聚类;根据人人对话日志,生成每个问题聚类的代表性问题的答案;以及根据每个问题聚类的用户问题和代表性问题的答案创建知识点来添加到所述知识库中,每个问题聚类的代表性问题作为所创建的知识点的标准问,非代表性问题作为所创建的知识点的扩展问。9.如权利要求1所述的知识库优化方法,其中,所述缺陷对话通过对从所述对话机器人的人机对话日志的对话片段中提取的每轮对话进行缺陷检测得到。10.一种用于对话机器人的知识库优化装置,包括:知识库答案确定...

【专利技术属性】
技术研发人员:胡森王春锋王俊杰许腾
申请(专利权)人:支付宝杭州信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1