知识问答方法、装置、设备和介质制造方法及图纸

技术编号:38863577 阅读:17 留言:0更新日期:2023-09-17 10:04
本公开提供了一种知识问答方法,涉及人工智能领域。该方法包括:响应于接收到的问题信息,将知识库中的N个知识信息与所述问题信息输入到知识问答匹配模型中,其中,所述N个知识信息具有相同的目标数据类型,所述知识库通过将多种数据类型的文档内容转换为统一的所述目标数据类型而获得;获得所述知识问答匹配模型输出的N个匹配结果,其中,所述N个匹配结果指示了所述问题信息分别与所述N个知识信息的匹配程度;根据所述N个匹配结果,确定所述N个知识信息中的M个知识信息,N和M皆为大于或等于1的整数,M小于或等于N。本公开还提供了一种知识问答装置、设备、存储介质和程序产品。存储介质和程序产品。存储介质和程序产品。

【技术实现步骤摘要】
知识问答方法、装置、设备和介质


[0001]本公开涉及人工智能领域,更具体地,涉及一种知识问答方法、装置、设备、介质和程序产品。

技术介绍

[0002]近年来,深度学习带动了自然语言处理和计算机视觉的快速发展。在自然语言处理领域,智能问答是一项主流任务,其旨在对给出的自然语言形式的问题,利用机器做出回答。
[0003]传统的智能问答往往是基于单种模态数据,即只能针对一种数据类型的文档实现问答。但大部分产品文档是多模态的,即由多种数据类型数据组合而成,导致难以实现理想的智能问答效果。若每种数据类型配置一套单独的智能问答系统,则会导致较高的人力和资源成本。

技术实现思路

[0004]鉴于上述问题,本公开提供了一种知识问答方法、装置、设备、介质和程序产品。
[0005]本公开实施例的一个方面,提供了一种知识问答方法,包括:响应于接收到的问题信息,将知识库中的N个知识信息与所述问题信息输入到知识问答匹配模型中,其中,所述N个知识信息具有相同的目标数据类型,所述知识库通过将多种数据类型的文档内容转换为统一的所述目标数据类型而获得;获得所述知识问答匹配模型输出的N个匹配结果,其中,所述N个匹配结果指示了所述问题信息分别与所述N个知识信息的匹配程度;根据所述N个匹配结果,确定所述N个知识信息中的M个知识信息,N和M皆为大于或等于1的整数,M小于或等于N。
[0006]根据本公开的实施例,所述目标数据类型包括文本类型,所述多种数据类型包括文本类型和表格类型,获得所述知识库包括:将表格类型的文档内容转换为文本类型的文档内容;将统一为文本类型的所有文档内容进行拆解,得到所述知识库。
[0007]根据本公开的实施例,所述知识问答匹配模型包括编码器和分类器,所述获得所述知识问答匹配模型输出的N个匹配结果包括:将所述问题信息分别与所述N个知识信息组合,得到N个知识对;利用所述编码器分别对所述N个知识对进行编码,得到N个第一编码结果;利用所述分类器分别对所述N个第一编码结果进行分类,得到所述N个匹配结果。
[0008]根据本公开的实施例,所述知识问答匹配模型被配置为预先通过如下操作训练得到:获得样本知识库,其中,所述样本知识库通过将多种数据类型的样本文档内容转换为统一的所述目标数据类型而获得;将样本问题信息分别和所述样本知识库中的S个样本知识信息组成S个样本知识对,其中,所述S个样本知识信息包括正样本知识信息和负样本知识信息,所述负样本知识信息与所述正样本知识信息的相似度大于或等于预设阈值,S为大于或等于2的整数;基于所述S个样本知识对训练所述知识问答匹配模型。
[0009]根据本公开的实施例,所述基于所述S个样本知识对训练所述知识问答匹配模型
包括:利用所述编码器分别对所述S个样本知识对进行编码,得到S个第二编码结果;利用所述分类器分别对所述S个第二编码结果进行分类,得到S个匹配结果,所述S个匹配结果指示了所述样本问题信息分别与所述S个样本知识信息之间的匹配程度;根据所述S个匹配结果与所述S个样本知识信息的标签计算匹配损失,得到匹配损失函数值;根据所述匹配损失函数值更新所述编码器和所述分类器。
[0010]根据本公开的实施例,所述知识问答匹配模型还被配置为预先通过如下操作训练得到:将所述S个样本知识信息中任两个样本知识信息进行组合,得到Q个样本对,Q为大于或等于1的整数;利用所述编码器分别对所述Q个样本对进行编码,得到Q个第三编码结果;利用所述分类器分别计算所述Q个第三编码结果的Q个相似度;基于所述Q个相似度得到对比损失函数值;根据所述对比损失函数值更新所述编码器和所述分类器。
[0011]根据本公开的实施例,在确定所述N个知识信息中的M个知识信息之后,所述方法还包括:若M大于或等于2,对所述M个知识信息进行排序,获得排序结果;基于所述排序结果,返回答案信息,其中,所述答案信息包括所述M个知识信息中的至少一个知识信息,所述至少一个知识信息中各自的数据类型与所述目标数据类型相同或不同。
[0012]根据本公开的实施例,在响应于接收到的问题信息,将知识库中的N个知识信息与所述问题信息输入到知识问答匹配模型中之前,所述方法还包括:响应于接收到的问题信息,确定与所述问题信息对应的金融产品文档,所述金融产品文档包括所述多种数据类型的金融产品内容;将所述多种数据类型的金融产品内容转换为统一的所述目标数据类型;将统一为所述目标数据类型的所有金融产品内容进行拆解,得到所述知识库中的N个知识信息。
[0013]本公开实施例的另一方面提供了一种知识问答装置,包括:输入模块,用于响应于接收到的问题信息,将知识库中的N个知识信息与所述问题信息输入到知识问答匹配模型中,其中,所述N个知识信息具有相同的目标数据类型,所述知识库通过将多种数据类型的文档内容转换为统一的所述目标数据类型而获得;匹配模块,用于获得所述知识问答匹配模型输出的N个匹配结果,其中,所述N个匹配结果指示了所述问题信息分别与所述N个知识信息的匹配程度;确定模块,用于根据所述N个匹配结果,确定所述N个知识信息中的M个知识信息,N和M皆为大于或等于1的整数,M小于或等于N。
[0014]所述装置包括分别用于执行如上所述任意一项所述的方法的各个步骤的模块。
[0015]本公开实施例的另一方面提供了一种电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得一个或多个处理器执行如上所述的方法。
[0016]本公开实施例的另一方面还提供了一种计算机可读存储介质,其上存储有可执行指令,该指令被处理器执行时使处理器执行如上所述的方法。
[0017]本公开实施例的另一方面还提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现如上所述的方法。
[0018]上述一个或多个实施例具有如下有益效果:通过将多种数据类型的文档内容转换为统一的目标数据类型得到知识库,并应用到知识问答匹配模型中,便于知识问答匹配模型对问题信息分别与N个知识信息之间的匹配程度进行准确预测,从而获得准确的M个知识信息,实现基于多模态的文档的问答能力,提升智能问答服务水平。
附图说明
[0019]通过以下参照附图对本公开实施例的描述,本公开的上述内容以及其他目的、特征和优点将更为清楚,在附图中:
[0020]图1示意性示出了根据本公开实施例的知识问答方法的应用场景图;
[0021]图2示意性示出了根据本公开实施例的知识问答方法的流程图;
[0022]图3示意性示出了根据本公开实施例的获得知识库的流程图;
[0023]图4示意性示出了根据本公开实施例的获得知识信息的流程图;
[0024]图5示意性示出了根据本公开实施例的返回答案信息的流程图;
[0025]图6示意性示出了根据本公开实施例的获得匹配结果的流程图;
[0026]图7示意性示出了根据本公开实施例的预先训练模型的架构图;
...

【技术保护点】

【技术特征摘要】
1.一种知识问答方法,包括:响应于接收到的问题信息,将知识库中的N个知识信息与所述问题信息输入到知识问答匹配模型中,其中,所述N个知识信息具有相同的目标数据类型,所述知识库通过将多种数据类型的文档内容转换为统一的所述目标数据类型而获得;获得所述知识问答匹配模型输出的N个匹配结果,其中,所述N个匹配结果指示了所述问题信息分别与所述N个知识信息的匹配程度;根据所述N个匹配结果,确定所述N个知识信息中的M个知识信息,N和M皆为大于或等于1的整数,M小于或等于N。2.根据权利要求1所述的方法,其中,所述目标数据类型包括文本类型,所述多种数据类型包括文本类型和表格类型,获得所述知识库包括:将表格类型的文档内容转换为文本类型的文档内容;将统一为文本类型的所有文档内容进行拆解,得到所述知识库。3.根据权利要求1所述的方法,其中,所述知识问答匹配模型包括编码器和分类器,所述获得所述知识问答匹配模型输出的N个匹配结果包括:将所述问题信息分别与所述N个知识信息组合,得到N个知识对;利用所述编码器分别对所述N个知识对进行编码,得到N个第一编码结果;利用所述分类器分别对所述N个第一编码结果进行分类,得到所述N个匹配结果。4.根据权利要求3所述的方法,其中,所述知识问答匹配模型被配置为预先通过如下操作训练得到:获得样本知识库,其中,所述样本知识库通过将多种数据类型的样本文档内容转换为统一的所述目标数据类型而获得;将样本问题信息分别和所述样本知识库中的S个样本知识信息组成S个样本知识对,其中,所述S个样本知识信息包括正样本知识信息和负样本知识信息,所述负样本知识信息与所述正样本知识信息的相似度大于或等于预设阈值,S为大于或等于2的整数;基于所述S个样本知识对训练所述知识问答匹配模型。5.根据权利要求4所述的方法,其中,所述基于所述S个样本知识对训练所述知识问答匹配模型包括:利用所述编码器分别对所述S个样本知识对进行编码,得到S个第二编码结果;利用所述分类器分别对所述S个第二编码结果进行分类,得到S个匹配结果,所述S个匹配结果指示了所述样本问题信息分别与所述S个样本知识信息之间的匹配程度;根据所述S个匹配结果与所述S个样本知识信息的标签计算匹配损失,得到匹配损失函数值;根据所述匹配损失函数值更新所述编码器和所述分类器。6.根据权利要求5所述的方法,其中,所述知识问答匹配模型还被配置为预先通过如下...

【专利技术属性】
技术研发人员:张佳颖
申请(专利权)人:中国工商银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1