当前位置: 首页 > 专利查询>清华大学专利>正文

问答方法、装置、电子设备及存储介质制造方法及图纸

技术编号:36404191 阅读:23 留言:0更新日期:2023-01-18 10:12
本发明专利技术涉及人工智能技术领域,提供一种问答方法、装置、电子设备及存储介质,其中方法包括:将问题输入生成模型,获得问题对应的推理程序;基于目标知识库执行问题对应的推理程序得到问题的答案;生成模型是基于目标知识库之外的外部知识库和对应的第一数据集,以及目标知识库和对应的第二数据集,进行训练得到的,第一数据集包括第一问题样本和对应的第一推理程序标签,第二数据集包括第二问题样本和对应的答案样本;生成模型用于通过解码程序的树形结构所转换的序列中每个位置的词汇得到问题对应的推理程序;或者,通过解析程序骨架以及程序骨架所需的参数得到问题对应的推理程序。解决平行语料缺失的问题,提升了问答性能。提升了问答性能。提升了问答性能。

【技术实现步骤摘要】
问答方法、装置、电子设备及存储介质


[0001]本专利技术涉及人工智能
,尤其涉及一种问答方法、装置、电子设备及存储介质。

技术介绍

[0002]知识库问答 (Knowledge Based Question Answering, KBQA) 是自然语言问题领域中的一个研究方向,主要任务是针对给定的自然语言的问题,利用知识库进行查询和推理,得出问题的答案。从涉及到单个关系三元组的简单问答,逐渐转移到知识库复杂问答 (Complex KBQA) 上来。知识库复杂问答需要计算机处理复杂问题,通常需要逻辑,比较和多跳关系等多种推理能力。
[0003]针对复杂问题,可以基于信息检索的方法得到问题的答案,具体可以通过问题的实体识别与链接召回候选实体,并根据候选实体与问题的语义匹配进行排序,从而从知识库中检索到问题的答案。为了提升问答的可解释性,还可以基于语义解析的方法得到问题的答案,具体可以把问题解析为一个推理程序,基于知识库,执行该推理程序就可以得到问题的答案。不同于基于信息检索的方法,基于语义解析的方法可以通过查询语句得到具体的推理过程,解释性较强。但是,现有技术中,语义解析的学习依赖于给定知识库上大规模的问题和推理程序的平行语料,由于数据标注需要大量的人力、时间和物力等成本,对于大多数的知识库来说,问题和推理程序的平行语料是缺失的,难以满足复杂问题的需求。

技术实现思路

[0004]本专利技术提供一种问答方法、装置、电子设备及存储介质,用以解决现有技术中因问题和推理程序的平行语料是缺失难以满足复杂问题的需求的缺陷,实现了问答性能的提升。
[0005]本专利技术提供一种问答方法,包括:将问题输入生成模型,获得所述生成模型输出的所述问题对应的推理程序;基于目标知识库,执行所述问题对应的推理程序,得到所述问题的答案;其中,所述生成模型是基于所述目标知识库之外的外部知识库和对应的第一数据集,以及所述目标知识库和对应的第二数据集,进行训练得到的,所述第一数据集包括第一问题样本和对应的第一推理程序标签,所述第二数据集包括第二问题样本和对应的答案样本;所述生成模型用于通过解码程序的树形结构所转换的序列中每个位置的词汇,得到所述问题对应的推理程序,其中,每个所述位置的词汇是从与所述位置对应的候选词汇表中选择的;或者,所述生成模型用于通过解析程序骨架以及所述程序骨架所需的参数,得到所述问题对应的推理程序。
[0006]根据本专利技术提供的一种问答方法,所述得到所述生成模型输出的所述问题对应的推理程序,包括:
基于所述问题,对所述序列中需要解码的每个所述位置,计算与所述位置对应的候选词汇表中每个词汇属于所述位置的概率,并选择出概率最大的词汇作为所述位置的词汇。
[0007]根据本专利技术提供的一种问答方法,从所述序列中需要解码的第二个所述位置开始,所述位置对应的候选词汇表是以前一个所述位置的词汇为约束条件确定的。
[0008]根据本专利技术提供的问答方法,所述位置对应的候选词汇表中包括以下至少一种:基本函数的名称;知识元素;预设标识,所述预设标识的类型包括函数类型和/或参数类型。
[0009]根据本专利技术提供的一种问答方法,所述对所述序列中需要解码的每个所述位置,计算与所述位置对应的候选词汇表中每个词汇属于所述位置的概率,并选择出概率最大的词汇作为所述位置的词汇,包括:按顺序依次选择所述序列中需要解码的每个所述位置作为当前位置;若所述当前位置为需要解码的第一个所述位置,确定所述当前位置对应的候选词汇表包括预设标识,计算所述当前位置对应的候选词汇表中每个词汇属于所述当前位置的概率,并选择出概率最大的词汇作为所述当前位置的词汇;若所述当前位置不为需要解码的第一个所述位置,以前一个所述位置的词汇为约束条件更新所述当前位置对应的候选词汇表,并计算所述当前位置对应的候选词汇表中每个词汇属于所述当前位置的概率,并选择出概率最大的词汇作为所述当前位置的词汇。
[0010]根据本专利技术提供的一种问答方法,所述生成模型是通过如下方式训练得到的:基于所述外部知识库,以所述第一问题样本为输入,以输出所述第一推理程序标签为目标,对预设模型进行预训练;基于所述目标知识库,以所述第二问题样本输入,以输出执行结果为所述第二问题样本对应的答案样本的第二推理程序为目标,对预设模型进行训练,得到所述生成模型。
[0011]根据本专利技术提供的一种问答方法,所述获得所述生成模型输出的所述问题对应的推理程序,包括:解析程序骨架;以所述外部知识库的部分作为参数候选池;从所述参数候选池中,选择所述程序骨架所需的参数,得到所述问题对应的推理程序。
[0012]本专利技术还提供一种问答装置,包括:程序获得模块,用于将问题输入生成模型,获得所述生成模型输出的所述问题对应的推理程序;推理程序执行模块,用于基于目标知识库,执行所述问题对应的推理程序,得到所述问题的答案;其中,所述生成模型是基于所述目标知识库之外的外部知识库和对应的第一数据集,以及所述目标知识库和对应的第二数据集,进行训练得到的,所述第一数据集包括第一问题样本和对应的第一推理程序标签,所述第二数据集包括第二问题样本和对应的答案样本;
所述生成模型用于通过解码程序的树形结构所转换的序列中每个位置的词汇,得到所述问题对应的推理程序,其中,每个所述位置的词汇是从与所述位置对应的候选词汇表中选择的;或者,所述生成模型用于通过解析程序骨架以及所述程序骨架所需的参数,得到所述问题对应的推理程序。
[0013]本专利技术还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述问答方法。
[0014]本专利技术还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述问答方法。
[0015]本专利技术还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述问答方法。
[0016]本专利技术提供的问答方法,可以通过生成模型生成问题对应的推理程序,从而基于目标知识库,执行问题对应的推理程序,得到问题对应的答案,其中,生成模型是结合外部知识库对应的已经标注的第一数据集进行训练得到的,可以缓解目标知识库对应的第二数据集中第二问题样本缺乏标注的情况,由于该生成模型可以通过解码程序的树形结构所转换的序列中每个位置的词汇,得到问题对应的推理程序,每个位置的词汇是从与位置对应的动态的候选词汇表中选择的,大大提升了生成模型的效率,或者可以通过解析程序骨架以及程序骨架所需的参数,得到问题对应的推理程序,从而提高了问答性能。
附图说明
[0017]为了更清楚地说明本专利技术或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0018]图1是本专利技术提供的问答方法的流本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种问答方法,其特征在于,包括:将问题输入生成模型,获得所述生成模型输出的所述问题对应的推理程序;基于目标知识库,执行所述问题对应的推理程序,得到所述问题的答案;其中,所述生成模型是基于所述目标知识库之外的外部知识库和对应的第一数据集,以及所述目标知识库和对应的第二数据集,进行训练得到的,所述第一数据集包括第一问题样本和对应的第一推理程序标签,所述第二数据集包括第二问题样本和对应的答案样本;所述生成模型用于通过解码程序的树形结构所转换的序列中每个位置的词汇,得到所述问题对应的推理程序,其中,每个所述位置的词汇是从与所述位置对应的候选词汇表中选择的;或者,所述生成模型用于通过解析程序骨架以及所述程序骨架所需的参数,得到所述问题对应的推理程序。2.根据权利要求1所述的问答方法,其特征在于,所述得到所述生成模型输出的所述问题对应的推理程序,包括:基于所述问题,对所述序列中需要解码的每个所述位置,计算与所述位置对应的候选词汇表中每个词汇属于所述位置的概率,并选择出概率最大的词汇作为所述位置的词汇。3.根据权利要求2所述的问答方法,其特征在于,从所述序列中需要解码的第二个所述位置开始,所述位置对应的候选词汇表是以前一个所述位置的词汇为约束条件确定的。4.根据权利要求3所述的问答方法,其特征在于,所述位置对应的候选词汇表中包括以下至少一种:基本函数的名称;知识元素;预设标识,所述预设标识的类型包括函数类型和/或参数类型。5.根据权利要求3所述的问答方法,其特征在于,所述对所述序列中需要解码的每个所述位置,计算与所述位置对应的候选词汇表中每个词汇属于所述位置的概率,并选择出概率最大的词汇作为所述位置的词汇,包括:按顺序依次选择所述序列中需要解码的每个所述位置作为当前位置;若所述当前位置为需要解码的第一个所述位置,确定所述当前位置对应的候选词汇表包括预设标识,计算所述当前位置对应的候选词汇表中每个词汇属于所述当前位置的概率,并选择出概率最大的词汇作为所述当前位置的词汇;若所述当前位置不为需要解码的第一个所述位置,以前一个所述位置的词...

【专利技术属性】
技术研发人员:李涓子曹书林史佳欣姚子俊吕鑫于济凡侯磊张鹏唐杰许斌
申请(专利权)人:清华大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1