答案生成方法、装置及计算机程序产品制造方法及图纸

技术编号:34385482 阅读:52 留言:0更新日期:2022-08-03 21:07
本公开实施例公开了一种答案生成方法、装置及计算机程序产品,所述方法包括:获取问题以及候选文本;将所述问题以及所述候选文本进行向量化,利用注意力机制获得所述候选文本对应的与对所述问题相关的目标文本向量表示;基于所述目标文本向量表示预测所述候选文本中与所述问题的答案相关的目标片段;基于序列生成方式,通过所述目标文本向量表示中的目标片段向量表示生成所述问题的答案。该技术方案可以实现对多个候选文本中预测出的多个相关的目标片段进行处理,进而利用序列生成方式生成该问题对应的唯一答案,避免了已有技术中给出多个候选文本中的片段以及片断的简单拼接而造成多个片段重复或者相矛盾的问题,提高了自动问答系统的性能。动问答系统的性能。动问答系统的性能。

【技术实现步骤摘要】
答案生成方法、装置及计算机程序产品


[0001]本公开涉及人工智能
,具体涉及一种答案生成方法、装置及计算机程序产品。

技术介绍

[0002]随着人工智能技术的发展,自动问答技术越来越深入人们的生活当中。自动问答技术主要是利用机器阅读文本,并由机器理解文本中的内容后从中抽取关键信息,从而基于该关键信息对问题进行回答。
[0003]传统的多篇章机器阅读理解方案中,一个问题的答案可能来源于多个文本,机器需要对多个文本中进行理解;多篇章机器阅读理解方案给出的答案可能包含多个,也可能只包含1个,或者没有答案。传统的多篇章机器阅读理解方案要么通过级联模型分别对篇章排序、段落排序后,进行单个片段的开始位置和结束位置的预测,要么针对多个篇章分别预测出多个片段(multi

span)后排序,然后使用语法树进行融合。但是这两种多篇章机器阅读理解方案的效果均不理想。
[0004]因此,如何提高自动问答系统所输出答案的准确性是本领域技术人员中需要解决的技术问题之一。

技术实现思路

[0005]本公开实施例提供一种答案生成方法、装置及计算机程序产品。
[0006]第一方面,本公开实施例中提供了一种答案生成方法,其中,包括:
[0007]获取问题以及候选文本;
[0008]将所述问题以及所述候选文本进行向量化,利用注意力机制获得所述候选文本对应的与对所述问题相关的目标文本向量表示;
[0009]基于所述目标文本向量表示预测所述候选文本中与所述问题的答案相关的目标片段;
[0010]基于序列生成方式,通过所述目标文本向量表示中的目标片段向量表示生成所述问题的答案。
[0011]进一步地,将所述问题以及所述候选文本进行向量化,利用注意力机制获得所述候选文本对应的与对所述问题相关的目标文本向量表示,包括:
[0012]对所述问题和所述候选文本进行初始向量化,获得所述问题的初始问题向量表示以及所述候选文本的初始文本向量表示;
[0013]利用注意力机制,基于所述初始问题向量表示以及初始文本向量表示获得所述候选文本对所述问题的注意力权重;
[0014]基于所述注意力权重以及所述初始文本向量表示获得所述候选文本对应的与所述问题相关的目标文本向量表示。
[0015]进一步地,在所述目标片段包括多个时,所述基于序列生成方式,通过所述目标文
本向量表示中的目标片段向量表示生成所述问题的答案,包括:
[0016]基于所述目标片段向量表示之间的相似性确定多个所述目标片段的片段权重;
[0017]利用序列生成方式,基于所述片段权重以及所述目标片段向量表示生成所述问题的答案。
[0018]进一步地,所述目标片段的数量为1时,所述目标片段对应的所述片段权重为1。
[0019]第二方面,本专利技术实施例中提供了一种自动问答模型的训练方法,其中,包括:
[0020]获取训练样本;所述训练样本包括样本问题以及样本文本;
[0021]利用所述自动问答模型的编码部分将所述样本问题以及所述样本文本进行向量化,并利用注意力机制获得所述样本文本对应的与所述样本问题相关的样本文本向量表示;
[0022]利用所述自动问答模型的预测部分,基于所述目标文本向量表示预测所述候选文本中与所述问题的答案相关的预测片段;
[0023]利用所述自动问答模型的序列生成部分,基于所述样本文本向量表示中所述预测片段的预测片段向量表示生成所述样本问题的预测答案;
[0024]基于所述预测答案以及所述样本问题的真实答案之间的差距训练所述自动问答模型。
[0025]进一步地,利用所述自动问答模型的编码部分将所述样本问题以及所述样本文本进行向量化,并利用注意力机制获得所述样本文本对应的与所述样本问题相关的样本文本向量表示,包括:
[0026]利用所述编码部分中的初始向量表示编码器生成所述样本问题的初始问题向量表示以及所述样本文本的初始文本向量表示;
[0027]利用所述编码部分中的注意力机制层,基于所述初始问题向量表示以及初始文本向量表示获得所述样本文本对所述样本问题的注意力权重;
[0028]基于所述注意力权重以及所述初始文本向量表示获得所述样本文本对应的与所述样本问题相关的目标文本向量表示。
[0029]进一步地,在所述预测片段包括多个时,利用所述自动问答模型的序列生成部分,基于所述样本文本向量表示中所述预测片段的预测片段向量表示生成所述样本问题的预测答案,包括:
[0030]利用所述序列生成部分的片段权重计算模块,基于所述预测片段的向量表示之间的相似性确定多个所述预测片段的片段权重;
[0031]将所述预测片段之间的所述片段权重作为权重输入至所述序列生成部分的序列生成器,由所述序列生成器基于所述片段权重以及所述预测片段的向量表示生成所述样本问题的预测答案。
[0032]第三方面,本专利技术实施例中提供了一种答案生成装置,其中,包括:
[0033]第一获取模块,被配置为获取问题以及候选文本;
[0034]第一向量化模块,被配置为将所述问题以及所述候选文本进行向量化,利用注意力机制获得所述候选文本对应的与对所述问题相关的目标文本向量表示;
[0035]第一预测模块,被配置为基于所述目标文本向量表示预测所述候选文本中与所述问题的答案相关的目标片段;
[0036]第一生成模块,被配置为基于序列生成方式,通过所述目标文本向量表示中的目标片段向量表示生成所述问题的答案。
[0037]第四方面,本专利技术实施例中提供了一种自动问答模型的训练装置,其中,包括:
[0038]第二获取模块,被配置为获取训练样本;所述训练样本包括样本问题以及样本文本;
[0039]第二向量化模块,被配置为利用所述自动问答模型的编码部分将所述样本问题以及所述样本文本进行向量化,并利用注意力机制获得所述样本文本对应的与所述样本问题相关的样本文本向量表示;
[0040]第二预测模块,被配置为利用所述自动问答模型的预测部分,基于所述目标文本向量表示预测所述候选文本中与所述问题的答案相关的预测片段;
[0041]第二生成模块,被配置为利用所述自动问答模型的序列生成部分,基于所述样本文本向量表示中所述预测片段的预测片段向量表示生成所述样本问题的预测答案;
[0042]训练模块,被配置为基于所述预测答案以及所述样本问题的真实答案之间的差距训练所述自动问答模型。
[0043]所述功能可以通过硬件实现,也可以通过硬件执行相应的软件实现。所述硬件或软件包括一个或多个与上述功能相对应的模块。
[0044]在一个可能的设计中,上述装置的结构中包括存储器和处理器,所述存储器用于存储一条或多条支持上述装置执行上述对应方法的计算机指令,所述处理器被配置为用于执行所述存储器中存储的计算机指令。上述装置还可以包括通信接口,用于上述装置与其他设备或通信网络本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种答案生成方法,其中,包括:获取问题以及候选文本;将所述问题以及所述候选文本进行向量化,利用注意力机制获得所述候选文本对应的与对所述问题相关的目标文本向量表示;基于所述目标文本向量表示预测所述候选文本中与所述问题的答案相关的目标片段;基于序列生成方式,通过所述目标文本向量表示中的目标片段向量表示生成所述问题的答案。2.根据权利要求1所述的方法,其中,将所述问题以及所述候选文本进行向量化,利用注意力机制获得所述候选文本对应的与对所述问题相关的目标文本向量表示,包括:对所述问题和所述候选文本进行初始向量化,获得所述问题的初始问题向量表示以及所述候选文本的初始文本向量表示;利用注意力机制,基于所述初始问题向量表示以及初始文本向量表示获得所述候选文本对所述问题的注意力权重;基于所述注意力权重以及所述初始文本向量表示获得所述候选文本对应的与所述问题相关的目标文本向量表示。3.根据权利要求1或2所述的方法,其中,在所述目标片段包括多个时,所述基于序列生成方式,通过所述目标文本向量表示中的目标片段向量表示生成所述问题的答案,包括:基于所述目标片段向量表示之间的相似性确定多个所述目标片段的片段权重;利用序列生成方式,基于所述片段权重以及所述目标片段向量表示生成所述问题的答案。4.根据权利要求3所述的方法,其中,所述目标片段的数量为1时,所述目标片段对应的所述片段权重为1。5.一种自动问答模型的训练方法,其中,包括:获取训练样本;所述训练样本包括样本问题以及样本文本;利用所述自动问答模型的编码部分将所述样本问题以及所述样本文本进行向量化,并利用注意力机制获得所述样本文本对应的与所述样本问题相关的样本文本向量表示;利用所述自动问答模型的预测部分,基于所述目标文本向量表示预测所述候选文本中与所述问题的答案相关的预测片段;利用所述自动问答模型的序列生成部分,基于所述样本文本向量表示中所述预测片段的预测片段向量表示生成所述样本问题的预测答案;基于所述预测答案以及所述样本问题的真实答案之间的差距训练所述自动问答模型。6.根据权利要求5所述的方法,其中,利用所述自动问答模型的编码部分将所述样本问题以及所述样本文本进行向量化,并利用注意力机制获得所述样本文本对应的与所述样本问题相关的样本文本向量表示,包括:利用所述编码部分中的初始向量表示编码器生成所述样本问题的...

【专利技术属性】
技术研发人员:聂武洋
申请(专利权)人:阿里巴巴中国有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1