答案生成方法、装置及计算机程序产品制造方法及图纸

技术编号：34385482 阅读：52 留言：0更新日期：2022-08-03 21:07

本公开实施例公开了一种答案生成方法、装置及计算机程序产品，所述方法包括：获取问题以及候选文本；将所述问题以及所述候选文本进行向量化，利用注意力机制获得所述候选文本对应的与对所述问题相关的目标文本向量表示；基于所述目标文本向量表示预测所述候选文本中与所述问题的答案相关的目标片段；基于序列生成方式，通过所述目标文本向量表示中的目标片段向量表示生成所述问题的答案。该技术方案可以实现对多个候选文本中预测出的多个相关的目标片段进行处理，进而利用序列生成方式生成该问题对应的唯一答案，避免了已有技术中给出多个候选文本中的片段以及片断的简单拼接而造成多个片段重复或者相矛盾的问题，提高了自动问答系统的性能。动问答系统的性能。动问答系统的性能。

全部详细技术资料下载

【技术实现步骤摘要】
答案生成方法、装置及计算机程序产品

[0001]本公开涉及人工智能
，具体涉及一种答案生成方法、装置及计算机程序产品。

技术介绍

[0002]随着人工智能技术的发展，自动问答技术越来越深入人们的生活当中。自动问答技术主要是利用机器阅读文本，并由机器理解文本中的内容后从中抽取关键信息，从而基于该关键信息对问题进行回答。
[0003]传统的多篇章机器阅读理解方案中，一个问题的答案可能来源于多个文本，机器需要对多个文本中进行理解；多篇章机器阅读理解方案给出的答案可能包含多个，也可能只包含1个，或者没有答案。传统的多篇章机器阅读理解方案要么通过级联模型分别对篇章排序、段落排序后，进行单个片段的开始位置和结束位置的预测，要么针对多个篇章分别预测出多个片段(multi
‑
span)后排序，然后使用语法树进行融合。但是这两种多篇章机器阅读理解方案的效果均不理想。
[0004]因此，如何提高自动问答系统所输出答案的准确性是本领域技术人员中需要解决的技术问题之一。

技术实现思路

[0005]本公开实施例提供一种答案生成方法、装置及计算机程序产品。
[0006]第一方面，本公开实施例中提供了一种答案生成方法，其中，包括：
[0007]获取问题以及候选文本；
[0008]将所述问题以及所述候选文本进行向量化，利用注意力机制获得所述候选文本对应的与对所述问题相关的目标文本向量表示；
[0009]基于所述目标文本向量表示预测所述候选文本中与所述问题的答案相...

【技术保护点】

【技术特征摘要】
1.一种答案生成方法，其中，包括：获取问题以及候选文本；将所述问题以及所述候选文本进行向量化，利用注意力机制获得所述候选文本对应的与对所述问题相关的目标文本向量表示；基于所述目标文本向量表示预测所述候选文本中与所述问题的答案相关的目标片段；基于序列生成方式，通过所述目标文本向量表示中的目标片段向量表示生成所述问题的答案。2.根据权利要求1所述的方法，其中，将所述问题以及所述候选文本进行向量化，利用注意力机制获得所述候选文本对应的与对所述问题相关的目标文本向量表示，包括：对所述问题和所述候选文本进行初始向量化，获得所述问题的初始问题向量表示以及所述候选文本的初始文本向量表示；利用注意力机制，基于所述初始问题向量表示以及初始文本向量表示获得所述候选文本对所述问题的注意力权重；基于所述注意力权重以及所述初始文本向量表示获得所述候选文本对应的与所述问题相关的目标文本向量表示。3.根据权利要求1或2所述的方法，其中，在所述目标片段包括多个时，所述基于序列生成方式，通过所述目标文本向量表示中的目标片段向量表示生成所述问题的答案，包括：基于所述目标片段向量表示之间的相似性确定多个所述目标片段的片段权重；利用序列生成方式，基于所述片段权重以及所述目标片段向量表示生成所述问题的答案。4.根据权利要求3所述的方法，其中，所述目标片段的数量为1时，所述目标片段对应的所述片段权重为1。5.一种自动问答模型的训练方法，其中，包括：获取训练样本；所述训练样本包括样本问题以及样本文本；利用所述自动问答模型的编码部分将所述样本问题以及所述样本文本进行向量化，并利用注意力机制获得所述样本文本对应的与所述样本问题相关的样本文本向量表示；利用所述自动问答模型的预测部分，基于所述目标文本向量表示预测所述候选文本中与所述问题的答案相关的预测片段；利用所述自动问答模型的序列生成部分，基于所述样本文本向量表示中所述预测片段的预测片段向量表示生成所述样本问题的预测答案；基于所述预测答案以及所述样本问题的真实答案之间的差距训练所述自动问答模型。6.根据权利要求5所述的方法，其中，利用所述自动问答模型的编码部分将所述样本问题以及所述样本文本进行向量化，并利用注意力机制获得所述样本文本对应的与所述样本问题相关的样本文本向量表示，包括：利用所述编码部分中的初始向量表示编码器生成所述样本问题的...

【专利技术属性】
技术研发人员：聂武洋，
申请(专利权)人：阿里巴巴中国有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人