当前位置: 首页 > 专利查询>清华大学专利>正文

问答方法、问答数据集生成方法及装置制造方法及图纸

技术编号:34355003 阅读:25 留言:0更新日期:2022-07-31 06:25
本发明专利技术涉及人工智能技术领域,提供一种问答方法、问答数据集生成方法及装置,方法包括:获取待回答问题,将待回答问题输入至问答模型,得到待回答问题的答案;问答模型是基于问答数据集得到的,针对提问策略库的每种问题模板,从提问对象库中选择与第一占位符对应的若干目标元素,基于元素描述策略库的M种元素描述模板生成目标元素的M个元素描述信息,将若干目标元素的M个元素描述信息依次替换问题模板中对应的第一占位符,生成多个第一问题;基于第一问题中具有别名的元素将第一问题转写成第二问题,并通过生成第二问题的释义将第二问题转写成第三问题;基于所有第三问题及目标元素生成问答数据集,解决了问答数据集的质量问题,提高了质量。提高了质量。提高了质量。

【技术实现步骤摘要】
问答方法、问答数据集生成方法及装置


[0001]本专利技术涉及人工智能
,尤其涉及一种问答方法、问答数据集生成方法及装置。

技术介绍

[0002]人工智能已经得到广泛重视,问答模型是人工智能领域的任务之一,其目的是赋予机器回答人类问题的能力,问答模型已经在搜索引擎、个人助手、智能客服等领域深刻而广泛地改变了人们的日常生活,使得人机交互方式更加自然而普适。
[0003]根据问题复杂程度,问答任务可以分为简单问答任务和复杂推理问答任务。随着近年来大规模数据集的提出和深度学习技术的发展,现有技术中的问答模型,已经在一些简单问答任务上取得了良好的效果,例如在文本问答数据集 SQuAD2.0上,人类可以达到 89.45% 的 F1 值,有些问答模型已经达到了93.01%,显著超越人类。但是,面对复杂推理问答任务,问答模型的能力仍有待提高。数据集是问答模型的重要的研究基础,高质量的数据集便于对问答模型的模型进行训练和评测,推动相关研究的发展,目前数据集的质量成为制约问答模型的能力提高的因素之一。因此,如何提高问答模型的数据集的质量是目前业界亟待解决的重要课题。

技术实现思路

[0004]本专利技术提供一种问答方法、问答数据集生成方法及装置,用以解决现有技术中如何提高问答模型的数据集的质量的问题,实现问答数据集的质量的提高,进而提升了问答模型的能力。
[0005]本专利技术提供一种问答方法,包括:获取待回答问题,将所述待回答问题输入至问答模型,得到所述待回答问题的答案;所述问答模型是基于问答数据集得到的,所述问答数据集是通过如下方式得到的:获取元素描述策略库和提问策略库;所述元素描述策略库包含M种描述策略的元素描述模板;所述提问策略库包含N种提问策略的问题模板,所述问题模板中包含第一占位符,M和N为正整数;针对每种所述问题模板,从提问对象库中选择与所述第一占位符对应的若干目标元素,基于M种所述元素描述模板,生成所述目标元素的M个元素描述信息,将若干所述目标元素的M个元素描述信息依次替换所述问题模板中对应的所述第一占位符,以生成多个第一问题;基于所述第一问题中具有别名的元素,将所述第一问题转写成第二问题,并通过生成所述第二问题的释义,将所述第二问题转写成第三问题;基于所有所述第三问题及对应的所述目标元素,生成所述问答数据集。
[0006]根据本专利技术提供的问答方法,所述基于所述第一问题中具有别名的元素,将所述第一问题转写成第二问题,包括:
针对所述第一问题中具有别名的所有元素,基于每个元素的别名集合,将各元素的别名进行排列组合,得到多个别名组合;针对每个所述别名组合,将所述别名组合形成一个多元组,并将所述多元组输入至补全模型,得到所述补全模型输出的所述第二问题,所述补全模型用于将所述多元组中的各元素的别名补全成句子,以作为所述第二问题。
[0007]根据本专利技术提供的问答方法,所述通过生成所述第二问题的释义,将所述第二问题转写成第三问题,包括:将所述第二问题输入至释义生成模型,得到所述释义生成模型输出的所述第三问题,所述释义生成模型是基于第二问题样本和第三问题样本利用预训练语言模型进行训练得到的。
[0008]根据本专利技术提供的问答方法,所述基于所有所述第三问题及对应的所述目标元素,生成所述问答数据集,包括:针对每个所述第三问题,计算所述第三问题的向量表示与对应的所述第一问题的向量表示的相似度,作为所述第三问题的评分,若所述第三问题的评分大于或者等于预设评分,确定所述第三问题与对应的所述第一问题的语义一致,基于所述语义一致的所有所述第三问题及对应的所述目标元素,生成所述问答数据集;或者,针对每个所述第三问题,接收输入的所述第三问题的多个评价信息,若所述第三问题的多个评价信息满足预设条件,确定所述第三问题与对应的所述第一问题的语义一致,基于所述语义一致的所有所述第三问题及对应的所述目标元素,生成所述问答数据集。
[0009]根据本专利技术提供的问答方法,所述问题模板中还包括第二占位符;所述方法还包括:从所述提问对象库中选择与所述第二占位符对应的若干元素内容;所述将若干所述目标元素的M个元素描述信息依次替换所述问题模板中对应的所述第一占位符,以生成多个第一问题,包括:将若干所述目标元素的M个元素描述信息依次替换所述问题模板中对应的所述第一占位符,以及将若干所述元素内容依次替换所述问题模板中对应的所述第二占位符,以生成多个所述第一问题。
[0010]根据本专利技术提供的问答方法,还包括:基于所述第一问题对应的所述提问策略和所述描述策略所对应的推理函数、所述目标元素和所述目标元素的元素描述信息,生成所述第三问题的推理程序,所述第三问题的推理程序表征求解所述第三问题的答案的推理过程;所述基于所有所述第三问题及对应的所述目标元素,生成所述问答数据集,包括:基于所有所述第三问题及对应的推理程序和所述目标元素,生成所述问答数据集。
[0011]本专利技术还提供一种问答数据集生成方法,包括:获取元素描述策略库和提问策略库;所述元素描述策略库包含M种描述策略的元素描述模板;所述提问策略库包含N种提问策略的问题模板,所述问题模板中包含第一占位符,M和N为正整数;
针对每种所述问题模板,从提问对象库中选择与所述第一占位符对应的若干目标元素,基于M种所述元素描述模板,生成所述目标元素的M个元素描述信息,将若干所述目标元素的M个元素描述信息依次替换所述问题模板中对应的所述第一占位符,以生成多个第一问题;基于所述第一问题中具有别名的元素,将所述第一问题转写成第二问题,并通过生成所述第二问题的释义,将所述第二问题转写成第三问题;基于所有所述第三问题及对应的所述目标元素,生成所述问答数据集。
[0012]本专利技术还提供一种问答装置,包括:获取模块,用于获取待回答问题;问答模块,用于将所述待回答问题输入至问答模型,得到所述待回答问题的答案;所述问答模型是基于问答数据集得到的,所述问答数据集是通过如下方式得到的:获取元素描述策略库和提问策略库;所述元素描述策略库包含M种描述策略的元素描述模板;所述提问策略库包含N种提问策略的问题模板,所述问题模板中包含第一占位符,M和N为正整数;针对每种所述问题模板,从提问对象库中选择与所述第一占位符对应的若干目标元素,基于M种所述元素描述模板,生成所述目标元素的M个元素描述信息,将若干所述目标元素的M个元素描述信息依次替换所述问题模板中对应的所述第一占位符,以生成多个第一问题;基于所述第一问题中具有别名的元素,将所述第一问题转写成第二问题,并通过生成所述第二问题的释义,将所述第二问题转写成第三问题;基于所有所述第三问题及对应的所述目标元素,生成所述问答数据集。
[0013]本专利技术还提供一种问答数据集生成装置,包括:策略获取模块,用于获取元素描述策略库和提问策略库;所述元素描述策略库包含M种描述策略的元素描述模板;所述提问策略库包含N种提问策略的问题模板,所述问题模板中包含第一占位符,M和N为正整数;问题生成模块,用于针对每种所述问题模板,从提问对象库中选择与所述第一占位符对应的若干本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种问答方法,其特征在于,包括:获取待回答问题,将所述待回答问题输入至问答模型,得到所述待回答问题的答案;所述问答模型是基于问答数据集得到的,所述问答数据集是通过如下方式得到的:获取元素描述策略库和提问策略库;所述元素描述策略库包含M种描述策略的元素描述模板;所述提问策略库包含N种提问策略的问题模板,所述问题模板中包含第一占位符,M和N为正整数;针对每种所述问题模板,从提问对象库中选择与所述第一占位符对应的若干目标元素,基于M种所述元素描述模板,生成所述目标元素的M个元素描述信息,将若干所述目标元素的M个元素描述信息依次替换所述问题模板中对应的所述第一占位符,以生成多个第一问题;基于所述第一问题中具有别名的元素,将所述第一问题转写成第二问题,并通过生成所述第二问题的释义,将所述第二问题转写成第三问题;基于所有所述第三问题及对应的所述目标元素,生成所述问答数据集。2.根据权利要求1所述的问答方法,其特征在于,所述基于所述第一问题中具有别名的元素,将所述第一问题转写成第二问题,包括:针对所述第一问题中具有别名的所有元素,基于每个元素的别名集合,将各元素的别名进行排列组合,得到多个别名组合;针对每个所述别名组合,将所述别名组合形成一个多元组,并将所述多元组输入至补全模型,得到所述补全模型输出的所述第二问题,所述补全模型用于将所述多元组中的各元素的别名补全成句子,以作为所述第二问题。3.根据权利要求1所述的问答方法,其特征在于,所述通过生成所述第二问题的释义,将所述第二问题转写成第三问题,包括:将所述第二问题输入至释义生成模型,得到所述释义生成模型输出的所述第三问题,所述释义生成模型是基于第二问题样本和第三问题样本利用预训练语言模型进行训练得到的。4.根据权利要求1至3任一项所述的问答方法,其特征在于,所述基于所有所述第三问题及对应的所述目标元素,生成所述问答数据集,包括:针对每个所述第三问题,计算所述第三问题的向量表示与对应的所述第一问题的向量表示的相似度,作为所述第三问题的评分,若所述第三问题的评分大于或者等于预设评分,确定所述第三问题与对应的所述第一问题的语义一致,基于所述语义一致的所有所述第三问题及对应的所述目标元素,生成所述问答数据集;或者,针对每个所述第三问题,接收输入的所述第三问题的多个评价信息,若所述第三问题的多个评价信息满足预设条件,确定所述第三问题与对应的所述第一问题的语义一致,基于所述语义一致的所有所述第三问题及对应的所述目标元素,生成所述问答数据集。5.根据权利要求1至3任一项所述的问答方法,其特征在于,所述问题模板中还包括第二占位符;所述方法还包括:从所述提问对象库中选择与所述第二占位符对应的若干元素内容;所述将若干所述目标元素的M个元素描述信息依次替换所述问题模板中对应的所述第
一占位符,以生成多个第一问题,包括:将若干所述目标元素的M个元素描述信息依次替换所述问题模板中对应的所述第一占位符,以及将若干所述元素内容依次替换所述问题模板中对应的所述第二占位符,以生成多个所述第一问题。6.根据权利要求1至3任一项所述的问答方法,其特征在于,还包括:基于所述第一问题对应的所述提问策略和所述描述策略所对...

【专利技术属性】
技术研发人员:李涓子曹书林史佳欣侯磊孟斌杰张鹏唐杰许斌
申请(专利权)人:清华大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1