一种多跳问答系统及其方法技术方案

技术编号:38340115 阅读:13 留言:0更新日期:2023-08-02 09:20
本发明专利技术公开了一种多跳问答系统及其方法,该系统包括数据提取模块、多跳问题生成模块、筛选模块和多跳问答模块,其中所述数据提取模块用于从知识库中提取训练数据;所述多跳问题生成模块用于将所述训练数据输入到构建好的多跳问题生成模型,并获得新多跳问题;所述筛选模块用于筛选所述新多跳问题并得到多跳问答数据;所述多跳问答模块用于使用所述多跳问答数据训练生成多跳问答模型,并获得多跳问题的答案;本发明专利技术能提高多跳问答数据的语义准确度,从而改进多跳问答系统的性能,提高多跳问答系统的准确率,并提高了跳问题生成方法的实用性。用性。用性。

【技术实现步骤摘要】
一种多跳问答系统及其方法


[0001]本专利技术涉及多跳问答的
,特别是涉及一种多跳问答系统及其方法。

技术介绍

[0002]随着问答系统的不断发展,人们对问答系统的要求不再局限于只能回答无需推理的事实类问题,而是要求问答系统能回答多跳问题,多跳问题是指需要通过推理才能从多个支持文档中获取用户输入问题的答案的问题,能够让用户输入多跳问题并提供答案的问答系统即多跳问答系统。
[0003]当前多跳问答系统的模型复杂度不断提升,但在数据层面仍受限于现有多跳问答数据集不够大,多跳问答数据标注成本高,难度大的问题。多跳问题生成是用于解决这一问题的重要思路,但现有的多跳问题生成模型,其关注点仅在于如何生成较为复杂的多跳问题,其评价指标只采用BLEU、METEOR、ROUGE值等,即只关注生成问题的复杂度以及与原数据集的匹配度,而不关注实际的模型效果提升,即不关注实际模型的准确率的提升。
[0004]当前已有的多跳问题生成的模型训练方法,大多是基于图神经网络编码器,采用构造语义级别的图结构、实体级别的图结构来捕获多个上下文文档之间的信息,部分现有方法在此基础上再添加软约束或硬约束,以确保生成的多跳问题的复杂度。这种方法可以确保生成多跳问题的复杂度,但其与支持文档的匹配局限于对应的实体匹配,且其评价指标仅由一系列机器翻译评价指标BLEU、METEOR、ROUGE等构成,模型以生成问题在实体级上的匹配程度作为模型的唯一评价指标,其生成的多跳问答数据在语义的表达上还不够准确,生成的多跳问题、答案和支持文档之间的语义关系还不够准确,且无法确定其针对多跳问答模型的数据增强在模型的整体性能提升上是否有效果,即不确定准确率是否有提升。

技术实现思路

[0005]本专利技术的目的在于解决现有的多跳问答系统准确率低的问题,提供一种多跳问答系统及其方法。
[0006]为实现上述目的,本专利技术采用以下技术方案:
[0007]一种多跳问答系统,包括数据提取模块、多跳问题生成模块、筛选模块和多跳问答模块,其中:所述数据提取模块用于从知识库中提取训练数据;所述多跳问题生成模块用于将所述训练数据输入到构建好的多跳问题生成模型,并获得新多跳问题;所述筛选模块用于筛选所述新多跳问题并得到多跳问答数据;所述多跳问答模块用于使用所述多跳问答数据训练生成多跳问答模型,并获得多跳问题的答案。
[0008]在本专利技术的一些实施例中,所述多跳问答模块还用于判断所述多跳问答模型的训练次数是否达到设定值,若未达到,则计算所述多跳问答模型的准确率,将所述准确率反馈至所述多跳问题生成模块;若达到,则输出多跳问题的答案。
[0009]在本专利技术的一些实施例中,所述训练数据包括初始多跳问题、多跳答案、支持文档、实体。
[0010]在本专利技术的一些实施例中,所述数据提取模块包括自然语言处理工具和第一命名实体识别工具;所述提取训练数据具体包括:从所述知识库中提取出初始多跳问题、多跳答案和支持文档,通过所述自然语言处理工具对所述初始多跳问题、多跳答案和支持文档进行去重、纠错,通过所述第一命名实体识别工具从所述支持文档中拆分出实体。
[0011]在本专利技术的一些实施例中,所述多跳问答数据包括所述新多跳问题、所述多跳答案、支持文档和实体。
[0012]在本专利技术的一些实施例中,所述多跳问题生成模型的训练过程参数包括batch数据的大小、训练周期、停止条件中的至少一个;对所述batch数据的处理具体包括:将batch数据拆分为mini

batch数据,将每个所述mini

batch数据在所述多跳问题生成模型中训练并计算损失函数的Loss值,进行反向传播并计算梯度,评估后将所述损失函数的Loss值的计算结果返回至所述多跳问题生成模型,进行所述多跳问题生成模型参数更新。
[0013]在本专利技术的一些实施例中,所述筛选模块包括预训练语言模型编码器,所述预训练语言模型编码器用于筛选所述新多跳问题;筛选所述新多跳问题具体包括:计算所述新多跳问题与所述初始多跳问题的语义相似度,设定相似度阈值,若所述新多跳问题与所述初始多跳问题的语义相似度大于所述阈值,则舍弃;限制新多跳问题的最低实体数量。
[0014]在本专利技术的一些实施例中,所述语义相似度的计算公式为:
[0015][0016]其中,q
o
表示初始多跳问题,由m个字符组成;q
g
表示新多跳问题,由n个字符组成;T表示矩阵转置,E
o
表示所述初始多跳问题通过所述预训练语言模型编码器编码生成的向量,E
g
表示所述新多跳问题通过所述预训练语言模型编码器编码生成的向量,E
o
的计算公式为:
[0017]E
o
=Decoder(t1,t2,

,t
m
)
[0018]E
g
的计算公式为:
[0019]E
g
=Decoder(t1,t2,

,t
n
)
[0020]其中,Decoder表示所述预训练语言模型编码器,t表示字符。
[0021]在本专利技术的一些实施例中,所述筛选模块还包括第二命名实体识别工具,所述第二命名实体识别工具用于识别并限制所述新多跳问题中的实体数量。
[0022]本专利技术还提出一种多跳问答方法,基于如上所述的多跳问答系统,包括以下步骤:S1:通过所述数据提取模块从知识库中提取训练数据;S2:通过所述多跳问题生成模块,使用所述训练数据训练生成多跳问题生成模型,并获得新多跳问题;S3:通过所述筛选模块筛选所述新多跳问题并获得多跳问答数据;S4;通过所述多跳问答模块,使用所述多跳问答数据训练生成多跳问答模型,并获得多跳问题的答案。
[0023]在本专利技术的一些实施例中,还包括步骤S5:判断所述多跳问答模型的训练次数是否达到设定值,若未达到,则计算所述多跳问答模型的准确率,将所述准确率反馈至所述多跳问题生成模型,并重复步骤S2至S5,若达到,则保留所述多跳问答模型。
[0024]本专利技术具有如下有益效果:
[0025]本专利技术提出的多跳问答系统,通过数据提取模块从知识库中提取训练数据,多跳问题生成模块将训练数据输入到多跳问题生成模型中获得新多跳问题后,筛选模块筛选新
多跳问题并得到多跳问答数据,多跳问答模块将多跳问答数据输入到多跳问答模型并获得多跳问题的答案,能提高多跳问答数据的语义准确度,从而改进多跳问答系统的性能,提高多跳问答系统的准确率,并提高多跳问题生成方法的实用性。
[0026]此外,在本专利技术的一些实施例中,还具有如下有益效果:
[0027]通过筛选模块进行基于语义相似度计算的多跳问题筛选,避免将多跳问题生成过程中的无效数据引入多跳问答系统的训练过程中,从而提高了多跳问答数据的语义准确度,进一步提高了多跳问答系统的准确率。
[0028]通过计算本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种多跳问答系统,其特征在于,包括数据提取模块、多跳问题生成模块、筛选模块和多跳问答模块,其中:所述数据提取模块用于从知识库中提取训练数据;所述多跳问题生成模块用于将所述训练数据输入到构建好的多跳问题生成模型,并获得新多跳问题;所述筛选模块用于筛选所述新多跳问题并得到多跳问答数据;所述多跳问答模块用于使用所述多跳问答数据训练生成多跳问答模型,并获得多跳问题的答案。2.根据权利要求1所述的多跳问答系统,其特征在于,所述多跳问答模块还用于判断所述多跳问答模型的训练次数是否达到设定值,若未达到,则计算所述多跳问答模型的准确率,将所述准确率反馈至所述多跳问题生成模块;若达到,则输出多跳问题的答案。3.根据权利要求1所述的多跳问答系统,其特征在于,所述训练数据包括初始多跳问题、多跳答案、支持文档、实体。4.根据权利要求3所述的多跳问答系统,其特征在于,所述数据提取模块包括自然语言处理工具和第一命名实体识别工具;所述提取训练数据具体包括:从所述知识库中提取出初始多跳问题、多跳答案和支持文档,通过所述自然语言处理工具对所述初始多跳问题、多跳答案和支持文档进行去重、纠错,通过所述第一命名实体识别工具从所述支持文档中拆分出实体。5.根据权利要求3至4中任一项所述的多跳问答系统,其特征在于,所述多跳问答数据包括所述新多跳问题、所述多跳答案、支持文档和实体。6.根据权利要求1至4中任一项所述的多跳问答系统,其特征在于,所述多跳问题生成模型的训练过程参数包括batch数据的大小、训练周期、停止条件中的至少一个;对所述batch数据的处理具体包括:将batch数据拆分为mini

batch数据,将每个所述mini

batch数据在所述多跳问题生成模型中训练并计算损失函数的Loss值,进行反向传播并计算梯度,评估后将所述损失函数的Loss值的计算结果返回至所述多跳问题生成模型,进行所述多跳问题生成模型参数更新。7.根据权利要求3至4中任一项所述的多跳问答系统,其特征在于,所述筛选模块包括预训练语言模型编码器,所述预训练语言模型编码器用于筛选所述新多跳问题;筛选所述新多跳...

【专利技术属性】
技术研发人员:郑海涛付轩李俊欣胡牛
申请(专利权)人:清华大学深圳国际研究生院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1