基于文本的问答方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:34340678 阅读:11 留言:0更新日期:2022-07-31 03:50
本申请实施例属于人工智能领域,涉及一种基于文本的问答方法、装置、计算机设备及存储介质,方法包括:获取问题文本及其对应的答案文本;根据预设的语义分割算法分割答案文本,得到多个语义块;将问题文本与各语义块分别进行组合,得到多个问答价值评估文本;将各问答价值评估文本分别输入问答价值评估模型,得到各问答价值评估文本中语义块的问答价值分数;根据问答价值分数对各语义块进行筛选,得到包含至少一个语义块的语义块队列;将问题文本和语义块队列输入答案信息提取模型,得到答案文本中与问题文本所对应的答案信息。本申请提高了基于文本的问答准确性。了基于文本的问答准确性。了基于文本的问答准确性。

【技术实现步骤摘要】
基于文本的问答方法、装置、计算机设备及存储介质


[0001]本申请涉及人工智能领域,尤其涉及一种基于文本的问答方法、装置、计算机设备及存储介质。

技术介绍

[0002]随着计算机技术的发展,计算机在自然语言处理中的应用也越来越多。基于文本的智能问答是自然语言处理中的重要课题,它的应用场景可以是先获取问题文本,然后在较长的答案文本中确定问题文本所对应的答案信息。基于文本的智能问答通常是将长文本输入基于神经网络搭建的模型,由模型输出答案信息。预训练语言模型具有自注意力机制,可以学习到语言内部蕴含的语义关联关系,在基于文本的智能问答中具有较好的效果。
[0003]预训练语言模型的训练需要消耗大量的计算资源,预训练语言模型对输入的文本长度也有限制。在实际应用中,需要处理的文本通常篇幅较长,为此,通常会直接将文本分割为多个小于模型最大输入长度的子文本,然后输入模型进行问答处理。然而,这样会丢失很多重要的语义信息,导致问答准确性较低。

技术实现思路

[0004]本申请实施例的目的在于提出一种基于文本的问答方法、装置、计算机设备及存储介质,以解决问答准确性较低的问题。
[0005]为了解决上述技术问题,本申请实施例提供一种基于文本的问答方法,采用了如下所述的技术方案:
[0006]获取问题文本及其对应的答案文本;
[0007]根据预设的语义分割算法分割所述答案文本,得到多个语义块;
[0008]将所述问题文本与各语义块分别进行组合,得到多个问答价值评估文本;
[0009]将各问答价值评估文本分别输入问答价值评估模型,得到所述各问答价值评估文本中语义块的问答价值分数;
[0010]根据所述问答价值分数对所述各语义块进行筛选,得到包含至少一个语义块的语义块队列;
[0011]将所述问题文本和所述语义块队列输入答案信息提取模型,得到所述答案文本中与所述问题文本所对应的答案信息。
[0012]为了解决上述技术问题,本申请实施例还提供一种基于文本的问答装置,采用了如下所述的技术方案:
[0013]文本获取模块,用于获取问题文本及其对应的答案文本;
[0014]文本分割模块,用于根据预设的语义分割算法分割所述答案文本,得到多个语义块;
[0015]组合模块,用于将所述问题文本与各语义块分别进行组合,得到多个问答价值评估文本;
[0016]文本输入模块,用于将各问答价值评估文本分别输入问答价值评估模型,得到所述各问答价值评估文本中语义块的问答价值分数;
[0017]筛选模块,用于根据所述问答价值分数对所述各语义块进行筛选,得到包含至少一个语义块的语义块队列;
[0018]答案提取模块,用于将所述问题文本和所述语义块队列输入答案信息提取模型,得到所述答案文本中与所述问题文本所对应的答案信息。
[0019]为了解决上述技术问题,本申请实施例还提供一种计算机设备,采用了如下所述的技术方案:
[0020]获取问题文本及其对应的答案文本;
[0021]根据预设的语义分割算法分割所述答案文本,得到多个语义块;
[0022]将所述问题文本与各语义块分别进行组合,得到多个问答价值评估文本;
[0023]将各问答价值评估文本分别输入问答价值评估模型,得到所述各问答价值评估文本中语义块的问答价值分数;
[0024]根据所述问答价值分数对所述各语义块进行筛选,得到包含至少一个语义块的语义块队列;
[0025]将所述问题文本和所述语义块队列输入答案信息提取模型,得到所述答案文本中与所述问题文本所对应的答案信息。
[0026]为了解决上述技术问题,本申请实施例还提供一种计算机可读存储介质,采用了如下所述的技术方案:
[0027]获取问题文本及其对应的答案文本;
[0028]根据预设的语义分割算法分割所述答案文本,得到多个语义块;
[0029]将所述问题文本与各语义块分别进行组合,得到多个问答价值评估文本;
[0030]将各问答价值评估文本分别输入问答价值评估模型,得到所述各问答价值评估文本中语义块的问答价值分数;
[0031]根据所述问答价值分数对所述各语义块进行筛选,得到包含至少一个语义块的语义块队列;
[0032]将所述问题文本和所述语义块队列输入答案信息提取模型,得到所述答案文本中与所述问题文本所对应的答案信息。
[0033]与现有技术相比,本申请实施例主要有以下有益效果:获取问题文本及其对应的答案文本,根据预设的语义分割算法分割答案文本,确保得到的语义块具有足够丰富的语义信息;将问题文本与各语义块分别进行组合得到多个问答价值评估文本;将问答价值评估文本输入问答价值评估模型得到问答价值分数,问答价值分数衡量了问答价值评估文本中的语义块在问答中的贡献度与价值,从而选取具有较高问答价值的语义块构成语义块队列;然后将问题文本与语义块队列输入答案信息提取模型,使得模型可以根据具有较高问答价值的语义块准确输出答案信息;本申请在文本分割时保证了语义块的语义信息,选取具有较高问答价值的语义块进行答案信息的提取,提高了问答的准确性。
附图说明
[0034]为了更清楚地说明本申请中的方案,下面将对本申请实施例描述中所需要使用的
附图作一个简单介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0035]图1是本申请可以应用于其中的示例性系统架构图;
[0036]图2是根据本申请的基于文本的问答方法的一个实施例的流程图;
[0037]图3是根据本申请的基于文本的问答装置的一个实施例的结构示意图;
[0038]图4是根据本申请的计算机设备的一个实施例的结构示意图。
具体实施方式
[0039]除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的
的技术人员通常理解的含义相同;本文中在申请的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本申请;本申请的说明书和权利要求书及上述附图说明中的术语“包括”和“具有”以及它们的任何变形,意图在于覆盖不排他的包含。本申请的说明书和权利要求书或上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。
[0040]在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
[0041]为了使本
的人员更好地理解本申请方案,下面将结合附图,对本申请实施例中的技术方案进行清楚、完整地描述。
[0042]如图1所示,系统架构100可以包括终端设备101、102、1本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于文本的问答方法,其特征在于,包括下述步骤:获取问题文本及其对应的答案文本;根据预设的语义分割算法分割所述答案文本,得到多个语义块;将所述问题文本与各语义块分别进行组合,得到多个问答价值评估文本;将各问答价值评估文本分别输入问答价值评估模型,得到所述各问答价值评估文本中语义块的问答价值分数;根据所述问答价值分数对所述各语义块进行筛选,得到包含至少一个语义块的语义块队列;将所述问题文本和所述语义块队列输入答案信息提取模型,得到所述答案文本中与所述问题文本所对应的答案信息。2.根据权利要求1所述的基于文本的问答方法,其特征在于,所述根据预设的语义分割算法分割所述答案文本,得到多个语义块的步骤包括:识别所述答案文本中的目标词;根据所述目标词和预设的文本长度条件分割所述答案文本,得到多个语义块;其中,语义块中目标词的数量等于预设数量阈值且语义块的文本长度处于预设长度区间内;或者,语义块的文本长度等于预设长度区间右端点的数值;所述数量阈值和所述预设长度区间为预设的语义分割算法中的参数。3.根据权利要求1所述的基于文本的问答方法,其特征在于,所述将各问答价值评估文本分别输入问答价值评估模型,得到所述各问答价值评估文本中语义块的问答价值分数的步骤包括:对于每个问答价值评估文本,将所述问答价值评估文本分别输入问答价值评估模型中的各子模型,得到多个问答价值子分数;对各问答价值子分数进行线性运算,得到所述问答价值评估文本中语义块的问答价值分数。4.根据权利要求1所述的基于文本的问答方法,其特征在于,在所述将各问答价值评估文本分别输入问答价值评估模型,得到所述各问答价值评估文本中语义块的问答价值分数的步骤之前,还包括:获取多个问答价值训练文本;各问答价值训练文本由训练问题文本和分割训练答案文本得到的各语义块分别进行组合得到;将所述各问答价值训练文本输入初始问答价值评估模型,得到所述各问答价值训练文本中语义块的问答价值预测分数;获取所述各问答价值训练文本中语义块的语义块标签;所述语义块标签标识语义块是否关联于答案信息;基于得到的问答价值预测分数和语义块标签计算价值评估损失;根据所述价值评估损失调整所述初始问答价值评估模型的模型参数,直至模型收敛,得到问答价值评估模型。5.根据权利要求1所述的基于文本的问答方法,其特征在于,所述根据所述问答价值分数对所述各语义块进行筛选,得到包含至少一个语义块的语义块队列的步骤包括:根据所述问答价值分数对所述各语义块进行降序排列,得到候选队列;
按照所述候选队列中语义块的排列顺序,将各语...

【专利技术属性】
技术研发人员:王伟张黔陈焕坤郑毅
申请(专利权)人:润联软件系统深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1