本公开提供了一种机器阅读理解数据处理方法及装置、电子设备和存储介质。其中,该机器阅读理解数据处理方法包括:将多个候选答案输入自测评模型;在自测评模型中,计算每个候选答案的测评结果;根据每个候选答案的测评结果,从多个候选答案中确定最终答案;通过自测评模型输出最终答案;其中,计算每个候选答案的测评结果,包括对每个候选答案分别执行如下操作:计算目标候选答案与多个候选答案中其他候选答案之间的交集数,其中交集数用于表征目标候选答案与每个其他候选答案之间的重叠词的数量;根据交集数、目标候选答案中的词数量和其他候选答案中的词数量,计算目标候选答案的测评结果。的测评结果。的测评结果。
【技术实现步骤摘要】
机器阅读理解数据处理方法及装置、电子设备和存储介质
[0001]本公开涉及人工智能
,更具体地,涉及一种机器阅读理解数据处理方法及装置、电子设备、计算机可读存储介质和计算机程序产品。
技术介绍
[0002]随着人工智能技术的发展,机器阅读理解的应用也越来越广泛,机器阅读理解是指利用自然语言处理技术使得计算机可以理解文章语义,并正确回答相关提问的任务。其中,被提出的问题所涉及的答案一般可以从文章中找到。
[0003]在实现本公开构思的过程中,专利技术人发现相关技术中至少存在如下问题,基于机器阅读理解算法的预训练预测模型在回答问题时,在一般情况下,预训练预测模型并不能较好的预测出正确答案在文章中的正确起始位置和正确终止位置,而预测出的不准确位置会使得预测答案与正确答案相比缺少部分信息或有信息冗余,导致预测结果不理想。
技术实现思路
[0004]有鉴于此,本公开提供了一种机器阅读理解数据处理方法及装置、电子设备、计算机可读存储介质和计算机程序产品。
[0005]本公开的一个方面提供了一种机器阅读理解数据处理方法,包括:
[0006]将多个候选答案输入自测评模型;
[0007]在自测评模型中,计算每个候选答案的测评结果;
[0008]根据每个候选答案的测评结果,从多个候选答案中确定最终答案;
[0009]通过自测评模型输出最终答案;
[0010]其中,计算每个候选答案的测评结果,包括对每个候选答案分别执行如下操作:
[0011]计算目标候选答案与多个候选答案中其他候选答案之间的交集数,其中交集数用于表征目标候选答案与每个其他候选答案之间的重叠词的数量;
[0012]根据交集数、目标候选答案中的词数量和其他候选答案中的词数量,计算目标候选答案的测评结果。
[0013]根据本公开的实施例,其中,根据交集数、目标候选答案中的词数量和其他候选答案中的词数量,计算目标候选答案的测评结果,包括:
[0014]根据交集数和其他候选答案中的词数量,计算目标候选答案相对于其他候选答案的第一重叠率,其中第一重叠率用于表征:以其他候选答案为基准的情况下,目标候选答案和其他候选答案的相似程度;
[0015]根据交集数和目标候选答案中的词数量,计算目标候选答案相对于其他候选答案的第二重叠率,其中第二重叠率用于表征:以目标候选答案为基准的情况下,其他候选答案和目标候选答案的相似程度;
[0016]根据第一重叠率和第二重叠率,计算目标候选答案的测评结果。
[0017]根据本公开的实施例,其中,根据交集数和其他候选答案中的词数量,计算目标候
选答案相对于其他候选答案的第一重叠率包括:
[0018]计算交集数与其他候选答案中的词数量的比值,以得到第一重叠率。
[0019]根据本公开的实施例,其中,根据交集数和目标候选答案中的词数量,计算目标候选答案相对于其他候选答案的第二重叠率包括:
[0020]计算交集数与目标候选答案中的词数量的比值,以得到第二重叠率。
[0021]根据本公开的实施例,其中,根据第一重叠率和第二重叠率,计算目标候选答案的测评结果包括:
[0022]根据第一重叠率和第二重叠率,计算目标候选答案相对于其他候选答案的准确度评分;
[0023]根据准确度准确度评分,计算目标候选答案的测评结果。
[0024]根据本公开的实施例,其中,根据第一重叠率和第二重叠率,计算目标候选答案相对于其他候选答案的准确度评分包括:
[0025]根据预设系数、第一重叠率和第二重叠率的乘积、以及第一重叠率和第二重叠率的加和,计算目标候选答案相对于其他候选答案的准确度评分。
[0026]根据本公开的实施例,其中,一个准确度评分对应于一个其他候选答案,其中,根据准确度评分,计算目标候选答案的测评结果包括:
[0027]计算多个准确度评分的平均值,以得到目标候选答案的测评结果。
[0028]根据本公开的实施例,还包括:
[0029]将待测文本和针对待测文本提出的预设问题输入预训练语言模型;
[0030]通过预训练语言模型输出:待测文本中的每个词的起始概率、以及结束概率,其中每个词的起始概率为:每个词作为预设问题的正确答案的起始位置的概率,每个词的结束概率为:每个词作为预设问题的正确答案的结束位置的概率;以及
[0031]根据每个词的起始概率和结束概率,确定关于预设问题的多个候选答案。
[0032]一种机器阅读理解数据处理装置,包括第一输入模块、计算模块、第一确定模块和第一输出模块。
[0033]其中第一输入模块,用于将多个候选答案输入自测评模型;
[0034]计算模块,用于在自测评模型中,计算每个候选答案的测评结果;
[0035]第一确定模块,用于根据每个候选答案的测评结果,从多个候选答案中确定最终答案;
[0036]第一输出模块,用于通过自测评模型输出最终答案;
[0037]其中,计算每个候选答案的测评结果,包括对每个候选答案分别执行如下操作:
[0038]计算目标候选答案与多个候选答案中其他候选答案之间的交集数,其中交集数用于表征目标候选答案与每个其他候选答案之间的重叠词的数量;
[0039]根据交集数、目标候选答案中的词数量和其他候选答案中的词数量,计算目标候选答案的测评结果。
[0040]根据本公开的实施例,其中,计算模块包括第一计算单元、第二计算单元、和第三计算单元。
[0041]其中,第一计算单元,用于根据交集数和其他候选答案中的词数量,计算目标候选答案相对于其他候选答案的第一重叠率,其中第一重叠率用于表征:以其他候选答案为基
准的情况下,目标候选答案和其他候选答案的相似程度;
[0042]第二计算单元,根据交集数和目标候选答案中的词数量,计算目标候选答案相对于其他候选答案的第二重叠率,其中第二重叠率用于表征:以目标候选答案为基准的情况下,其他候选答案和目标候选答案的相似程度;
[0043]第三计算单元,根据第一重叠率和第二重叠率,计算目标候选答案的测评结果。
[0044]根据本公开的实施例,其中,第一计算单元中,根据交集数和其他候选答案中的词数量,计算目标候选答案相对于其他候选答案的第一重叠率包括:计算交集数与其他候选答案中的词数量的比值,以得到第一重叠率。
[0045]根据本公开的实施例,其中,第二计算单元中,根据交集数和目标候选答案中的词数量,计算目标候选答案相对于其他候选答案的第二重叠率包括:计算交集数与目标候选答案中的词数量的比值,以得到第二重叠率。
[0046]根据本公开的实施例,其中,第三计算单元包括第一计算子单元、和第二计算子单元。
[0047]其中,第一计算子单元,根据第一重叠率和第二重叠率,计算目标候选答案相对于其他候选答案的准确度评分。第二计算子单元,根据准确度准确度评分,计算目标候选答案的测评本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种机器阅读理解数据处理方法,包括:将多个候选答案输入自测评模型;在所述自测评模型中,计算每个所述候选答案的测评结果;根据每个所述候选答案的测评结果,从所述多个候选答案中确定最终答案;通过所述自测评模型输出所述最终答案;其中,计算每个所述候选答案的测评结果,包括对每个所述候选答案分别执行如下操作:计算目标候选答案与所述多个候选答案中其他候选答案之间的交集数,其中所述交集数用于表征所述目标候选答案与每个所述其他候选答案之间的重叠词的数量;根据所述交集数、所述目标候选答案中的词数量和所述其他候选答案中的词数量,计算所述目标候选答案的测评结果。2.根据权利要求1所述的方法,其中,根据所述交集数、所述目标候选答案中的词数量和所述其他候选答案中的词数量,计算所述目标候选答案的测评结果,包括:根据所述交集数和所述其他候选答案中的词数量,计算所述目标候选答案相对于所述其他候选答案的第一重叠率,其中所述第一重叠率用于表征:以所述其他候选答案为基准的情况下,所述目标候选答案和所述其他候选答案的相似程度;根据所述交集数和所述目标候选答案中的词数量,计算所述目标候选答案相对于所述其他候选答案的第二重叠率,其中所述第二重叠率用于表征:以所述目标候选答案为基准的情况下,所述其他候选答案和所述目标候选答案的相似程度;根据所述第一重叠率和所述第二重叠率,计算所述目标候选答案的测评结果。3.根据权利要求2所述的方法,其中,所述根据所述交集数和所述其他候选答案中的词数量,计算所述目标候选答案相对于所述其他候选答案的第一重叠率包括:计算所述交集数与所述其他候选答案中的词数量的比值,以得到所述第一重叠率。4.根据权利要求2所述的方法,其中,所述根据所述交集数和所述目标候选答案中的词数量,计算所述目标候选答案相对于所述其他候选答案的第二重叠率包括:计算所述交集数与所述目标候选答案中的词数量的比值,以得到所述第二重叠率。5.根据权利要求2所述的方法,其中,所述根据所述第一重叠率和所述第二重叠率,计算所述目标候选答案的所述测评结果包括:根据所述第一重叠率和所述第二重叠率,计算所述目标候选答案相对于所述其他候选答案的准确度评分;根据所述准确度准确度评分,计算所述目标候选答案的测评结果。6.根据权利要求5所述的方法,其中,所述根据所述第一重叠率和所...
【专利技术属性】
技术研发人员:赵靖,鲍军威,
申请(专利权)人:京东科技信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。