问题回答方法以及电子设备、存储装置制造方法及图纸

技术编号:28146716 阅读:12 留言:0更新日期:2021-04-21 19:32
本申请公开了一种问题回答方法以及电子设备、存储装置,其中,问题回答方法包括:获取问题文本和篇章文本,并获取若干知识点的参考文本;其中,问题文本和篇章文本包含若干词语,若干知识点与问题文本、篇章文本中的至少一者相关;提取若干词语的个体语义表示,并提取各个参考文本的原始语义表示;利用若干词语的个体语义表示和各个参考文本的原始语义表示,从篇章文本中预测得到问题文本的回答文本。上述方案,能够提高问题回答的准确性。能够提高问题回答的准确性。能够提高问题回答的准确性。

【技术实现步骤摘要】
问题回答方法以及电子设备、存储装置


[0001]本申请涉及自然语言理解
,特别是涉及一种问题回答方法以及电子设备、存储装置。

技术介绍

[0002]随着信息技术的发展,篇章阅读理解相关系统已经获得了极大的性能提升,在此基础上,相关系统可以基于篇章来回答有关问题。然而,在现实场景中,仅仅理解篇章可能仍然无法准确回答问题。例如,篇章为“香蕉在冰箱,苹果在桌上”,而当问题为“黄色的水果放在什么地方”时,由于机器根据篇章无法理解“黄色的水果”指代何物,故无法准确回答该问题,诸如此类,不一而足。有鉴于此,如何提高问题回答的准确性成为极具研究价值的课题。

技术实现思路

[0003]本申请主要解决的技术问题文本是提供一种问题回答方法以及电子设备、存储装置,能够提高问题回答的准确性。
[0004]为了解决上述问题文本,本申请第一方面提供了一种问题回答方法,包括:获取问题文本和篇章文本,并获取若干知识点的参考文本;其中,问题文本和篇章文本包含若干词语,若干知识点与问题文本、篇章文本中的至少一者相关;提取若干词语的个体语义表示,并提取各个参考文本的原始语义表示;利用若干词语的个体语义表示和各个参考文本的原始语义表示,从篇章文本中预测得到问题文本的回答文本。
[0005]为了解决上述问题文本,本申请第二方面提供了一种电子设备,包括相互耦接的存储器和处理器,存储器中存储有程序指令,处理器用于执行程序指令以实现上述第一方面中的问题回答方法。
[0006]为了解决上述问题文本,本申请第三方面提供了一种存储装置,存储有能够被处理器运行的程序指令,程序指令用于实现上述第一方面中的问题回答方法。
[0007]上述方案,获取问题文本和篇章文本,并获取若干知识点的参考文本,且问题文本和篇章文本包含若干词语,若干知识点与问题文本、篇章文本中的至少一者相关,在此基础上,再提取若干词语的个体语义表示,并提取各个参考文本的原始语义表示,从而利用若干词语的个体语义表示和各个参考文本的原始语义表示,从篇章文本中预测得到问题文本的回答文本。故此,通过获取若干知识点的参考文本,能够在问题回答过程中引入外部知识,有利于对篇章文本和问题文本的背景进行扩充,继而有利于提高问题回答的准确性。
附图说明
[0008]图1是本申请问题回答方法一实施例的流程示意图;
[0009]图2是个体语义抽取网络一实施例的框架示意图;
[0010]图3是原始语义抽取网络一实施例的框架示意图;
[0011]图4是基于篇章文本和参考文本回答问题文本一实施例的示意图;
[0012]图5是图1中步骤S13一实施例的流程示意图;
[0013]图6是语义关联度获取过程一实施例的状态示意图;
[0014]图7是本申请问题回答方法另一实施例的流程示意图;
[0015]图8是基于篇章文本和参考文本回答问题文本另一实施例的示意图;
[0016]图9是问题回答模型的训练方法一实施例的流程示意图;
[0017]图10是训练样本获取过程一实施例的示意图;
[0018]图11是本申请电子设备一实施例的框架示意图;
[0019]图12是本申请存储装置一实施例的框架示意图。
具体实施方式
[0020]下面结合说明书附图,对本申请实施例的方案进行详细说明。
[0021]以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、接口、技术之类的具体细节,以便透彻理解本申请。
[0022]本文中术语“系统”和“网络”在本文中常被可互换使用。本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。此外,本文中的“多”表示两个或者多于两个。
[0023]请参阅图1,图1是本申请问题回答方法一实施例的流程示意图。具体而言,可以包括如下步骤:
[0024]步骤S11:获取问题文本和篇章文本,并获取若干知识点的参考文本。
[0025]本公开实施例中,问题文本和篇章文本中包含若干词语,若干词语的具体数量在此不做限定。此外,问题文本与篇章文本可以字面相关,例如,篇章文本为“香蕉在冰箱,苹果在桌上”,问题文本为“香蕉在哪里”,即篇章文本和问题文本在字面上均与“香蕉”相关;此外,问题文本与篇章文本也可以字面上无关,例如,篇章文本为“香蕉在冰箱,苹果在桌上”,问题文本为“黄色的水果在哪里”,即篇章文本和问题文本在字面上无任何相关性。上述例子仅仅是实际应用过程中可能存在的几种情况,并不因此而限定实际应用过程中可能存在的其他情况,在此不再一一举例。
[0026]在一个实施场景中,为了提高后续预测回答文本的准确性,可以对问题文本和篇章文本进行预处理,从而得到问题文本和篇章文本所包含的若干词语。
[0027]在一个具体的实施场景中,可以对篇章文本和问题文本进行数据清洗。例如,可以移除篇章文本和问题文本中诸如html(Hyper

Text Markup Language,超文本标记语言)标记字符(如,</body>等)等非法字符,并移除篇章文本和问题文本中由于编码错误等而导致的乱码,通过数据清洗能够在后续应用过程中,降低异常出错的概率,从而能够有利于提高回答文本预测的鲁棒性。
[0028]在另一个具体的实施场景中,还可以对篇章文本和问题文本进行分词。例如,对于英文可以使用Word Piece等分词工具进行分词,或者直接根据单词之间的空格进行分词;而对于中文可以直接以字为粒度进行分词,通过分词能够有利于捕捉细粒度的语义信息。
[0029]在又一个具体的实施场景中,还可以将篇章文本和问题文本两者中多个空格替换
为一个空格,并移除句首句尾的空格。
[0030]在又一个具体的实施场景中,在对篇章文本和问题文本进行上述预处理之后,还可以根据实际应用需要,将预处理之后的篇章文本和问题文本进行格式转换,例如,可以转换为:
[0031][CLS]Q1…
Q
n
[SEP]P1…
P
m
[SEP]……
(1)
[0032]上述式子(1)中,[CLS]和[SEP]为分隔符,Q1…
Q
n
表示预处理之后的问题文本中的各个词语,P1…
P
m
表示预处理之后的篇章文本中的各个词语。此外,根据实际应用需要,也可以将预处理之后的篇章文本中的各个词语置于前,而将预处理之后的问题文本中的各个词语置于后,即转换为[CLS]P1…
P
m
[SEP]Q1…
Q
n
[SEP],在此不做限定。
[0033]此外,本公开实施例中,若干知识点与问题文本、篇章文本中的至少一者相关。例如,若干知本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种问题回答方法,其特征在于,包括:获取问题文本和篇章文本,并获取若干知识点的参考文本;其中,所述问题文本和所述篇章文本包含若干词语,所述若干知识点与所述问题文本、所述篇章文本中的至少一者相关;提取所述若干词语的个体语义表示,并提取各个所述参考文本的原始语义表示;利用所述若干词语的个体语义表示和各个所述参考文本的原始语义表示,从所述篇章文本中预测得到所述问题文本的回答文本。2.根据权利要求1所述的方法,其特征在于,所述利用所述若干词语的个体语义表示和各个所述参考文本的原始语义表示,从所述篇章文本中预测得到所述问题文本的回答文本,包括:分别利用每一所述词语的个体语义表示和各个所述参考文本的原始语义表示,得到所述词语分别与各个所述参考文本间的语义关联度;利用所述词语与各个所述参考文本间的语义关联度,将各个所述原始语义表示进行融合,得到所述词语的融合语义表示;基于所述若干词语的所述个体语义表示和所述融合语义表示,从所述篇章文本中预测得到所述回答文本。3.根据权利要求2所述的方法,其特征在于,所述分别利用每一所述词语的个体语义表示和各个所述参考文本的原始语义表示,得到所述词语分别与各个所述参考文本间的语义关联度,包括:分别将所述若干词语中的一个所述词语,作为当前词语;将所述当前词语的个体语义表示分别与各个所述参考文本的原始语义表示进行点乘,得到所述当前词语与各个所述参考文本间的初始关联度;将所述当前词语与各个所述参考文本间的初始关联度进行归一化,得到所述当前词语分别与各个所述参考文本间的语义关联度。4.根据权利要求2所述的方法,其特征在于,所述基于所述若干词语的所述个体语义表示和所述融合语义表示,从所述篇章文本中预测得到所述回答文本,包括:利用所述若干词语的所述个体语义表示和所述融合语义表示,以及用于表示所述若干词语全体语义的全局语义表示,分别预测得到所述篇章文本中各个词语的第一概率值和第二概率值;基于所述第一概率值和所述第二概率值,在所述篇章文本中确定起始词语和结束词语,并利用所述起始词语和所述结束词语,得到所述回答文本;其中,所述全局语义表示是基于所有所述词语的个体语义表示得到,所述第一概率值表示所述词语为所述回答文本起始位置的可能性,所述第二概率值表示所述词语为所述回答文本结束位置的可能性。5.根据权利要求4所述的方法,其特征在于,所述利用所述若干词语的所述个体语义表示和所述融合语义表示,以及用于表示所述若干词语全体语义的全局语义表示,分别预测得到所述篇章文本中各个词语的第一概率值和第二概率值,包括:利用所述若干词语的所述个体语义表示和所述融合语义表示,以及用于表示所述若干词语全体语义的全局语义表示,预测得到所述篇章文本中各个词语的第一概率值;
利用所述若干词语的所述个体语义表示和所述融合语义表示,以及所述全局语义表示、最大的第一概率值所对应词语的个体语义表示,预测得到所述各个词语的第二概率值。6.根据权利要求4所述的方法,其特征在于,所述全局语义表示和所述个体语义表示尺寸相同;所述全局语义表示是通过以下任一者方式得到的:将所述问题文本和所述篇章文本中的预设位置处词语的个体语义表示,作为所述全局语义表示;将...

【专利技术属性】
技术研发人员:崔一鸣车万翔杨子清王士进胡国平秦兵刘挺
申请(专利权)人:河北省讯飞人工智能研究院科大讯飞股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1