一种问题解答方法、智能终端及存储介质技术

技术编号:35360702 阅读:10 留言:0更新日期:2022-10-29 17:58
本发明专利技术公开了一种问题解答方法、智能终端及存储介质,所述方法包括:获取待解答问题及待解答问题对应的若干关联段落,根据待解答问题和若干关联段落确定若干问题信息实体和若干融合段落信息实体;获取若干融合段落信息实体对应的若干知识实体,根据若干问题信息实体、若干融合段落信息实体以及若干知识实体构建实体图;根据实体图确定待解答问题对应的特征向量,根据所述特征向量确定待解答问题对应的目标答案。本发明专利技术根据问题信息实体、段落信息实体以及段落信息实体对应的若干知识构建实体图,根据实体图确定的特征向量确定问题的目标答案,可以将外部知识融入问题信息实体和段落信息实体中提取特征向量,提高问题解答结果的准确率。果的准确率。果的准确率。

【技术实现步骤摘要】
一种问题解答方法、智能终端及存储介质


[0001]本专利技术涉及自然语言处理
,尤其涉及的是一种问题解答方法、智能终端及存储介质。

技术介绍

[0002]基于文本的问答(Text

based Question Answering,Text

based QA)是自然语言处理领域的一个经典问题,大多数现有方法都侧重于在一段话中找到指定问题的答案。然而在实际的生活中,许多困难问题往往需要在两个甚至多个文档中的文本中寻找答案,这使得研究者们将目标转向更能体现机器智能的基于多段落推理的问题解答。
[0003]目前主流的基于多段落推理的问题解答方法均是根据问题检索出的相关段落进行特征提取,输出答案概率分布。这种方法一方面受问题相关段落的限制,提取出的特征有限,另一方面当段落较长时无法提取出有用的特征,导致最终输出答案的准确率低。
[0004]因此,现有技术还有待改进和发展。

技术实现思路

[0005]本专利技术要解决的技术问题在于,针对现有技术的上述缺陷,提供一种问题解答方法、智能终端及存储介质,旨在解决现有基于多段落推理的问题解答方法基于相关段落提取特征,输出答案概率分布,导致最终输出答案的准确率低的问题。
[0006]本专利技术解决问题所采用的技术方案如下:
[0007]第一方面,本专利技术实施例提供一种问题解答方法,其中,包括:
[0008]获取待解答问题及所述待解答问题对应的若干关联段落,根据所述待解答问题和若干所述关联段落得到若干问题信息实体和若干融合段落信息实体;
[0009]获取若干所述融合段落信息实体对应的若干知识实体,根据若干所述问题信息实体、若干所述融合段落信息实体以及若干所述知识实体构建实体图;
[0010]根据所述实体图确定所述待解答问题对应的特征向量,根据所述特征向量确定所述待解答问题对应的目标答案。
[0011]所述的问题解答方法,其中,所述获取待解答问题及所述待解答问题对应的若干关联段落的步骤包括:
[0012]获取待解答问题及预先存储的若干原始文档,根据所述待解答问题从若干所述原始文档中确定所述待解答问题对应的若干候选文档;
[0013]根据所述待解答问题,从若干所述候选文档中确定所述待解答问题对应的若干关联段落。
[0014]所述的问题解答方法,其中,所述根据所述待解答问题和若干所述关联段落得到若干问题信息实体和若干融合段落信息实体的步骤包括:
[0015]对所述待解答问题和若干所述段落分别进行预处理,得到所述待解答问题对应的若干问题信息实体和若干所述段落对应的若干候选段落信息实体;
[0016]通过注意力机制对若干所述问题信息实体和若干所述候选段落信息实体进行融合,得到若干融合段落信息实体。
[0017]所述的问题解答方法,其中,所述通过注意力机制对若干所述问题信息实体和若干所述候选段落信息实体进行融合,得到若干融合段落信息实体的步骤包括:
[0018]对若干所述问题信息实体和若干所述候选段落信息实体进行注意力计算,得到若干所述问题信息实体和若干所述候选段落信息实体融合的特征注意力权重;
[0019]将若干所述候选段落信息实体基于所述特征注意力权重进行加权求和,得到融合若干所述问题信息实体的若干融合段落信息实体。
[0020]所述的问题解答方法,其中,所述获取若干所述融合段落信息实体对应的若干知识实体的步骤包括:
[0021]将若干所述融合段落信息实体输入知识图谱,获取若干所述融合段落信息实体相关的若干知识信息;其中,所述知识图谱中存储有与所述融合段落信息实体相关的若干知识信息;
[0022]对若干所述知识信息进行预处理,得到若干所述融合段落信息实体对应的若干知识实体。
[0023]所述的问题解答方法,其中,所述对若干所述知识信息进行预处理,得到若干所述融合段落信息实体对应的若干知识实体的步骤包括:
[0024]对若干所述知识信息进行分词处理,得到若干所述知识信息对应的若干知识分词;
[0025]将若干所述知识分词输入预设的词嵌入模型中,通过所述词嵌入模型对若干所述知识分词进行词向量转化,得到若干所述融合段落信息实体对应的若干知识实体。
[0026]所述的问题解答方法,其中,所述根据若干所述问题信息实体、若干所述融合段落信息实体以及若干所述知识实体构建实体图的步骤包括:
[0027]以若干所述问题信息实体为中心节点并以若干所述融合段落信息实体为子节点,构建基础图结构;
[0028]将若干所述知识实体添加到所述基础图结构中,构建实体图。
[0029]所述的问题解答方法,其中,所述将若干所述知识实体添加到所述基础图结构中,构建实体图的步骤包括:
[0030]将若干所述知识实体与所述基础图结构中对应的融合段落信息实体相连,并建立若干所述知识实体与所述基础图结构中对应的问题信息实体之间的连边,构建实体图。
[0031]所述的问题解答方法,其中,所述根据所述实体图确定所述待解答问题对应的特征向量的步骤包括:
[0032]采用子图采样算法确定所述实体图对应的若干子图;
[0033]对若干所述子图进行图卷积操作,确定所述待解答问题对应的特征向量。
[0034]所述的问题解答方法,其中,所述采用子图采样算法确定所述实体图对应的若干子图的步骤包括:
[0035]遍历所述实体图,获取所述实体图中各个所述问题信息实体对应的节点度;
[0036]根据所述节点度,生成以各个所述问题信息实体为中心节点的若干子图。
[0037]所述的问题解答方法,其中,所述根据所述节点度,生成以各个所述问题信息实体
为中心节点的若干子图的步骤包括:
[0038]在L≥M时,生成以各个所述问题信息实体为中心节点,有M个一阶邻居节点的子图;其中,L为节点度,M为预设超参数,L和M为正整数;或者
[0039]在L<M时,生成以各个所述问题信息实体为中心节点,有L个一阶邻居节点和N个二阶邻居节点的子图;其中,L为节点度,M为预设超参数,N为正整数,且L+N=M。
[0040]所述的问题解答方法,其中,所述根据所述特征向量确定所述待解答问题对应的目标答案的步骤包括:
[0041]将所述特征向量输入预先训练的分类器中,得到若干候选答案对应的概率分布;
[0042]从若干所述候选答案对应的概率分布中选择概率值最高的候选答案,确定为所述待解答问题对应的目标答案。
[0043]第二方面,本专利技术实施例还提供一种问题解答装置,其中,包括:
[0044]实体获取模块,用于获取待解答问题及所述待解答问题对应的若干关联段落,根据所述待解答问题和若干所述关联段落得到若干问题信息实体和若干融合段落信息实体;
[0045]图构建模块,用于获取若干所述融合段落信息实体对应的若干知识实体,根据若干所述问题信息实体、若干所述融本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种问题解答方法,其特征在于,包括:获取待解答问题及所述待解答问题对应的若干关联段落,根据所述待解答问题和若干所述关联段落得到若干问题信息实体和若干融合段落信息实体;获取若干所述融合段落信息实体对应的若干知识实体,根据若干所述问题信息实体、若干所述融合段落信息实体以及若干所述知识实体构建实体图;根据所述实体图确定所述待解答问题对应的特征向量,根据所述特征向量确定所述待解答问题对应的目标答案。2.根据权利要求1所述的问题解答方法,其特征在于,所述获取待解答问题及所述待解答问题对应的若干关联段落的步骤包括:获取待解答问题及预先存储的若干原始文档,根据所述待解答问题从若干所述原始文档中确定所述待解答问题对应的若干候选文档;根据所述待解答问题,从若干所述候选文档中确定所述待解答问题对应的若干关联段落。3.根据权利要求1所述的问题解答方法,其特征在于,所述根据所述待解答问题和若干所述关联段落得到若干问题信息实体和若干融合段落信息实体的步骤包括:对所述待解答问题和若干所述段落分别进行预处理,得到所述待解答问题对应的若干问题信息实体和若干所述段落对应的若干候选段落信息实体;通过注意力机制对若干所述问题信息实体和若干所述候选段落信息实体进行融合,得到若干融合段落信息实体。4.根据权利要求3所述的问题解答方法,其特征在于,所述通过注意力机制对若干所述问题信息实体和若干所述候选段落信息实体进行融合,得到若干融合段落信息实体的步骤包括:对若干所述问题信息实体和若干所述候选段落信息实体进行注意力计算,得到若干所述问题信息实体和若干所述候选段落信息实体融合的特征注意力权重;将若干所述候选段落信息实体基于所述特征注意力权重进行加权求和,得到融合若干所述问题信息实体的若干融合段落信息实体。5.根据权利要求1所述的问题解答方法,其特征在于,所述获取若干所述融合段落信息实体对应的若干知识实体的步骤包括:将若干所述融合段落信息实体输入知识图谱,获取若干所述融合段落信息实体相关的若干知识信息;其中,所述知识图谱中存储有与所述融合段落信息实体相关的若干知识信息;对若干所述知识信息进行预处理,得到若干所述融合段落信息实体对应的若干知识实体。6.根据权利要求5所述的问题解答方法,其特征在于,所述对若干所述知识信息进行预处理,得到若干所述融合段落信息实体对应的若干知识实体的步骤包括:对若干所述知识信息进行分词处理,得到若干所述知识信息对应的若干知识分词;将若干所述知识分词输入预设的词嵌入模型中,通过所述词嵌入模型对若干所述知识分词进行词向量转化,得到若干所述融合段落信息实体对应...

【专利技术属性】
技术研发人员:曹源
申请(专利权)人:TCL科技集团股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1