知识问答的匹配方法、装置、设备及存储介质制造方法及图纸

技术编号:30329468 阅读:24 留言:0更新日期:2021-10-10 00:31
本申请涉及人工智能技术领域,揭示了一种知识问答的匹配方法、装置、设备及存储介质,其中方法包括:分别将所述目标问题文本中的每个问题单字符在所述倒排索引库中进行查询,得到问题单字符评分集合,所述问题单字符评分集合包括:问题单字符、答案文本和问题单字符与答案相关性评分;根据所述问题单字符评分集合,针对每个所述答案文本进行所述问题单字符与答案相关性评分的求和计算,得到相关性总评分集合;根据所述相关性总评分集合确定目标相关性总评分;将所述目标相关性总评分对应的所述答案文本作为目标答案文本。通过提前构建的倒排索引库进行问题与答案的匹配,实现了在每个问题与答案对之间采用字符级交互,提高了线上查询响应速度。查询响应速度。查询响应速度。

【技术实现步骤摘要】
知识问答的匹配方法、装置、设备及存储介质


[0001]本申请涉及到人工智能
,特别是涉及到一种知识问答的匹配方法、装置、设备及存储介质。

技术介绍

[0002]基于知识库的开放领域问答系统(OpenQA)是针对用户提出的问题,首先从大量的文章里检索出相关的文章、然后从相关的文章里定位到答案。解决OpenQA的一种有效方法是大规模机器阅读(MRS),具体为:(1)文档检索器,MRS利用信息检索(IR)系统,使用比如bigram(网络二元模型)和TF

IDF(用于信息检索与数据挖掘的常用加权技术),快速检索出相关段落列表;(2)文档阅读器,使用比如LSTM(长短期记忆人工神经网络)模型找出正确答案。然而,这种方法受其串行性质的限制,并且第一阶段的文档检索器是不可训练的,检索时可能不会返回包含正确答案的段落。
[0003]为了解决这个问题,之前的工作主要集中在用可训练的端到端检索器来替换第一阶段的文档检索器,也有人提出通过直接检索答案跨度将段落检索和机器阅读结合起来。尽管两种方法存在差异,但是两种方法都建立在双编码器架构之上,首先将答案和问题被编码为固定大小的线性向量,两个线性向量的相关性分数是通过点积计算的,然后使用近似最近邻(ANN)搜索来实现大型数据集的实时检索。由于双编码器架构的模型建模较为复杂,且是是必要的,一旦替换为过度简化的编码与匹配功能,性能会大幅度下降。但是双编码器架构的模型性能较差、推理速度较慢,导致线上查询响应慢。

技术实现思路

[0004]本申请的主要目的为提供一种知识问答的匹配方法、装置、设备及存储介质,旨在解决现有技术在采用双编码器架构的模型进行问题与答案编码、点积计算相关性分数和近似最近邻搜索时,因双编码器架构的模型性能较差、推理速度较慢,导致线上查询响应慢的技术问题。
[0005]为了实现上述专利技术目的,本申请提出一种知识问答的匹配方法,所述方法包括:
[0006]获取目标问题文本和倒排索引库;
[0007]分别将所述目标问题文本中的每个问题单字符在所述倒排索引库中进行查询,得到问题单字符评分集合,所述问题单字符评分集合包括:问题单字符、答案文本和问题单字符与答案相关性评分;
[0008]根据所述问题单字符评分集合,针对每个所述答案文本进行所述问题单字符与答案相关性评分的求和计算,得到相关性总评分集合;
[0009]根据所述相关性总评分集合确定目标相关性总评分;
[0010]将所述目标相关性总评分对应的所述答案文本作为目标答案文本。
[0011]进一步的,所述获取目标问题文本和倒排索引库的步骤之前,包括:
[0012]获取多个待评分的问题单字符;
[0013]从多个所述待评分的问题单字符中获取所述待评分的问题单字符作为目标问题单字符;
[0014]将所述目标问题单字符输入相关性评分模型进行问题单字符与答案的相关性评分计算,得到答案文本相关性评分集合,所述答案文本相关性评分集合包括:所述答案文本和所述问题单字符与答案相关性评分;
[0015]将所述目标问题单字符、所述答案文本相关性评分集合作为关联数据更新所述倒排索引库;
[0016]重复执行所述从多个所述待评分的问题单字符中获取所述待评分的问题单字符作为目标问题单字符的步骤,直至完成所述待评分的问题单字符的获取。
[0017]进一步的,所述将所述目标问题单字符输入相关性评分模型进行问题单字符与答案的相关性评分计算,得到答案文本相关性评分集合的步骤之前,还包括:
[0018]获取多个待采样样本,所述待采样样本包括:问题样本文本、答案及答案上下文样本、第一答案标定值;
[0019]采用预设划分规则,对多个所述待采样样本进行划分,得到多个初始样本集;
[0020]从多个所述初始样本集中获取所述初始样本集作为目标初始样本集;
[0021]采用批次内负采样的方法,根据所述目标初始样本集进行训练样本生成,得到训练样本集合;
[0022]采用所述训练样本集合对初始模型进行训练;
[0023]重复执行所述从多个所述初始样本集中获取所述初始样本集作为目标初始样本集的步骤,直至满足预设模型训练结束条件,将满足所述预设模型训练结束条件的所述初始模型作为所述相关性评分模型。
[0024]进一步的,所述采用所述训练样本集合对初始模型进行训练的步骤,包括:
[0025]从所述训练样本集合中获取训练样本作为目标训练样本;
[0026]将所述目标训练样本的所述问题样本文本输入所述初始模型的问题编码层进行不涉及上下文的编码,得到问题编码向量;
[0027]将所述目标训练样本的答案及答案上下文正样本输入所述初始模型的答案编码层进行涉及上下文的编码,得到正答案编码向量;
[0028]分别将所述目标训练样本的答案及答案上下文负样本集合中的每个答案及答案上下文负样本输入所述答案编码层进行涉及上下文的编码,得到负答案编码向量集合;
[0029]采用所述初始模型的匹配分数计算层,对所述问题编码向量、所述正答案编码向量和所述负答案编码向量集合进行问题与答案的匹配分数计算,得到问题与正答案匹配分数和问题与负答案匹配分数集合;
[0030]采用所述初始模型的向量稀疏层,分别对所述问题与正答案匹配分数和所述问题与负答案匹配分数集合进行向量稀疏处理,得到问题与正答案稀疏匹配分数和问题与负答案稀疏匹配分数集合;
[0031]将所述问题与正答案稀疏匹配分数和所述问题与负答案稀疏匹配分数集合输入损失函数进行损失值计算,得到目标损失值;
[0032]根据所述目标损失值更新所述初始模型的参数;
[0033]重复执行所述从所述训练样本集合中获取训练样本作为目标训练样本的步骤,直
至完成所述训练样本集合中的所述训练样本的获取。
[0034]进一步的,问题与答案匹配分数中的第i个匹配分数的计算公式y
i
为:
[0035][0036]其中,是对e
i
的转置计算,e
i
是所述目标训练样本的所述问题样本文本中的第i个字符在所述问题编码向量中对应的向量元素,s
j
是答案编码向量的第j个字符对应的向量元素,|c|是答案编码向量对应的字符数量,max
j∈[1,|c|]是在的s
j
维度计算最大值;
[0037]当所述问题与答案匹配分数是所述问题与正答案匹配分数时,所述答案编码向量是所述正答案编码向量;
[0038]当所述问题与答案匹配分数是所述问题与负答案匹配分数集合中的问题与负答案匹配分数时,所述答案编码向量是所述负答案编码向量集合中的任一个负答案编码向量。
[0039]进一步的,问题与答案稀疏匹配分数中的第i个稀疏匹配分数的计算公式P(y
i
)为:
[0040]P(y
i
)=ReLU(y...

【技术保护点】

【技术特征摘要】
1.一种知识问答的匹配方法,其特征在于,所述方法包括:获取目标问题文本和倒排索引库;分别将所述目标问题文本中的每个问题单字符在所述倒排索引库中进行查询,得到问题单字符评分集合,所述问题单字符评分集合包括:问题单字符、答案文本和问题单字符与答案相关性评分;根据所述问题单字符评分集合,针对每个所述答案文本进行所述问题单字符与答案相关性评分的求和计算,得到相关性总评分集合;根据所述相关性总评分集合确定目标相关性总评分;将所述目标相关性总评分对应的所述答案文本作为目标答案文本。2.根据权利要求1所述的知识问答的匹配方法,其特征在于,所述获取目标问题文本和倒排索引库的步骤之前,包括:获取多个待评分的问题单字符;从多个所述待评分的问题单字符中获取所述待评分的问题单字符作为目标问题单字符;将所述目标问题单字符输入相关性评分模型进行问题单字符与答案的相关性评分计算,得到答案文本相关性评分集合,所述答案文本相关性评分集合包括:所述答案文本和所述问题单字符与答案相关性评分;将所述目标问题单字符、所述答案文本相关性评分集合作为关联数据更新所述倒排索引库;重复执行所述从多个所述待评分的问题单字符中获取所述待评分的问题单字符作为目标问题单字符的步骤,直至完成所述待评分的问题单字符的获取。3.根据权利要求2所述的知识问答的匹配方法,其特征在于,所述将所述目标问题单字符输入相关性评分模型进行问题单字符与答案的相关性评分计算,得到答案文本相关性评分集合的步骤之前,还包括:获取多个待采样样本,所述待采样样本包括:问题样本文本、答案及答案上下文样本、第一答案标定值;采用预设划分规则,对多个所述待采样样本进行划分,得到多个初始样本集;从多个所述初始样本集中获取所述初始样本集作为目标初始样本集;采用批次内负采样的方法,根据所述目标初始样本集进行训练样本生成,得到训练样本集合;采用所述训练样本集合对初始模型进行训练;重复执行所述从多个所述初始样本集中获取所述初始样本集作为目标初始样本集的步骤,直至满足预设模型训练结束条件,将满足所述预设模型训练结束条件的所述初始模型作为所述相关性评分模型。4.根据权利要求3所述的知识问答的匹配方法,其特征在于,所述采用所述训练样本集合对初始模型进行训练的步骤,包括:从所述训练样本集合中获取训练样本作为目标训练样本;将所述目标训练样本的所述问题样本文本输入所述初始模型的问题编码层进行不涉及上下文的编码,得到问题编码向量;
将所述目标训练样本的答案及答案上下文正样本输入所述初始模型的答案编码层进行涉及上下文的编码,得到正答案编码向量;分别将所述目标训练样本的答案及答案上下文负样本集合中的每个答案及答案上下文负样本输入所述答案编码层进行涉及上下文的编码,得到负答案编码向量集合;采用所述初始模型的匹配分数计算层,对所述问题编码向量、所述正答案编码向量和所述负答案编码向量集合进行问题与答案的匹配分数计算,得到问题与正答案匹配分数和问题与负答案匹配分数集合;采用所述初始模型的向量稀疏层,分别对所述问题与正答案匹配分数和所述问题与负答案匹配分数集合进行向量稀疏处理,得到问题与正答案稀疏匹配分数和问题与负答案稀疏匹配分数集合;将所述问题与正答案稀疏匹配分数和所述问题与负答案稀疏匹配分数集合输入损失函数进行损失值计算,得到目标损失值;根据所述目标损失值更新所述初始模型的参数;重复执行所述从所述训练样本集合中获取训练样本作为目标训练样本的步骤,直至完成所述训练样本集合中的所述训练样本的获取。5.根据权利要求4所述的知识问答的匹配方法,其特征在于,问题与答案匹配分数中的第i个匹配分数的计算公式y
i
为:其中,是对e
i
的转置计算,e
i
是所述目标训练样本的所述问题样本文本中的第i个字符在所述问题编码向量中对应的向量元素,s
...

【专利技术属性】
技术研发人员:杨修远
申请(专利权)人:平安国际智慧城市科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1