问答匹配方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:38102203 阅读:8 留言:0更新日期:2023-07-06 09:21
本申请涉及一种问答匹配方法、装置、计算机设备、存储介质和计算机程序产品。方法包括:获取用户问句,以及用户问句对应的多个候选问句;在各候选问句中筛选出目标候选问句;目标候选问句为与用户问句之间存在至少一个相同字符的候选问句;针对任一目标候选问句对应的任一相同字符,确定任一相同字符在用户问句中所在的用户词语,以及,确定任一相同字符在任一目标候选问句中所在的候选词语;在用户词语和候选词语不同的情况下,根据用户词语所表征的语义和候选词语所表征的语义之间的差异,对语义相似度进行调整;根据各目标候选问句对应的新的语义相似度,在各候选问句中筛选出与用户问句匹配的目标问句。采用本方法能够提高问答匹配的准确性。答匹配的准确性。答匹配的准确性。

【技术实现步骤摘要】
问答匹配方法、装置、计算机设备和存储介质


[0001]本申请涉及人工智能
,特别是涉及一种问答匹配方法、装置、计算机设备、存储介质和计算机程序产品。

技术介绍

[0002]随着自然语言处理和人工智能相关技术的发展,人们逐渐可以使用机器处理非结构化的自然语言数据来完成复杂的任务,例如问答系统。问答系统主要是解决问句的真实意图分析、问句和答案之间的匹配关系,理解以自然语言形式描述的用户提问,并返回匹配的正确答案。
[0003]问答系统回答用户问题的关键技术是问句匹配。然而自然语言的歧义性导致问句匹配面临字面相同语义不同的难点。例如,用户问句与候选问句具有重叠的字面内容,但是问句具有不同的语义。而相关技术中采用的问答匹配方法在这种情况下,依然会针对用户问句和候选问句计算出较高的匹配度,从而可能引发后续与用户问句语义的判定错误,进而无法准确给出符合用户问句意图的答案。
[0004]因此,相关技术中存在问答匹配准确度低的问题。

技术实现思路

[0005]基于此,有必要针对上述技术问题,提供一种能够提高问答匹配准确性的问答匹配方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
[0006]第一方面,本申请提供了一种问答匹配方法。所述方法包括:
[0007]获取用户问句,以及所述用户问句对应的多个候选问句;各所述候选问句与所述用户问句之间的字面匹配度满足预设匹配度条件;
[0008]在各所述候选问句中筛选出目标候选问句;所述目标候选问句为与所述用户问句之间存在至少一个相同字符的候选问句;
[0009]针对任一所述目标候选问句对应的任一相同字符,确定所述任一相同字符在所述用户问句中所在的词语,作为用户词语,以及,确定所述任一相同字符在所述任一目标候选问句中所在的词语,作为候选词语;
[0010]在所述用户词语和所述候选词语不同的情况下,根据所述用户词语所表征的语义和所述候选词语所表征的语义之间的差异,对所述任一目标候选问句与所述用户问句之间的语义相似度进行调整,得到所述任一目标候选问句对应的新的语义相似度;
[0011]根据各所述目标候选问句对应的新的语义相似度,在各所述候选问句中筛选出与所述用户问句匹配的目标问句;所述目标问句对应的答案为与所述用户问句匹配的答案。
[0012]在其中一个实施例中,所述在所述用户词语和所述候选词语不同的情况下,根据所述用户词语所表征的语义和所述候选词语所表征的语义之间的差异,对所述任一目标候选问句与所述用户问句之间的语义相似度进行调整,得到所述任一目标候选问句对应的新的语义相似度,包括:
[0013]根据所述候选词语和所述用户词语,确定待查询词语二元组;
[0014]在未在同义词数据库中查询到所述待查询词语二元组的情况下,判定所述用户词语所表征的语义和所述候选词语所表征的语义不同;
[0015]在所述用户词语所表征的语义和所述候选词语所表征的语义不同的情况下,对所述任一目标候选问句对应的语义相似度进行调整,得到所述任一目标候选问句对应的新的语义相似度。
[0016]在其中一个实施例中,所述在所述用户词语所表征的语义和所述候选词语所表征的语义不同的情况下,对所述任一目标候选问句对应的语义相似度进行调整,得到所述任一目标候选问句对应的新的语义相似度,包括:
[0017]将所述任一目标候选问句对应的相同字符中,对应的用户词语和对应的候选词语不同,且对应的用户词语所表征的语义和对应的候选词语所表征的语义不同的相同字符,作为所述任一目标候选问句与所述用户问句之间的目标相同字符;
[0018]确定所述任一目标候选问句与所述用户问句之间的所述目标相同字符的总数量,作为第一字符数量,以及确定所述用户问句中的字符的数量,作为第二字符数量;
[0019]根据所述第二字符数量和所述第一字符数量之间的比例以及预设的相似度调节参数,对所述任一目标候选问句对应的语义相似度进行调整,得到所述任一目标候选问句对应的新的语义相似度;所述新的语义相似度小于所述语义相似度。
[0020]在其中一个实施例中,所述相似度调节参数为对应的数值大于零的常数;所述根据所述第二字符数量和所述第一字符数量之间的比例以及预设的相似度调节参数,对所述任一目标候选问句对应的语义相似度进行调整,得到所述任一目标候选问句对应的新的语义相似度,包括:
[0021]确定所述第二字符数量和所述第一字符数量之间的比例,与所述预设的相似度调节参数之间的和;
[0022]确定所述任一目标候选问句对应的语义相似度与所述和之间的商,得到所述任一目标候选问句对应的新的语义相似度;所述新的语义相似度与所述第一字符数量呈正比关系。
[0023]在其中一个实施例中,所述针对任一所述目标候选问句对应的任一相同字符,确定所述任一相同字符在所述用户问句中所在的词语,作为用户词语,以及,确定所述任一相同字符在所述任一目标候选问句中所在的词语,作为候选词语,包括:
[0024]分别对所述用户问句和所述任一目标候选问句进行分词处理,得到分词后的用户问句和分词后的目标候选问句;
[0025]在所述分词后的用户问句中确定所述任一相同字符所在的词语,得到所述用户词语;
[0026]以及,在所述分词后的目标候选问句中确定所述任一相同字符所在的词语,得到所述候选词语。
[0027]在其中一个实施例中,所述在各所述候选问句中筛选出目标候选问句,包括:
[0028]在各所述候选问句中筛选出不完全匹配候选问句;所述不完全匹配候选问句为对应的字符串与所述用户问句对应的字符串不完全相等的候选问句;
[0029]在各所述不完全匹配候选问句中,筛选出与所述用户问句之间存在相同字符的不
完全匹配候选问句,作为所述目标候选问句。
[0030]在其中一个实施例中,所述根据各所述目标候选问句对应的新的语义相似度,在各所述候选问句中筛选出与所述用户问句匹配的目标问句,包括:
[0031]根据各所述目标候选问句对应的新的语义相似度,以及各所述候选问句中的各其余候选问句对应的语义相似度,在各所述候选问句中,筛选出对应的语义相似度最大的候选问句,作为待比较的候选问句;各所述其余候选问句为各所述候选问句中除各所述目标候选问句以外的候选问句;
[0032]在所述待比较的候选问句对应的语义相似度大于预设相似度阈值的情况下,将所述待比较的候选问句作为所述目标问句。
[0033]第二方面,本申请还提供了一种问答匹配装置。所述装置包括:
[0034]获取模块,用于获取用户问句,以及所述用户问句对应的多个候选问句;各所述候选问句与所述用户问句之间的字面匹配度满足预设匹配度条件;
[0035]第一筛选模块,用于在各所述候选问句中筛选出目标候选问句;所述目标候选问句为与所述用户问句之间存在至少一个相同字符的候选问句;
[0036]确定模块,用于针对任一所述目标候选问句对应的任一相同字符本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种问答匹配方法,其特征在于,所述方法包括:获取用户问句,以及所述用户问句对应的多个候选问句;各所述候选问句与所述用户问句之间的字面匹配度满足预设匹配度条件;在各所述候选问句中筛选出目标候选问句;所述目标候选问句为与所述用户问句之间存在至少一个相同字符的候选问句;针对任一所述目标候选问句对应的任一相同字符,确定所述任一相同字符在所述用户问句中所在的词语,作为用户词语,以及,确定所述任一相同字符在所述任一目标候选问句中所在的词语,作为候选词语;在所述用户词语和所述候选词语不同的情况下,根据所述用户词语所表征的语义和所述候选词语所表征的语义之间的差异,对所述任一目标候选问句与所述用户问句之间的语义相似度进行调整,得到所述任一目标候选问句对应的新的语义相似度;根据各所述目标候选问句对应的新的语义相似度,在各所述候选问句中筛选出与所述用户问句匹配的目标问句;所述目标问句对应的答案为与所述用户问句匹配的答案。2.根据权利要求1所述的方法,其特征在于,所述在所述用户词语和所述候选词语不同的情况下,根据所述用户词语所表征的语义和所述候选词语所表征的语义之间的差异,对所述任一目标候选问句与所述用户问句之间的语义相似度进行调整,得到所述任一目标候选问句对应的新的语义相似度,包括:根据所述候选词语和所述用户词语,确定待查询词语二元组;在未在同义词数据库中查询到所述待查询词语二元组的情况下,判定所述用户词语所表征的语义和所述候选词语所表征的语义不同;在所述用户词语所表征的语义和所述候选词语所表征的语义不同的情况下,对所述任一目标候选问句对应的语义相似度进行调整,得到所述任一目标候选问句对应的新的语义相似度。3.根据权利要求2所述的方法,其特征在于,所述在所述用户词语所表征的语义和所述候选词语所表征的语义不同的情况下,对所述任一目标候选问句对应的语义相似度进行调整,得到所述任一目标候选问句对应的新的语义相似度,包括:将所述任一目标候选问句对应的相同字符中,对应的用户词语和对应的候选词语不同,且对应的用户词语所表征的语义和对应的候选词语所表征的语义不同的相同字符,作为所述任一目标候选问句与所述用户问句之间的目标相同字符;确定所述任一目标候选问句与所述用户问句之间的所述目标相同字符的总数量,作为第一字符数量,以及确定所述用户问句中的字符的数量,作为第二字符数量;根据所述第二字符数量和所述第一字符数量之间的比例以及预设的相似度调节参数,对所述任一目标候选问句对应的语义相似度进行调整,得到所述任一目标候选问句对应的新的语义相似度;所述新的语义相似度小于所述语义相似度。4.根据权利要求3所述的方法,其特征在于,所述相似度调节参数为对应的数值大于零的常数;所述根据所述第二字符数量和所述第一字符数量之间的比例以及预设的相似度调节参数,对所述任一目标候选问句对应的语义相似度进行调整,得到所述任一目标候选问句对应的新的语义相似度,包括:确定所述第二字符数量和所述第一字符数量之间的比例,与所述预设的相似度调节参
数之间的和;确定所述任一目标候选问句对应的语义相似度与所述和之间的商,得到所述任一目标候选问句对应的新的语义相似度;所述新的语义相似度与所述第一字...

【专利技术属性】
技术研发人员:汪美玲
申请(专利权)人:工银科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1