一种基于知识图谱的问答搜索方法、系统、设备和介质技术方案

技术编号:34567188 阅读:13 留言:0更新日期:2022-08-17 12:57
本申请提出一种基于知识图谱的问答搜索方法、系统、设备和介质,包括:根据预设业务归属对预设知识图谱中实体节点进行分类,得到实体标识并建立实体节点与实体标识的映射关系;获取询问文本中的询问实体,根据所述询问实体对所述知识图谱中实体节点进行匹配,得到匹配节点,所述匹配节点包括一个或多个;根据所述实体节点与实体标识的映射关系确定所述匹配节点的业务归属,并根据所述业务归属确定与所述匹配节点连接的实体节点和属性节点,得到候选路径;根据所述候选路径生成候选文本,将所述候选文本与所述询问文本进行比对,输出匹配的候选文本。本申请可有效提高知识图谱搜索的泛化能力。泛化能力。泛化能力。

【技术实现步骤摘要】
一种基于知识图谱的问答搜索方法、系统、设备和介质


[0001]本申请涉及人工智能领域,尤其涉及一种基于知识图谱的问答搜索方法、系统、设备和介质。

技术介绍

[0002]现阶段,数据是第一生产力,每个公司和企业在发展过程中都会沉淀下大量的数据。数据本身潜在的价值也无比巨大。随着科技的进步,智能机器人的不断发展,如何让智能机器人更加智能,无疑是行业的重中之重。知识图谱,作为智能机器人的大脑之一,如何将知识图谱中的知识有效的挖掘和利用起来,也是当前一大难题。
[0003]现有方法中采用检索方式对知识图谱中的节点进行精准检索,然后针对返回节点的属性和名称,将答案主体整合成一个完整的语句进行答案输出。这类方法的缺点是泛化能力很差,在实际场景中,用户的问题肯定不会按照标准来执行,所以该方法据有很大的局限性。
[0004]申请内容
[0005]鉴于以上现有技术存在的问题,本申请提出一种基于知识图谱的问答搜索方法、系统、设备和介质,主要解决现有知识图谱搜索方法泛化能力差的问题。
[0006]为了实现上述目的及其他目的,本申请采用的技术方案如下。
[0007]本申请提供一种基于知识图谱的问答搜索方法,包括:
[0008]根据预设业务归属对预设知识图谱中实体节点进行分类,得到实体标识并建立实体节点与实体标识的映射关系;
[0009]获取询问文本中的询问实体,根据所述询问实体对所述知识图谱中实体节点进行匹配,得到匹配节点,所述匹配节点包括一个或多个;
[0010]根据所述实体节点与实体标识的映射关系确定所述匹配节点的业务归属,并根据所述业务归属确定与所述匹配节点连接的实体节点和属性节点,得到候选路径;
[0011]根据所述候选路径生成候选文本,将所述候选文本与所述询问文本进行比对,输出匹配的候选文本。
[0012]在本申请一实施例中,根据预设业务归属对预设知识图谱中实体节点进行分类,得到实体标识并建立实体节点与实体标识的映射关系,包括:
[0013]根据所述知识图谱中实体节点与预设业务词典中业务词汇进行比对,得到与所述实体节点匹配的业务词汇;
[0014]根据所述业务词典中各业务词汇预设的索引信息确定所述匹配的业务词汇的业务归属作为所述实体节点的实体标识。
[0015]在本申请一实施例中,获取询问文本中的询问实体,包括:
[0016]根据预设业务场景词汇对所述询问文本进行分词,得到多个询问词;
[0017]将所述询问词输入预设命名实体识别模型,得到所述询问实体。
[0018]在本申请一实施例中,根据所述询问实体对所述知识图谱中实体节点进行匹配,
得到匹配节点,包括:
[0019]获取各用户的历史访问记录,根据所述历史访问记录确定使用频率高于设定阈值的词汇作为高频词汇;
[0020]根据所述高频词汇对所述知识图谱进行筛选以确定所述知识图谱的边界,将所述询问实体与筛选后的知识图谱中的实体节点进行匹配,得到所述匹配节点。
[0021]在本申请一实施例中,根据所述业务归属确定与所述匹配节点连接的实体节点和属性节点,得到候选路径,包括:
[0022]当所述匹配节点为单个节点或对应同一业务归属时,遍历所述知识图谱,获取与所述匹配节点具有属性关系的属性节点,得到包含所述匹配节点的子图关系,将所述子图关系中的节点和节点对应的属性作为候选路径;
[0023]当所述匹配节点包含多个不同的业务归属时,将各所述匹配节点关联,基于关联的所述匹配节点获取所述知识图谱中匹配的子图关系,根据所述子图关系生成候选路径。
[0024]在本申请一实施例中,根据所述候选路径生成候选文本,将所述候选文本与所述询问文本进行比对,输出匹配的候选文本,包括:
[0025]将所述候选路径中的节点以及节点属性转换成标准文本作为所述候选文本;
[0026]将所述候选文本和所述询问文本输入预设匹配模型,得到各候选文本与所述询问文本的相似度;
[0027]根据所述相似度由高到低进行排序,将排序在前的多个候选文本作为匹配的候选文本进行输出。
[0028]在本申请一实施例中,所述匹配模型至少包括两条输入路径、一个注意力层、一个池化层、一个融合层以及一个相似计算网络;
[0029]每条所述输入路径至少包括一个用于获取输入文本的序列信息的循环网络层和一个用于获取输入文本中关键词信息的卷积网络层,通过所述循环网络层和所述卷积网络层依次串行对输入文本进行编码;
[0030]每条所述输入路径分别对各自的输入文本进行编码后得到的输出序列依次经过所述注意力层、池化层、融合层和相似计算网络,得到两条输入路径的输入文本的相似度。
[0031]本申请还提供一种基于知识图谱的问答搜索系统,包括:
[0032]图谱映射模块,用于根据预设业务归属对预设知识图谱中实体节点进行分类,得到实体标识并建立实体节点与实体标识的映射关系;
[0033]询问匹配模块,用于获取询问文本中的询问实体,根据所述询问实体对所述知识图谱中实体节点进行匹配,得到匹配节点,所述匹配节点包括一个或多个;
[0034]候选匹配模块,用于根据所述实体节点与实体标识的映射关系确定所述匹配节点的业务归属,并根据所述业务归属确定与所述匹配节点连接的实体节点和属性节点,得到候选路径;
[0035]匹配输出模块,用于根据所述候选路径生成候选文本,将所述候选文本与所述询问文本进行比对,输出匹配的候选文本。
[0036]本申请还提供一种计算机设备,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现所述的基于知识图谱的问答搜索方法的步骤。
[0037]本申请还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现所述的基于知识图谱的问答搜索方法的步骤。
[0038]如上所述,本申请一种基于知识图谱的问答搜索方法、系统、设备和介质,具有以下有益效果。
[0039]本申请通过根据预设业务归属对预设知识图谱中实体节点进行分类,得到实体标识并建立实体节点与实体标识的映射关系;获取询问文本中的询问实体,根据所述询问实体对所述知识图谱中实体节点进行匹配,得到匹配节点,所述匹配节点包括一个或多个;根据所述实体节点与实体标识的映射关系确定所述匹配节点的业务归属,并根据所述业务归属确定与所述匹配节点连接的实体节点和属性节点,得到候选路径;根据所述候选路径生成候选文本,将所述候选文本与所述询问文本进行比对,输出匹配的候选文本。本申请根据询问文本的实体信息从知识图谱中按照实体节点的业务归属进行子图关系搜索获取候选路径,基于候选路径生成候选文本与询问文本进行匹配,增加检索匹配的泛化性能,可匹配更灵活的用户问法,增强用户体验。
附图说明
[0040]图1为本申请一实施例中基于知识图谱的问答搜索系统的架构示意图。
[0041]图本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于知识图谱的问答搜索方法,其特征在于,包括:根据预设业务归属对预设知识图谱中实体节点进行分类,得到实体标识并建立实体节点与实体标识的映射关系;获取询问文本中的询问实体,根据所述询问实体对所述知识图谱中实体节点进行匹配,得到匹配节点,所述匹配节点包括一个或多个;根据所述实体节点与实体标识的映射关系确定所述匹配节点的业务归属,并根据所述业务归属确定与所述匹配节点连接的实体节点和属性节点,得到候选路径;根据所述候选路径生成候选文本,将所述候选文本与所述询问文本进行比对,输出匹配的候选文本。2.根据权利要求1所述的基于知识图谱的问答搜索方法,其特征在于,根据预设业务归属对预设知识图谱中实体节点进行分类,得到实体标识并建立实体节点与实体标识的映射关系,包括:根据所述知识图谱中实体节点与预设业务词典中业务词汇进行比对,得到与所述实体节点匹配的业务词汇;根据所述业务词典中各业务词汇预设的索引信息确定所述匹配的业务词汇的业务归属作为所述实体节点的实体标识。3.根据权利要求1所述的基于知识图谱的问答搜索方法,其特征在于,获取询问文本中的询问实体,包括:根据预设业务场景词汇对所述询问文本进行分词,得到多个询问词;将所述询问词输入预设命名实体识别模型,得到所述询问实体。4.根据权利要求1所述的基于知识图谱的问答搜索方法,其特征在于,根据所述询问实体对所述知识图谱中实体节点进行匹配,得到匹配节点,包括:获取各用户的历史访问记录,根据所述历史访问记录确定使用频率高于设定阈值的词汇作为高频词汇;根据所述高频词汇对所述知识图谱进行筛选以确定所述知识图谱的边界,将所述询问实体与筛选后的知识图谱中的实体节点进行匹配,得到所述匹配节点。5.根据权利要求1所述的基于知识图谱的问答搜索方法,其特征在于,根据所述业务归属确定与所述匹配节点连接的实体节点和属性节点,得到候选路径,包括:当所述匹配节点为单个节点或对应同一业务归属时,遍历所述知识图谱,获取与所述匹配节点具有属性关系的属性节点,得到包含所述匹配节点的子图关系,将所述子图关系中的节点和节点对应的属性作为候选路径;当所述匹配节点包含多个不同的业务归属时,将各所述匹配节点关联,基于关联的所述匹配...

【专利技术属性】
技术研发人员:陈浩
申请(专利权)人:重庆长安汽车股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1