当前位置: 首页 > 专利查询>浙江大学专利>正文

一种基于神经符号增强的知识库复杂查询方法技术

技术编号:35745096 阅读:14 留言:0更新日期:2022-11-26 18:49
本发明专利技术公开了一种基于神经符号增强的知识库复杂查询方法,利用关系映射操作中符号和神经单独推理并且互相转化的方式缓解图谱不全和多不推理中级联误差的问题,然后使用符号表示的上完成逻辑计算,并且转为嵌入表示,可以采用任何已知的神经推理方法代替框架中神经推理的部分,具有较强的扩展性。同时仅仅需要链接预测任务训练知识表示模型即可完成复杂逻辑的查询。该方法对于在知识图谱中表示中复杂逻辑问句的推理和查询具有很好的实用价值。值。值。

【技术实现步骤摘要】
一种基于神经符号增强的知识库复杂查询方法


[0001]本专利技术属于数据查询与处理
,具体涉及在知识图谱中基于神经和符号互相增强的复杂逻辑查询方法。

技术介绍

[0002]知识图谱近年来受到了工业界极大的重视,在很多领域都有了成功的应用,例如搜索引擎,智能客服,语音机器人等。很多大型知识图谱被逐渐构建起来,例如Google Knowledge Graph、以及开放的Freebase、Yago等。知识图谱主要包含实体、关系和三元组,每一个三元组表示一条知识,即两个实体之间存在某一种关系,用(h,r,t)表示,其中h,t分别表示头实体和尾实体,r表示关系,例如(杭州,位于国家是,中国)即表示了“杭州位于中国”这样一条知识。
[0003]在知识图谱中,复杂逻辑查询是一种针对数据查询所提出的方法。所谓复杂查询,即在查询过程中运用各种逻辑操作符号,例如与、或、非以及它们的组合在知识图谱中进行包含逻辑组合的查询。其与一般的知识图谱补全相比,需要进行的任务更加复杂,例如(杭州,位于国家是,X)作为一个典型的知识图谱补全样例,仅仅需要进行一步的推理就可以得到X的答案。但是作为一个复杂查询来说,其问题可能是“沿海的省会城市有哪些”,转换为逻辑表达式是

(X,位于,沿海地区)∧(X,级别,省会城市)

。类似于这样通过与、或、非等逻辑符号将简单的单步推理链接起来进行逻辑查询或者多步查询的被称之为知识图谱上的复杂查询。
[0004]在电商场景下,基于电商知识图谱的搜索查询被迫切需要,传统的通过遍历方式查找答案的方法虽然能够找到电商知识图谱确实存在的答案,但是由于电商知识图谱本身不全的问题,对于那些理论上正确,但是对于缺少了某个或多个关系标注的实体答案来说,则完全不可能找到。同时这类方法随着电商知识图谱规模的扩大,会导致查询时间不断增长。因此目前研究电商知识图谱上的复杂查询方法都是基于表示学习的方法,其核心思想是为每一个实体和关系学习一个向量空间中的表示,在进行复杂逻辑查询时会根据查询语句得到一个同样空间中的答案表示,最后通过这些表示之间的计算完成隐式的推理。
[0005]已有的知识图谱复杂逻辑查询方法基本都在专注于缓解电商知识图谱不全的问题并且支持不同的逻辑操作符,但是复杂查询因为其需要进行多步推理的特性,级联误差也是不得不需要考虑的问题。所谓级联误差即通过表示学习进行的推理计算在一步推理中产生的误差会积累到下一步,因此在进行了多步推理以后,最终的答案表示会因为累积的误差与正确答案的表示相差较远。

技术实现思路

[0006]鉴于上述,本专利技术的目是提供一种基于神经符号增强的知识库复杂查询方法,能够降低通过知识表示查找产生的级联误差,在缓解电商知识图谱不全的问题同时还支持不同的逻辑操作符运算,适配各类知识表示模型的知识表示学习,提升复杂查询的准确性。
[0007]为实现上述专利技术目的,实施例提供的一种基于神经符号增强的知识库复杂查询方法,包括以下步骤:
[0008]步骤1,接收关于商品查询的逻辑表达式,其中,逻辑表达式通过逻辑操作连接缺失三元组形成;
[0009]步骤2中,利用参数优化的知识表示模型学习逻辑表达式中缺失三元组中已知实体和关系的嵌入表示,同时初始化逻辑表达式中初始实体的符号表示,符号表示中每个元素代表对应实体的概率值;
[0010]步骤3,对于逻辑表达式中缺失三元组,基于实体的嵌入表示和符号表示进行缺失三元组的关系映射推理,以预测缺失三元组中缺失实体的嵌入表示和符号表示,利用缺失实体的嵌入表示补充缺失实体的符号表示,并利用补充后的符号表示修正缺失实体的嵌入表示;
[0011]步骤4,对于逻辑表达式中的逻辑操作,基于缺失实体的符号表示进行逻辑操作推理,得到预测实体的符号表示,并基于预测实体的符号表示计算预测实体的嵌入表示;
[0012]步骤5,将预测实体作为候选目标实体时,综合预测实体的符号表示和嵌入表示来从候选目标实体中确定最终的目标实体,该目标实体即为针对逻辑表达式得到的查询结果。
[0013]与现有技术相比,本专利技术具有的有益效果至少包括:
[0014]在进行关系映射时,使用符号推理(基于符号表示的映射推理)和神经推理(基于嵌入表示的映射推理)互相增强,缓解电商知识图谱不全和级联误差的问题。
[0015]针对神经推理部分,可以采用任何能够进行关系连接预测的知识表示模型,拓宽了应用领域。
[0016]由于逻辑操作不涉及参数,仅采用关系连接预测任务就可以完成知识表示模型的训练,在实际应用中更加容易部署,并且在复杂逻辑查询上取得显著效果,提升复杂查询的准确性。
附图说明
[0017]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图做简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动前提下,还可以根据这些附图获得其他附图。
[0018]图1是实施例提供的基于神经符号增强的知识库复杂查询方法的流程图;
[0019]图2是实施例提供的商品搜索语句实例的逻辑表达式的图形化示意图;
[0020]图3实施例提供的关系映射推理示意图和逻辑操作符原理示意图。
具体实施方式
[0021]为使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例对本专利技术进行进一步的详细说明。应当理解,此处所描述的具体实施方式仅仅用以解释本专利技术,并不限定本专利技术的保护范围。
[0022]在目前的电商应用场景下,搜索业务逻辑可以表示为“搜索Query

查询语义理解

召回

排序

搜索结果”。在商品搜索时,接收逻辑表达式形式的Query,这种Query可能包含复杂的逻辑语义,所以需要借助与、或、非的逻辑操作来进行完整的语义表示,将其表达成规则的逻辑表达式之后,才便于计算机对其进行查询,召回相关文档或商品,按客户实际的搜索意图通过算法进行前后排序,最终解决其搜索需求,实现业务转化的操作。实施例提供了一种在这种有逻辑参与的Query场景下完成查询的方法,考虑到在现实的电商知识图谱不完整的情况下,用遍历方式无法找到的所有的正确答案实体,实施例采用嵌入表示学习的方法进行查询,同时利用符号表示解决多步查询中的级联误差问题。
[0023]如图1所示,实施例提供的基于神经符号增强的知识库复杂查询方法,包括以下步骤:
[0024]步骤1,接收关于商品查询的逻辑表达式,其中,逻辑表达式通过逻辑操作连接缺失三元组形成。
[0025]实施例中,逻辑操作包括与操作符、或操作符、非操作符,如图3中所示原理,正常三元组由头实体、关系和尾实体组成,缺失三元组表示正常三元组中缺失头实体、尾实体或者头尾实体形成的三元组。针对接收的关于商品查询的逻辑表达式,该逻辑表达式通过逻辑操作连接缺失三元组形成,表示为本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于神经符号增强的知识库复杂查询方法,包括以下步骤:步骤1,接收关于商品查询的逻辑表达式,其中,逻辑表达式通过逻辑操作连接缺失三元组形成;步骤2,利用参数优化的知识表示模型学习逻辑表达式中缺失三元组中已知实体和关系的嵌入表示,同时初始化关系映射中初始实体的符号表示,符号表示中每个元素代表对应实体的概率值;步骤3,对于逻辑表达式中缺失三元组,基于实体的嵌入表示和符号表示进行缺失三元组的关系映射推理,以预测缺失三元组中缺失实体的嵌入表示和符号表示,利用缺失实体的嵌入表示补充缺失实体的符号表示,并利用补充后的缺失实体的符号表示修正缺失实体的嵌入表示;步骤4,对于逻辑表达式中的逻辑操作,基于缺失实体的符号表示进行逻辑操作推理,得到预测实体的符号表示,并基于预测实体的符号表示计算预测实体的嵌入表示;步骤5,将预测实体作为候选目标实体时,综合预测实体的符号表示和嵌入表示来从候选目标实体中确定最终的目标实体,该目标实体即为针对逻辑表达式得到的查询结果。2.根据权利要求1所述的基于神经符号增强的知识库复杂查询方法,其特征在于,步骤3中,基于初始实体的嵌入表示和符号表示进行缺失三元组的关系映射推理,包括:基于嵌入表示的映射推理:根据缺失三元组中已知实体的嵌入表示v
h
和关系的嵌入表示v
r
,计算缺失三元组中缺失实体的嵌入表示其中,符号表示哈达玛积;基于符号表示的映射推理:根据电商知识图谱的关系邻接矩阵M
r
和缺失三元组中已知实体的符号表示p
h
,计算缺失三元组中缺失实体的符号表示p
t
=g(p
h
M
r
)
T
,其中,g(
·
)表示归一化函数。3.根据权利要求1或2所述的基于神经符号增强的知识库复杂查询方法,其特征在于,步骤3中,利用缺失实体的嵌入表示补充缺失实体的符号表示,并利用补充后的符号表示修正缺失实体的嵌入表示,包括:首先,计算缺失实体的嵌入表示v
t
与电商知识图谱中所有实体的嵌入表示之间的相似度,得到相似度向量Y;然后,对相似度向量Y做激活处理后得到p
t

,将p
t

添加到缺失实体的符号表示p
t
中,进行归一化处理得到p
t

;最后,利用p
t

来修正缺失实体的嵌入表示v
r
,得到修正后的嵌入表示v
t

:其中,S
t
表示符号表示p
t

中非零元素对应的实体的集合,e
i
表示属于集合S
t
中的第i个实体,表示实体e
i
的嵌入表示,MLP()表示多层感知机,表示符号表示p
t

中实体e
i
对应的概率值,|S
t
|表示集合S
t
中实体的数量。4.根据权利要求1所述的基于神经符号增强的知识库复杂查询方法,其特征在于,步骤4中,逻辑操作推理包括:针对逻辑表达式中的逻辑操作与:根据已知逻辑操作与连接的两个缺失三元组中缺失
实体的符号表示p1和p2,对p1和p2进行与操作,即p1∧p2,对应计算预测实体的符号表示其中,g(
·
)表示归一化函数,符号表示哈达玛积;针对逻辑表达式中的逻辑操作或:根据已知逻辑操作或连接的两个缺失三元组中缺失实体的符号表示p1和p2,对p1和p2进行或操作,即p1∨p2,对应计算预测实体的符号表示针对逻辑表达式中的逻辑操作非:根据已知逻辑操作非连接的缺失三元组中缺失实体的符号表示p,对p进行非操作,即对应计算预测实体的符号表示其中,α表示常数,|n
e
|表示电商知识图谱中实体的数量。5.根据权利要求1所述的基于神经符号增强的知识库复杂查询方法,其特征在于,步骤4中,基于预测实体的符号表示计算预测实体的嵌入表示,包括:其...

【专利技术属性】
技术研发人员:陈华钧许泽众张文叶鹏
申请(专利权)人:浙江大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1