【技术实现步骤摘要】
一种基于神经符号增强的知识库复杂查询方法
[0001]本专利技术属于数据查询与处理
,具体涉及在知识图谱中基于神经和符号互相增强的复杂逻辑查询方法。
技术介绍
[0002]知识图谱近年来受到了工业界极大的重视,在很多领域都有了成功的应用,例如搜索引擎,智能客服,语音机器人等。很多大型知识图谱被逐渐构建起来,例如Google Knowledge Graph、以及开放的Freebase、Yago等。知识图谱主要包含实体、关系和三元组,每一个三元组表示一条知识,即两个实体之间存在某一种关系,用(h,r,t)表示,其中h,t分别表示头实体和尾实体,r表示关系,例如(杭州,位于国家是,中国)即表示了“杭州位于中国”这样一条知识。
[0003]在知识图谱中,复杂逻辑查询是一种针对数据查询所提出的方法。所谓复杂查询,即在查询过程中运用各种逻辑操作符号,例如与、或、非以及它们的组合在知识图谱中进行包含逻辑组合的查询。其与一般的知识图谱补全相比,需要进行的任务更加复杂,例如(杭州,位于国家是,X)作为一个典型的知识图谱补全样例,仅仅需要进行一步的推理就可以得到X的答案。但是作为一个复杂查询来说,其问题可能是“沿海的省会城市有哪些”,转换为逻辑表达式是
‘
(X,位于,沿海地区)∧(X,级别,省会城市)
’
。类似于这样通过与、或、非等逻辑符号将简单的单步推理链接起来进行逻辑查询或者多步查询的被称之为知识图谱上的复杂查询。
[0004]在电商场景下,基于电商知识图谱的搜索查询被迫切需 ...
【技术保护点】
【技术特征摘要】
1.一种基于神经符号增强的知识库复杂查询方法,包括以下步骤:步骤1,接收关于商品查询的逻辑表达式,其中,逻辑表达式通过逻辑操作连接缺失三元组形成;步骤2,利用参数优化的知识表示模型学习逻辑表达式中缺失三元组中已知实体和关系的嵌入表示,同时初始化关系映射中初始实体的符号表示,符号表示中每个元素代表对应实体的概率值;步骤3,对于逻辑表达式中缺失三元组,基于实体的嵌入表示和符号表示进行缺失三元组的关系映射推理,以预测缺失三元组中缺失实体的嵌入表示和符号表示,利用缺失实体的嵌入表示补充缺失实体的符号表示,并利用补充后的缺失实体的符号表示修正缺失实体的嵌入表示;步骤4,对于逻辑表达式中的逻辑操作,基于缺失实体的符号表示进行逻辑操作推理,得到预测实体的符号表示,并基于预测实体的符号表示计算预测实体的嵌入表示;步骤5,将预测实体作为候选目标实体时,综合预测实体的符号表示和嵌入表示来从候选目标实体中确定最终的目标实体,该目标实体即为针对逻辑表达式得到的查询结果。2.根据权利要求1所述的基于神经符号增强的知识库复杂查询方法,其特征在于,步骤3中,基于初始实体的嵌入表示和符号表示进行缺失三元组的关系映射推理,包括:基于嵌入表示的映射推理:根据缺失三元组中已知实体的嵌入表示v
h
和关系的嵌入表示v
r
,计算缺失三元组中缺失实体的嵌入表示其中,符号表示哈达玛积;基于符号表示的映射推理:根据电商知识图谱的关系邻接矩阵M
r
和缺失三元组中已知实体的符号表示p
h
,计算缺失三元组中缺失实体的符号表示p
t
=g(p
h
M
r
)
T
,其中,g(
·
)表示归一化函数。3.根据权利要求1或2所述的基于神经符号增强的知识库复杂查询方法,其特征在于,步骤3中,利用缺失实体的嵌入表示补充缺失实体的符号表示,并利用补充后的符号表示修正缺失实体的嵌入表示,包括:首先,计算缺失实体的嵌入表示v
t
与电商知识图谱中所有实体的嵌入表示之间的相似度,得到相似度向量Y;然后,对相似度向量Y做激活处理后得到p
t
′
,将p
t
′
添加到缺失实体的符号表示p
t
中,进行归一化处理得到p
t
″
;最后,利用p
t
″
来修正缺失实体的嵌入表示v
r
,得到修正后的嵌入表示v
t
′
:其中,S
t
表示符号表示p
t
″
中非零元素对应的实体的集合,e
i
表示属于集合S
t
中的第i个实体,表示实体e
i
的嵌入表示,MLP()表示多层感知机,表示符号表示p
t
″
中实体e
i
对应的概率值,|S
t
|表示集合S
t
中实体的数量。4.根据权利要求1所述的基于神经符号增强的知识库复杂查询方法,其特征在于,步骤4中,逻辑操作推理包括:针对逻辑表达式中的逻辑操作与:根据已知逻辑操作与连接的两个缺失三元组中缺失
实体的符号表示p1和p2,对p1和p2进行与操作,即p1∧p2,对应计算预测实体的符号表示其中,g(
·
)表示归一化函数,符号表示哈达玛积;针对逻辑表达式中的逻辑操作或:根据已知逻辑操作或连接的两个缺失三元组中缺失实体的符号表示p1和p2,对p1和p2进行或操作,即p1∨p2,对应计算预测实体的符号表示针对逻辑表达式中的逻辑操作非:根据已知逻辑操作非连接的缺失三元组中缺失实体的符号表示p,对p进行非操作,即对应计算预测实体的符号表示其中,α表示常数,|n
e
|表示电商知识图谱中实体的数量。5.根据权利要求1所述的基于神经符号增强的知识库复杂查询方法,其特征在于,步骤4中,基于预测实体的符号表示计算预测实体的嵌入表示,包括:其...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。