基于知识图谱的编码推荐方法、装置、设备及介质制造方法及图纸

技术编号:38258405 阅读:11 留言:0更新日期:2023-07-27 10:20
本发明专利技术涉及知识图谱处理领域及数字医疗领域,公开了一种基于知识图谱的编码推荐方法、装置、设备及介质,包括:对知识图谱中目标节点的多跳邻居进行采样,得到多跳邻居集合;将每一跳所对应的邻居节点进行随机遮挡,生成目标节点多个不同的遮蔽邻居;将多个不同遮蔽邻居与目标节点输入空间自回归模型进行预测,确定目标节点遮蔽邻居的第一表征向量;将目标节点遮蔽邻居的第一表征向量输入图神经网络模型,确定目标节点第二表征向量;根据用户历史交互数据与图神经网络模型确定用户的第三表征向量;根据第二表征向量与第三表征向量的相似度,确定推荐信息所对应的编码,通过个性化推荐,有利于提高推荐质量,实现准确推送,为用户带来更好体验。用户带来更好体验。用户带来更好体验。

【技术实现步骤摘要】
基于知识图谱的编码推荐方法、装置、设备及介质


[0001]本专利技术涉及知识图谱
及数字医疗领域,尤其涉及一种基于知识图谱的编码推荐方法、装置、设备及介质。

技术介绍

[0002]知识图谱(Knowledge Graph,下称KG)作为人工智能的一个分支,引起了学术界和工业界的广泛关注,随着知识图谱规模的快速增长,知识图谱在知识问答、推荐系统和知识图谱补全等应用中发挥着关键作用,例如,医学类数据量巨大而复杂,通过构建医学知识图谱能够为医疗平台提供有效帮助。
[0003]知识图谱是以现实世界的实体为节点,实体之间的关系为边的有向图。在这个图中,头实体,尾实体以及连接其的有向边构成了一个三元组,即(头实体,关系,尾实体),表示头实体与尾实体通过关系进行连接。尽管知识图谱在表示结构化数据方面非常有效,但这种三元组的基本符号性质使知识图谱难以大规模使用在很多人工智能应用中。为了解决这个问题,近年来提出了一个新的研究方向,称为图向量表征,包括传统的浅层模型和深度学习图神经网络(GNNS)等方法在推荐系统中有广阔的应用场景。
[0004]然而,浅层模型由于其依赖于矩阵分解或随机游走,通常存在很高的时间复杂度和不能扩展到大规模的知识图谱数据集,而且随机游走带有随机性,易受数据样本的稀疏度和偏置的影响,未能充分利用采样子图或序列中的邻居邻近性,导致基于GNNS算法存在高阶信息利用不足的问题,同时,在网络叠层过程中,容易导致过度平滑问题,可能会恶化长尾项目的推荐,进而限制其表达性和可扩展性,因此,亟需一种基于知识图谱的编码推荐方案。

技术实现思路

[0005]本专利技术提供一种人工智能的基于知识图谱的编码推荐方法、装置、计算机设备及介质,以解决基于知识图谱的编码推荐不准确,推荐能力严重不足,继而使得编码个性化推荐效果不佳的技术问题。
[0006]第一方面,提供了一种基于知识图谱的编码推荐方法,包括:
[0007]获取携带目标节点的知识图谱,并对所述知识图谱中目标节点的多跳邻居进行采样,得到多跳邻居集合;
[0008]将所述多跳邻居集合中每一跳所对应的邻居节点进行随机遮挡,生成所述目标节点多个不同的遮蔽邻居;
[0009]将所述多个不同的遮蔽邻居与所述目标节点输入空间自回归模型进行预测,确定所述目标节点遮蔽邻居的第一表征向量;
[0010]将所述目标节点遮蔽邻居的第一表征向量输入图神经网络模型,确定所述目标节点第二表征向量;
[0011]根据用户历史交互数据与所述图神经网络模型确定隶属于用户的第三表征向量;
[0012]根据所述目标节点的第二表征向量与所述用户的第三表征向量的相似度,确定推荐信息所对应的编码。
[0013]第二方面,提供了一种基于知识图谱的编码推荐装置,包括:
[0014]采样模块,用于获取携带目标节点的知识图谱,并对所述知识图谱中目标节点的多跳邻居进行采样,得到多跳邻居集合;
[0015]遮挡模块,用于将所述多跳邻居集合中每一跳所对应的邻居节点进行随机遮挡,生成所述目标节点多个不同的遮蔽邻居;
[0016]预测模块,用于将所述多个不同的遮蔽邻居与所述目标节点输入空间自回归模型进行预测,确定所述目标节点遮蔽邻居的第一表征向量;
[0017]第一确定模块,用于将所述目标节点遮蔽邻居的第一表征向量输入图神经网络模型,确定所述目标节点第二表征向量;
[0018]第二确定模块,用于根据用户历史交互数据与所述图神经网络模型确定隶属于用户的第三表征向量;
[0019]编码推荐模块,用于根据所述目标节点的第二表征向量与所述用户的第三表征向量的相似度,确定推荐信息所对应的编码。
[0020]第三方面,提供了一种计算机设备,包括存储器、处理器以及存储在存储器中并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述基于知识图谱的编码推荐方法的步骤。
[0021]第四方面,提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序被处理器执行时实现上述基于知识图谱的编码推荐方法的步骤。
[0022]上述基于知识图谱的编码推荐方法、装置、计算机设备及存储介质所实现的方案中,通过获取携带目标节点的知识图谱,并对所述知识图谱中目标节点的多跳邻居进行采样,得到多跳邻居集合;将所述多跳邻居集合中每一跳所对应的邻居节点进行随机遮挡,生成所述目标节点多个不同的遮蔽邻居;将所述多个不同的遮蔽邻居与所述目标节点输入空间自回归模型进行预测,确定所述目标节点遮蔽邻居的第一表征向量,充分利用了高阶信息,也减轻了逐层引起的过度平滑的问题;将所述目标节点遮蔽邻居的第一表征向量输入图神经网络模型,确定所述目标节点第二表征向量;根据用户历史交互数据与所述图神经网络模型确定隶属于用户的第三表征向量;根据所述目标节点的第二表征向量与所述用户的第三表征向量的相似度,确定推荐信息所对应的编码,在本专利技术中,通过实时采集用户的第三表征向量,有利于及时捕获用户偏好,进行个性化推荐,有利于提高推荐质量,实现准确有效推送,为用户带来更好的体验。
附图说明
[0023]为了更清楚地说明本专利技术实施例的技术方案,下面将对本专利技术实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0024]图1是本专利技术一实施例中基于知识图谱的编码推荐方法的一应用环境示意图;
[0025]图2是本专利技术一实施例中基于知识图谱的编码推荐方法的一流程示意图;
[0026]图3是图2中步骤S10的一具体实施方式流程示意图;
[0027]图4是图2中步骤S20的一具体实施方式流程示意图;
[0028]图5是图2中步骤S30之前的一具体实施方式流程示意图;
[0029]图6是本专利技术一实施例中基于知识图谱拓扑连接图;
[0030]图7是本专利技术一实施例中基于知识图谱的编码推荐装置的一结构示意图;
[0031]图8是本专利技术一实施例中计算机设备的一结构示意图;
[0032]图9是本专利技术一实施例中计算机设备的另一结构示意图。
具体实施方式
[0033]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0034]本专利技术实施例提供的基于知识图谱的编码推荐方法,可应用在如图1的应用环境中,其中,客户端通过网络与服务端进行通信。服务端可以通过获取携带目标节点的知识图谱,并对所述知识图谱中目标节点的多跳邻居进行采样,得到多跳邻居集合;将所述多跳邻居集合中每一跳所对应的邻居节点进行随机遮挡,生成所述目标节点多个不同的遮蔽邻居;将所述多个不同本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于知识图谱的编码推荐方法,其特征在于,包括:获取携带目标节点的知识图谱,并对所述知识图谱中目标节点的多跳邻居进行采样,得到多跳邻居集合;将所述多跳邻居集合中每一跳所对应的邻居节点进行随机遮挡,生成所述目标节点多个不同的遮蔽邻居;将所述多个不同的遮蔽邻居与所述目标节点输入空间自回归模型进行预测,确定所述目标节点遮蔽邻居的第一表征向量;将所述目标节点遮蔽邻居的第一表征向量输入图神经网络模型,确定所述目标节点第二表征向量;根据用户历史交互数据与所述图神经网络模型确定隶属于用户的第三表征向量;根据所述目标节点的第二表征向量与所述用户的第三表征向量的相似度,确定推荐信息所对应的编码。2.如权利要求1所述的基于知识图谱的编码推荐方法,其特征在于,对所述知识图谱中目标节点的多跳邻居进行采样,得到多跳邻居集合,包括:构建知识图谱,获取携带目标节点的知识图谱,其中,将至少一个候选对象确定为目标节点;对所述知识图谱中目标节点进行负采样,确定所述目标节点所对应的相邻节点归属于正样本的子图节点或负样本节点;根据所述负样本节点对所述目标节点周围的所述相邻节点进行多跳采样,确定由每一跳所对应的邻居节点构成的多跳邻居集合。3.如权利要求2所述的基于知识图谱的编码推荐方法,其特征在于,将所述多跳邻居集合中每一跳所对应的邻居节点进行随机遮挡,生成所述目标节点多个不同的遮蔽邻居,包括:将离所述目标节点的距离在第一预设距离内的相邻节点确定为子图节点;将离所述目标节点的距离在第二预设距离内的相邻节点确定为负样本节点;其中,基于所述负样本节点离所述目标节点的距离远近程度,将所述负样本节点分为第一负样本节点与第二负样本节点;将所述多跳邻居集合中目标节点与所述目标节点周围的邻居节点进行整合,获得子图集合,所述子图集合由子图节点组成;对所述子图集合中任意邻居节点进行随机遮挡,生成所述目标节点多个不同的遮蔽邻居。4.如权利要求1所述的基于知识图谱的编码推荐方法,其特征在于,将所述多个不同的遮蔽邻居与所述目标节点输入空间自回归模型进行预测,确定所述目标节点遮蔽邻居的第一表征向量之前,还包括:获取训练数据集;构建基于空间自回归模型的网络结构;基于预设的对比学习损失函数,根据所述训练数据集内多个遮蔽邻居的初始表征向量,确定对比学习损失信息;利用瓶颈策略对所述训练数据集内多个遮蔽邻居的初始表征向量进行优化,确定最小
化遮蔽邻居和所述目标节点之间的邻居信息;基于预设的双线性损失函数,根据优化后的训练数据集内多个遮蔽邻居的初始表征向量以及所述邻居信息,确定双线性损失信息;根据所述双线性损失信息和所述对比学习损失信息,训练并得到所述空间自回归模型。5.如权利要求4所述的基于知识图谱的编码推荐方法,其特征在于,所述对比学习损失函数的表达式为:式中,L
Vanilla

SAC
为对比学习损失函数,n
i,h
为级跳h时第i层邻居中被遮蔽的遮蔽邻居,N为级跳数目,τ为对比学习中的温度参数,c
p
为预测编码,n为邻居节点。6.如权利要求4所述的基于知识图谱的编码推荐方法,其特征在于,所述双线性损失函数的表达式为:式中,L
NIB
为双线性损失函数,N为级跳数目,k为除去遮蔽邻居的子图节点数,σ为非线性激活函数,W1、W2对应是c
p
和n
i,hop
双线性融合后的线性变换矩阵。7.如权利要求1所述的基于知识图谱的编码推荐方法,其特征在于,预测所述目标节点遮蔽邻居的第一表征向量的目标函数为:c
...

【专利技术属性】
技术研发人员:袁定强
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1