基于知识图谱的编码推荐方法、装置、设备及介质制造方法及图纸

技术编号：38258405 阅读：11 留言：0更新日期：2023-07-27 10:20

本发明专利技术涉及知识图谱处理领域及数字医疗领域，公开了一种基于知识图谱的编码推荐方法、装置、设备及介质，包括：对知识图谱中目标节点的多跳邻居进行采样，得到多跳邻居集合；将每一跳所对应的邻居节点进行随机遮挡，生成目标节点多个不同的遮蔽邻居；将多个不同遮蔽邻居与目标节点输入空间自回归模型进行预测，确定目标节点遮蔽邻居的第一表征向量；将目标节点遮蔽邻居的第一表征向量输入图神经网络模型，确定目标节点第二表征向量；根据用户历史交互数据与图神经网络模型确定用户的第三表征向量；根据第二表征向量与第三表征向量的相似度，确定推荐信息所对应的编码，通过个性化推荐，有利于提高推荐质量，实现准确推送，为用户带来更好体验。用户带来更好体验。用户带来更好体验。

全部详细技术资料下载

【技术实现步骤摘要】
基于知识图谱的编码推荐方法、装置、设备及介质

[0001]本专利技术涉及知识图谱
及数字医疗领域，尤其涉及一种基于知识图谱的编码推荐方法、装置、设备及介质。

技术介绍

[0002]知识图谱(Knowledge Graph，下称KG)作为人工智能的一个分支，引起了学术界和工业界的广泛关注，随着知识图谱规模的快速增长，知识图谱在知识问答、推荐系统和知识图谱补全等应用中发挥着关键作用，例如，医学类数据量巨大而复杂，通过构建医学知识图谱能够为医疗平台提供有效帮助。
[0003]知识图谱是以现实世界的实体为节点，实体之间的关系为边的有向图。在这个图中，头实体，尾实体以及连接其的有向边构成了一个三元组，即(头实体，关系，尾实体)，表示头实体与尾实体通过关系进行连接。尽管知识图谱在表示结构化数据方面非常有效，但这种三元组的基本符号性质使知识图谱难以大规模使用在很多人工智能应用中。为了解决这个问题，近年来提出了一个新的研究方向，称为图向量表征，包括传统的浅层模型和深度学习图神经网络(GNNS)等方法在推荐系统中有广阔的应用场景。
[0004]然而，浅层模型由于其依赖于矩阵分解或随机游走，通常存在很高的时间复杂度和不能扩展到大规模的知识图谱数据集，而且随机游走带有随机性，易受数据样本的稀疏度和偏置的影响，未能充分利用采样子图或序列中的邻居邻近性，导致基于GNNS算法存在高阶信息利用不足的问题，同时，在网络叠层过程中，容易导致过度平滑问题，可能会恶化长尾项目的推荐，进而限制其表达性和可扩展性，因此，亟需一种基于知识...

【技术保护点】

【技术特征摘要】
1.一种基于知识图谱的编码推荐方法，其特征在于，包括：获取携带目标节点的知识图谱，并对所述知识图谱中目标节点的多跳邻居进行采样，得到多跳邻居集合；将所述多跳邻居集合中每一跳所对应的邻居节点进行随机遮挡，生成所述目标节点多个不同的遮蔽邻居；将所述多个不同的遮蔽邻居与所述目标节点输入空间自回归模型进行预测，确定所述目标节点遮蔽邻居的第一表征向量；将所述目标节点遮蔽邻居的第一表征向量输入图神经网络模型，确定所述目标节点第二表征向量；根据用户历史交互数据与所述图神经网络模型确定隶属于用户的第三表征向量；根据所述目标节点的第二表征向量与所述用户的第三表征向量的相似度，确定推荐信息所对应的编码。2.如权利要求1所述的基于知识图谱的编码推荐方法，其特征在于，对所述知识图谱中目标节点的多跳邻居进行采样，得到多跳邻居集合，包括：构建知识图谱，获取携带目标节点的知识图谱，其中，将至少一个候选对象确定为目标节点；对所述知识图谱中目标节点进行负采样，确定所述目标节点所对应的相邻节点归属于正样本的子图节点或负样本节点；根据所述负样本节点对所述目标节点周围的所述相邻节点进行多跳采样，确定由每一跳所对应的邻居节点构成的多跳邻居集合。3.如权利要求2所述的基于知识图谱的编码推荐方法，其特征在于，将所述多跳邻居集合中每一跳所对应的邻居节点进行随机遮挡，生成所述目标节点多个不同的遮蔽邻居，包括：将离所述目标节点的距离在第一预设距离内的相邻节点确定为子图节点；将离所述目标节点的距离在第二预设距离内的相邻节点确定为负样本节点；其中，基于所述负样本节点离所述目标节点的距离远近程度，将所述负样本节点分为第一负样本节点与第二负样本节点；将所述多跳邻居集合中目标节点与所述目标节点周围的邻居节点进行整合，获得子图集合，所述子图集合由子图节点组成；对所述子图集合中任意邻居节点进行随机遮挡，生成所述目标节点多个不同的遮蔽邻居。4.如权利要求1所述的基于知识图谱的编码推荐方法，其特征在于，将所述多个不同的遮蔽邻居与所述目标节点输入空间自回归模型进行预测，确定所述目标节点遮蔽邻居的第一表征向量之前，还包括：获取训练数据集；构建基于空间自回归模型的网络结构；基于预设的对比学习损失函数，根据所述训练数据集内多个遮蔽邻居的初始表征向量，确定对比学习损失信息；利用瓶颈策略对所述训练数据集内多个遮蔽邻居的初始表征向量进行优化，确定最小
化遮蔽邻居和所述目标节点之间的邻居信息；基于预设的双线性损失函数，根据优化后的训练数据集内多个遮蔽邻居的初始表征向量以及所述邻居信息，确定双线性损失信息；根据所述双线性损失信息和所述对比学习损失信息，训练并得到所述空间自回归模型。5.如权利要求4所述的基于知识图谱的编码推荐方法，其特征在于，所述对比学习损失函数的表达式为：式中，L
Vanilla
‑
SAC
为对比学习损失函数，n
i,h
为级跳h时第i层邻居中被遮蔽的遮蔽邻居，N为级跳数目，τ为对比学习中的温度参数，c
p
为预测编码，n为邻居节点。6.如权利要求4所述的基于知识图谱的编码推荐方法，其特征在于，所述双线性损失函数的表达式为：式中，L
NIB
为双线性损失函数，N为级跳数目，k为除去遮蔽邻居的子图节点数，σ为非线性激活函数，W1、W2对应是c
p
和n
i,hop
双线性融合后的线性变换矩阵。7.如权利要求1所述的基于知识图谱的编码推荐方法，其特征在于，预测所述目标节点遮蔽邻居的第一表征向量的目标函数为：c
...

【专利技术属性】
技术研发人员：袁定强，
申请(专利权)人：平安科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人