一种基于超图结构的链路预测方法及系统技术方案

技术编号:29097141 阅读:27 留言:0更新日期:2021-06-30 10:07
本发明专利技术涉及一种基于超图结构的链路预测方法,所述预测方法包括如下步骤:获取待预测网络的原始超图;将所述原始超图转换为二分图;基于变分自编码器预测所述二分图中的节点间存在边的概率,构建类邻接矩阵;基于所述类邻接矩阵还原出包含链路预测结果的预测超图。本发明专利技术根据超图和二分图的一一对应关系,首先将超图转换为二分图,然后基于变分自编码器预测所述二分图中的链路,最后将该预测结果还原至超图上,该方式在无需将超图转化成一边只关联两个节点的普通图的基础上,实现了对超图中的链路的预测,进而实现了具有时序超图结构的社交网络中的链路预测。社交网络中的链路预测。社交网络中的链路预测。

【技术实现步骤摘要】
一种基于超图结构的链路预测方法及系统


[0001]本专利技术涉及网络结构分析
,特别是涉及一种基于超图结构的链路预测方法及系统。

技术介绍

[0002]构建社交网络知识图谱,需要从在线社交网络中收集海量的用户数据(用户属性、兴趣、社交和行为数据等)从多维度画像描述用户实体。用户属性和用户兴趣是通常用户画像中包含的两个维度。前者刻画用户的静态属性特征,例如用户的身份信息(性别、年龄、受教育程度、学校、工作单位
……
),后者则用于刻画用户在信息筛选方面的倾向(例如用户的兴趣标签、能力标签等)。社交维度是从社交关系及信息传播的角度来刻画用户的。在社交媒体中,用户不再仅仅是一个个体,用户以及用户之间的社交关系构成了一张网络,信息在这张网络中高速流动,但是这种流动并不是无差别的,信息的起始点,所经历的关键节点以及这些节点构成的关系圈都是影响信息流动的重要因素。社交维度就是要量化这些因素以及其影响程度。行为维度是一个比较新的研究方向,目的是发现影响用户属性、信息变化的行为因素,分析典型用户群体的行为模式。一方面可以通过行为模式的复用来促进用户在社交平台的成长;另一方面也有利于平台认识用户,和发现新的或异常的用户行为。接着针对不同用户实体构建各自的属性和实体间的关系。
[0003]传统的链路预测算法包括基于相似性的链路预测和基于似然分析的链路预测。基于相似性的链路预测指标包括共同邻居的相似性指标和基于路径的相似性指标。基于共同邻居的相似性指标,即两个节点如果有很多共同的邻居节点则倾向于连边。基于路径的相似性指标包括局部路径指标、Katz指标和LHN

II指标,局部路径指标考虑图的邻接矩阵A,使用S
n
=A2+α
·
A3+α3·
A4+


n
‑2·
A
n
刻画图的局部路径相似度指标,其中α是可调参数,而Katz指标在考虑节点u,v之间相似性时,使用Katz指标在考虑节点u,v之间相似性时,使用其中α是可调参数,而LHN

II指标则基于一般等价定义下的相似,考虑关系图中两个节点是否处于同样的角色,即使它们没有相同的邻居节点,但因为各邻居节点间本身相似而使这两个节点也相似,即S
u,v
=φ∑
w
A
u,w
S
w,v
+φδ
u,v
,其中第一项表示节点u的邻居节点w对相似度的贡献,第二项表示节点u和v本身的相似性。基于似然分析的链路预测考虑的是网络的层次模型,假设真实的网络都存在某种层次性,网络的连接则可看作是这种内在层次结构的反映。一个N个节点的网络可以用一个包含N个叶子节点的族谱树表示,这N个叶子节点将由N

1个非叶子节点连接起来,其中每个非叶子节点都有一个概率值,则两个叶子节点连接的概率就等于他们最近共同祖先节点的概率值。给定一个族谱树,将网络的似然值最大化,就可以得到非叶子节点的概率值,并由此计算出这一个族谱树所对应的网络最大的似然值。在族谱树中计算原图未连边节点中节点间的连边概率平均值,其中似然概率大的点对即为预测的新边。
[0004]基于已经构建的社交网络知识图谱来以预测社交网络图中节点的链路关系,而过
去的链路预测只在普通图上进行,没有拓展到超图这一高维数据结构上,因此只能基于超图本身的特征将其中超边所关联节点更换为两两相连,即使用普通图结构描述超图结构信息,使用机器学习方法进行链路预测工作,然而该方式代价过高且规模量大。
[0005]可见,现有的链路预测算法并没有应用在超图这样数据结构中,传统图的边集中一条边只关联两个节点,而在社交网络知识图谱的时序超图中,一条超边可能关联两个或以上的节点,然而现有的链路预测方法无法直接应用于该超图上,且将超图重新拆分成普通图代价过高且规模量大而无法接受。如何实现具有时序超图结构的社交网络中的链路预测成为一个亟待解决的技术问题。

技术实现思路

[0006]本专利技术的目的是提供一种基于超图结构的链路预测方法及系统,以实现具有时序超图结构的社交网络中的链路预测。
[0007]为实现上述目的,本专利技术提供了如下方案:
[0008]本专利技术提供一种基于超图结构的链路预测方法,所述预测方法包括如下步骤:
[0009]获取待预测网络的原始超图;
[0010]将所述原始超图转换为二分图;
[0011]基于变分自编码器预测所述二分图中的节点间存在边的概率,构建类邻接矩阵;
[0012]基于所述类邻接矩阵还原出包含链路预测结果的预测超图。
[0013]可选的,所述变分自编码器包括编码器和解码器,所述编码器包括两层图卷集网络,所述解码器包括两层卷积网络。
[0014]可选的,所述基于变分自编码器预测所述二分图中的节点间存在边的概率,构建类邻接矩阵,具体包括:
[0015]获取所述二分图的图邻接矩阵和图特征矩阵;
[0016]将所述图邻接矩阵和所述图特征矩阵输入所述编码器,获得所述二分图中的各个节点在低维特征空间的向量表示,构建二分图的低维向量表示;
[0017]将二分图的低维向量表示输入所述解码器,获得二分图中的节点间存在边的概率,构建类邻接矩阵。
[0018]可选的,所述变分自编码器的损失函数为:L=E
q(Z|X,A)
[log p(A'|Z)]‑
KL[q(Z|X,A)||p(Z)];
[0019]其中,L为变分自编码器的损失,E
q(Z|X,A)
[log p(A'|Z)]是交叉熵函数,p(A'|Z)为解码器输出的节点间存在边的概率分布,p(A'|Z)=Π
i∈X'
Π
j∈Y'
p(A'
ij
|z
i
,z
j
),A'为类邻接矩阵,Z为编码器输出的二分图的低维向量表示,X'表示二分图左侧的节点集合,Y'表示二分图右侧的节点集合,i和j分别表示二分图中的左侧和右侧的节点,A'
ij
表示类邻接矩阵中的第i行第j列的元素,z
i
和z
j
分别表示节点i和节点j的低维向量表示,KL为二分图中各节点独立正态分布和标准正态分布的KL散度,q(Z|X,A)表示编码器输出的二分图的低维向量表示的概率分布,A表示图邻接矩阵,N表示二分图中节点的数量,q(z
i
|X,A)表示节点i的低维向量表示的概率分布,μ
i
表示节点i的均值,σ
i
表示节点i的方差,p(Z)表示
二分图的低维向量表示遵循的概率分布,p(Z)=Π
i N(0,I),d为分布中隐变量的维度。
[0020]可选的,所述基于所述类邻接矩阵还原出包含链路预测结果的预测超图,具体包括:
[0021]基于所述类邻接矩阵本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于超图结构的链路预测方法,其特征在于,所述预测方法包括如下步骤:获取待预测网络的原始超图;将所述原始超图转换为二分图;基于变分自编码器预测所述二分图中的节点间存在边的概率,构建类邻接矩阵;基于所述类邻接矩阵还原出包含链路预测结果的预测超图。2.根据权利要求1所述的基于超图结构的链路预测方法,其特征在于,所述变分自编码器包括编码器和解码器,所述编码器包括两层图卷集网络,所述解码器包括两层卷积网络。3.根据权利要求2所述的基于超图结构的链路预测方法,其特征在于,所述基于变分自编码器预测所述二分图中的节点间存在边的概率,构建类邻接矩阵,具体包括:获取所述二分图的图邻接矩阵和图特征矩阵;将所述图邻接矩阵和所述图特征矩阵输入所述编码器,获得所述二分图中的各个节点在低维特征空间的向量表示,构建二分图的低维向量表示;将二分图的低维向量表示输入所述解码器,获得二分图中的节点间存在边的概率,构建类邻接矩阵。4.根据权利要求1或2或3所述的基于超图结构的链路预测方法,其特征在于,所述变分自编码器的损失函数为:L=E
q(Z|X,A)
[log p(A

|Z)]

KL[q(Z|X,A)||p(Z)];其中,L为变分自编码器的损失,E
q(Z|X,A)
[log p(A

|Z)]是交叉熵函数,p(A

|Z)为解码器输出的节点间存在边的概率分布,p(A

|Z)=∏
i∈X


j∈Y

p(A

ij
|z
i
,z
j
),A

为类邻接矩阵,Z为编码器输出的二分图的低维向量表示,X

表示二分图左侧的节点集合,Y

表示二分图右侧的节点集合,i和j分别表示二分图中的左侧和右侧的节点,A

ij
表示类邻接矩阵中的元素,z
i
和z
j
分别表示节点i和节点j的低维向量表示,KL为二分图中各节点独立正态分布和标准正态分布的KL散度,q(Z|X,A)表示编码器输出的二分图的低维向量表示的概率分布,A表示图邻接矩阵,N表示二分图中节点的数量,q(z
i
|X,A)表示节点i的低维向量表示的概率分布,μ
i
表示节点i的均值,σ
i
表示节点i的方差,p(Z)表示二分图的低维向量表示遵循的概率分布,p(Z)=∏
i
N(0,I),d为分布中隐变量的维度。5.根据权利要求1所述的基于超图结构的链路预测方法,其特征在于,所述基于所述类邻接矩阵还原出包含链路预测结果的预测超图,具体包括:基于所述类邻接矩阵构建二分图中的链路预测结果;基于二分图中的链路预测结果还原出包含链路预测结果的预测超图。6.根据权利要求5所述的基于超图结构的链路预测方法,其特征在于,所述基于所述...

【专利技术属性】
技术研发人员:龙水彬李荣华秦宏超王国仁
申请(专利权)人:北京理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1