【技术实现步骤摘要】
一种基于超图结构的链路预测方法及系统
[0001]本专利技术涉及网络结构分析
,特别是涉及一种基于超图结构的链路预测方法及系统。
技术介绍
[0002]构建社交网络知识图谱,需要从在线社交网络中收集海量的用户数据(用户属性、兴趣、社交和行为数据等)从多维度画像描述用户实体。用户属性和用户兴趣是通常用户画像中包含的两个维度。前者刻画用户的静态属性特征,例如用户的身份信息(性别、年龄、受教育程度、学校、工作单位
……
),后者则用于刻画用户在信息筛选方面的倾向(例如用户的兴趣标签、能力标签等)。社交维度是从社交关系及信息传播的角度来刻画用户的。在社交媒体中,用户不再仅仅是一个个体,用户以及用户之间的社交关系构成了一张网络,信息在这张网络中高速流动,但是这种流动并不是无差别的,信息的起始点,所经历的关键节点以及这些节点构成的关系圈都是影响信息流动的重要因素。社交维度就是要量化这些因素以及其影响程度。行为维度是一个比较新的研究方向,目的是发现影响用户属性、信息变化的行为因素,分析典型用户群体的行为模式。一方面可以通过行为模式的复用来促进用户在社交平台的成长;另一方面也有利于平台认识用户,和发现新的或异常的用户行为。接着针对不同用户实体构建各自的属性和实体间的关系。
[0003]传统的链路预测算法包括基于相似性的链路预测和基于似然分析的链路预测。基于相似性的链路预测指标包括共同邻居的相似性指标和基于路径的相似性指标。基于共同邻居的相似性指标,即两个节点如果有很多共同的邻居节点则倾向于连边。基于路径 ...
【技术保护点】
【技术特征摘要】
1.一种基于超图结构的链路预测方法,其特征在于,所述预测方法包括如下步骤:获取待预测网络的原始超图;将所述原始超图转换为二分图;基于变分自编码器预测所述二分图中的节点间存在边的概率,构建类邻接矩阵;基于所述类邻接矩阵还原出包含链路预测结果的预测超图。2.根据权利要求1所述的基于超图结构的链路预测方法,其特征在于,所述变分自编码器包括编码器和解码器,所述编码器包括两层图卷集网络,所述解码器包括两层卷积网络。3.根据权利要求2所述的基于超图结构的链路预测方法,其特征在于,所述基于变分自编码器预测所述二分图中的节点间存在边的概率,构建类邻接矩阵,具体包括:获取所述二分图的图邻接矩阵和图特征矩阵;将所述图邻接矩阵和所述图特征矩阵输入所述编码器,获得所述二分图中的各个节点在低维特征空间的向量表示,构建二分图的低维向量表示;将二分图的低维向量表示输入所述解码器,获得二分图中的节点间存在边的概率,构建类邻接矩阵。4.根据权利要求1或2或3所述的基于超图结构的链路预测方法,其特征在于,所述变分自编码器的损失函数为:L=E
q(Z|X,A)
[log p(A
′
|Z)]
‑
KL[q(Z|X,A)||p(Z)];其中,L为变分自编码器的损失,E
q(Z|X,A)
[log p(A
′
|Z)]是交叉熵函数,p(A
′
|Z)为解码器输出的节点间存在边的概率分布,p(A
′
|Z)=∏
i∈X
′
∏
j∈Y
′
p(A
′
ij
|z
i
,z
j
),A
′
为类邻接矩阵,Z为编码器输出的二分图的低维向量表示,X
′
表示二分图左侧的节点集合,Y
′
表示二分图右侧的节点集合,i和j分别表示二分图中的左侧和右侧的节点,A
′
ij
表示类邻接矩阵中的元素,z
i
和z
j
分别表示节点i和节点j的低维向量表示,KL为二分图中各节点独立正态分布和标准正态分布的KL散度,q(Z|X,A)表示编码器输出的二分图的低维向量表示的概率分布,A表示图邻接矩阵,N表示二分图中节点的数量,q(z
i
|X,A)表示节点i的低维向量表示的概率分布,μ
i
表示节点i的均值,σ
i
表示节点i的方差,p(Z)表示二分图的低维向量表示遵循的概率分布,p(Z)=∏
i
N(0,I),d为分布中隐变量的维度。5.根据权利要求1所述的基于超图结构的链路预测方法,其特征在于,所述基于所述类邻接矩阵还原出包含链路预测结果的预测超图,具体包括:基于所述类邻接矩阵构建二分图中的链路预测结果;基于二分图中的链路预测结果还原出包含链路预测结果的预测超图。6.根据权利要求5所述的基于超图结构的链路预测方法,其特征在于,所述基于所述...
【专利技术属性】
技术研发人员:龙水彬,李荣华,秦宏超,王国仁,
申请(专利权)人:北京理工大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。