一种动态社交网络表示学习方法技术

技术编号:32270890 阅读:25 留言:0更新日期:2022-02-12 19:34
本发明专利技术公开了一种动态社交网络表示学习方法,涉及网络表示学习领域,解决目前不能够在学习同时保留真实社交网络的演化模式和社区结构的低维特征向量的技术问题,包括三元闭包模式分析和社区结构;本发明专利技术通过分析三元闭包模式后,联合节点的影响力、节点的相似性和社区结构这些社交网络的重要因素共同建模社交网络中的节点和边的演化过程。该方法能够同时保留节点的网络结构和动态特征学习节点的低维表示,且通过捕获社交网络中不同节点演化模式,使得学习到的低维表示更具判别性。社区是真实的社会网络最重要的特征之一,学习到的网络表示可以很好地反映社区的结构,这样可以帮助用户获得更多有用的信息,并且使三元闭包过程得到更好的优化。过程得到更好的优化。过程得到更好的优化。

【技术实现步骤摘要】
一种动态社交网络表示学习方法


[0001]本专利技术涉及网络表示学习领域,具体涉及一种动态社交网络表示学习方法。

技术介绍

[0002]互联网时代的来临诞生了许多种类繁多的社交网络服务平台,极大地提高了人们的生活水平。这类平台我们也称作在线社会网络(Online Social Network,OSN),如国内的微博、豆瓣、贴吧,国外的Facebook、Twitter、Instagram。对广泛存在的社交网络进行研究与分析具有较高的商业价值和学术价值,吸引了大批国内外学者进行研究。例如,对社交网络中信息扩散问题的研究可以应用于谣言检测、舆情引导和影响力最大化等场景。但当今在线社交网络不断累积的海量丰富数据,给社交网络分析带来了新的机遇与挑战。
[0003]网络表示学习(Network Representation Learning,NRL),又可以称作“网络嵌入(Network embedding,NE)”,是社交网络分析任务中的一个基础与关键问题,旨在将社交网络映射到一个低维向量空间,同时最大化保留网络中节点的属性特征。机器学习算法的性能很大程度上取决于所应用的数据表示形式或特征的选择。而网络表示学习通过将输入数据转换为有效的特征表示,可以提高算法的性能。因此深度学习技术与网络表示学习结合来解决实际问题取得了显著的效果。伴随着深度学习技术的发展,对社交网络的表示学习研究工作目前仍处于高速发展时期,各类方法层出不穷,成为了当下研究的热点。
[0004]早期的社交网络表示学习主要基于静态社交网络进行研究,解决方案是通过一些降维方法(如矩阵分解、深度自编码器、深度学习等)将静态网络的高维结构嵌入到一个低维的表示空间中。其主要思想是网络中相似的节点在嵌入式表示空间中应该更接近。这些方法有以下两个显著缺点:
[0005]1.难以反映社交网络随时间演化的动态特性。真实世界的社交网络并非一成不变的,而是随着时间不断演化。例如,在线社交平台中不断有新的用户加入,而用户间也不断有新的好友关系产生,这些会导致网络中出现新的节点和连边。因此,传统方法只对静态网络中固定的节点和连边进行研究,而不考虑网络信息的更新,学习到的特征表示难以保持真实网络的动态特性。并且,尽管最近提出了少量的对动态社交网络表示学习的研究,但难以捕获社交网络中不同节点演化模式的差异。在社交网络演化的过程中,具有相似网络结构的节点可能采取不同的演化模式,如是否在未来与他人建立新的联系。这反映了不同用户的性格特征和社交策略等隐含信息,而这些重要的信息无法通过网络结构直接获得。因此,传统方法无法基于动态社交网络演化的基本机制,衡量网络中的多种影响因素并构建准确的演化模型,进而难以准确刻画网络中节点的不同演化趋势。
[0006]2.难以反映社交网络的重要网络属性——社区结构。现有的网络嵌入方法大多着眼于保持节点间的局部邻近性,即依据同质性,高度相连的节点应该紧密地嵌入到潜在的表示空间中。而社区结构作为社交网络最重要的特征之一,能够揭示复杂网络的隐藏特征,却在很大程度上被忽略了。例如,在当前时刻的社交网络中,两个节点没有直接相连。如果仅依据节点对的连接关系,则二者的相似度会趋于很小。然而,动态网络中的社区是由功能
相似、通信密集的节点组成的集群。因此,即使不直接相连,若这两个节点属于同一社区,也应当与不属于同一社区时的相似度不同。

技术实现思路

[0007]本专利技术的目的在于:为了解决上述技术问题,本专利技术提供了一种动态社交网络表示学习方法,能够学习同时保留真实社交网络的演化模式和社区结构的低维特征向量。
[0008]本专利技术采用的技术方案如下:
[0009]一种动态社交网络表示学习方法,包括如下步骤:
[0010]步骤1:构建动态网络序列,基于给定的一组时间步{1,2,

,T},对于其中某一时间步(某一时刻)的社交网络数据,构建子图G
{a}
=(V,E
{a}
,W
{a}
),a∈{1,2,

,T};
[0011]其中,V是节点集合,表示网络中的用户;E
{a}
是当前时间步的边集合,代表用户间的关系(如好友、关注/粉丝等);W
{a}
是权重集合,表示用户间的连接强度;动态网络是所有时间步的子图构成的一个序列G={G
(1)
,G
(2)


,G
(T)
};
[0012]步骤2:社区划分,根据网络的结构,并标记每个节点所处的社区;由于动态网络随时间演化,因此需要对每一时间步的网络进行社区划分时间演化,因此需要对每一时间步的网络进行社区划分
[0013]步骤3:基于三元闭包过程保留网络演化特征;对G
{a}
,其中三个满足以下关系的用户构成一个开放三元组(v
i
,v
j
,v
k
):用户v
i
和v
j
互相不认识,但他们有一个共同好友v
k
;共同好友v
k
会决定是否在下一时间步介绍v
i
和v
j
认识使得开放三元组闭合;在这一过程中影响他的决定的三个主要因素分别是:用户影响力、用户相似度和社区结构;
[0014]步骤4:基于同质性和社区结构保留网络结构特征,依据社会同质性相互连接的节点对会更紧密地嵌入到潜在的表示空间中;仅考虑这一性质的网络表示学习方法忽略了动态网络的另一个显著特征,即社区结构。即使在原网络中节点并不直接相连,属于同一社区的节点表示也应该比不同社区中的节点更紧密地嵌入到潜在表示空间中。
[0015]步骤5:时间平滑性,在真实世界的网络中,自然地认为节点并不会在每个时间步骤中完全重建,而是随着时间的推移平稳地演化。为了保持动态网络在a时间步的平滑演化,构建时间平滑性损失函数如下。
[0016][0017]步骤6:结合网络演化特征和结构特征进行嵌入得到每个节点的特征表示;为了学习动态社交网络节点的低维嵌入表示,同时保留节点的演化特征和结构特征,我们需要对三个损失函数和进行优化;我们将全局结构损失函数权重参数设为1,采用两个超参数β0和β1分别控制三元闭包过程和时间平滑性;因此,对于先给定初始的时间步长T,整体优化问题为
[0018][0019]其中和是归一化项,而正则化目标在训练中由归一化技术处理时被省略了。最后采用经典的优化算法随机梯度下降(SGD)结合Adagrad方法来解决这个最小化问题。设置潜在空间维数为d,最终获得社交网络的节点嵌入表示U={U
(1)
,U
(2)
,

,U
(T)
};
[0020]可以应用于各种社交网络具体分析任务。
[0021]进一步地,通过经典的社区发现算法semi

syn本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种动态社交网络表示学习方法,其特征在于,包括如下步骤:步骤1:构建动态网络序列,基于给定的一组时间步{1,2,...,T},对于其中某一时间步的社交网络数据,构建子图G
{a}
=(V,E
{a}
,W
{a}
),a∈{1,2,...,T};其中,V是节点集合,表示网络中的用户;E
{a}
是当前时间步的边集合,代表用户间的关系;W
{a}
是权重集合,表示用户间的连接强度;动态网络是所有时间步的子图构成的一个序列G={G
(1)
,G
(2)
,...,G
(T)
};步骤2:社区划分,根据网络的结构,并标记每个节点所处的社区;由于动态网络随时间演化,因此需要对每一时间步的网络进行社区划分演化,因此需要对每一时间步的网络进行社区划分步骤3:基于三元闭包过程保留网络演化特征;对G
{a}
,其中三个满足以下关系的用户构成一个开放三元组(v
i
,v
j
,v
k
):用户v
i
和v
j
互相不认识,但他们有一个共同好友v
k
;共同好友v
k
会决定是否在下一时间步介绍v
i
和v
j
认识使得开放三元组闭合;在这一过程中影响他的决定的三个主要因素分别是:用户影响力、用户相似度和社区结构;步骤4:基于同质性和社区结构保留网络结构特征,依据社会同质性相互连接的节点对会更紧密地嵌入到潜在的表示空间中;步骤5:时间平滑性,为了保持动态网络在a时间步的平滑演化,构建时间平滑性损失函数如下:其中,表示节点v
i
在a时间步的嵌入向量,表示同一节点v
i
在相邻时间步a和a+1的嵌入向量的欧氏距离;步骤6:结合网络演化特征和结构特征进行嵌入得到每个节点的特征表示;为了学习动态社交网络节点的低维嵌入表示,同时保留节点的演化特征和结构特征,我们需要对三个损失函数和进行优化;将全局结构损失函数权重参数设为1,采用两个超参数β0和β1分别控制三元闭包过程和时间平滑性;因此,对于先给定初始的时间步长T,整体优化问题为:其中和是归一化项,设置潜在空间维数为d,最终获得社交网络的节点嵌入表示U={U
(1)
,U
(2)
,...,U
(T)
}和社会策略参数θ;表示保留社会同质性和社区结构的损失函数,表示三元闭包过程的损失函数,表示时间平滑性的损失函数;采用两个超参数η0和η0分别控制三元闭包过程和时间平滑性,T为给定的总的时间步长;可以应用于各种社交网络具体分析任务。2.根据权利要求1所述的一种动态社交网络表示学习方法,其特征在于,所述步骤2中,
通过经典的社区发现算法semi

synchronized LPA获取社区信息。3.根据权利要求1所述的一种动态社交网络表示学习方法,其特征在于,所述步骤3中,用户影响力:如果v
k
是一个在社交网络中影响力较大的用户,则他介绍v
i
和v
j
在下一时间步认识并建立联系的概率相对较小;如意见领袖的影响力远远高于普通用户,则他们介绍与自己相连的两个用户认识的概率显然有所不同,前者低于后者;用户相似度:当v
k
与v
i
和v
j
相似时,更倾向于介绍v
i
和v
j
在下一时间步认识并建立联系,因此开放三元组闭合的概率增大;社区结构:相比v
i
和v
j
属于同一社区的情况,v
k
介绍属于不同社区的这两个朋友需要付出的努力显然更大,则闭合开放三元组的概率相对较小。4.根据权利要求3所述的一种动态社交网...

【专利技术属性】
技术研发人员:王维成杨敏杨博
申请(专利权)人:成都博智云创科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1