一种基于异质网络的社交网络影响力预测方法、装置制造方法及图纸

技术编号:32459767 阅读:9 留言:0更新日期:2022-02-26 08:45
本发明专利技术提供了一种基于异质网络的社交网络影响力预测方法、装置,可以预测关注的社交网络事件对用户产生影响的概率,包括采集与关注的社交网络事件相关的事件数据与用户数据;由采集的数据构造异质网络图,获取节点关系和节点属性,建立包含异质语义特征融合模块、异质结构特征融合模块、异质多属性特征学习模块、异质网络影响力预测模块的影响力预测模型,构建样本,通过训练集和训练标签集合训练影响力预测模型,直至模型收敛得到训练好的影响力预测模型;将需要预测的用户和关注的社交网络事件数据进行处理得到异质网络图和邻居异质子图,输入训练好的输入影响力预测模型,获得输出的关注的社交网络事件对用户产生影响的预测概率。响的预测概率。响的预测概率。

【技术实现步骤摘要】
一种基于异质网络的社交网络影响力预测方法、装置


[0001]本专利技术涉及数据挖掘、社交网络舆情分析
,具体涉及一种基于异质网络的社交网络影响力预测方法、装置。

技术介绍

[0002]社交网络成为人们身边不可或缺的一部分。当用户查看社交网络信息时便产生了社交影响。这意味着社交网络中的网络用户和网络事件(例如:新闻,热搜,发表论文,购物等),不断地通过社交媒体影响着网络用户,诱导用户产生社交行为(包括转发,评论,参与,购买等),同时网络事件会产生不同的话题,以吸引更多受众参与。例如,目前网络直播购物普遍流行,用户会选择自己喜欢的主播购买必要的商品,可以说网络主播作为用户和商品作为事件,都对目标用户的行为产生了实质影响。
[0003]建模事件和用户之间的影响力关系,以预测个体是否会参与某一个事件的行为,是用户层面社交网络影响力的一个关键问题,该问题从个体微观的角度解释和理解信息传播的现象,并且应用与多个领域,包括但网络营销、推荐系统、谣言检测、网络事件监控、舆情事件分析、信息传播等。
[0004]由于深度学习技术的不断进步,目前大量的社交影响力研究的工作引入了深度学习的方法,但主要通过同质的用户关系网络进行研究,例如用户之间的关注关系、交互关系等,很少考虑到网络中事件主体与用户共同造成的影响(例如购买主播推荐的商品),这导致了在捕捉真实影响了用户行为的诱因方面的能力受限。如果能够在用户

事件共存的异质社交网络中建模影响力关系,预测用户在未来时刻的针对某一网络事件的行为,对于社交网络用户影响力分析具有重要的意义。

技术实现思路

[0005]本专利技术旨在提供一种基于异质网络的社交网络影响力预测方法、装置,解决目前存在的问题。
[0006]其技术方案是这样的:一种基于异质网络的社交网络影响力预测方法,其特征在于,包括以下步骤:
[0007]在社交网络媒体中,采集与关注的社交网络事件相关的事件数据与用户数据;
[0008]由采集的数据构造异质网络图,获取节点关系和节点属性,获取的节点关系包含用户与用户的关系、用户与事件的关系、事件与事件的关系,获取的节点属性包括节点的语义属性、网络拓扑属性和节点状态属性;
[0009]建立影响力预测模型,所述影响力预测模型包括:异质语义特征融合模块、异质结构特征融合模块、异质多属性特征学习模块、异质网络影响力预测模块,将所述异质网络图的语义属性和邻居异质子图输入异质语义特征融合模块,获得输出的节点的语义特征向量;将所述异质网络图的网络拓扑属性和节点状态属性以及邻居异质子图输入异质结构特征融合模块,获得输出的节点的结构特征向量;将获得的节点的语义特征向量和结构特征
向量输入异质多属性特征学习模块,获得输出的节点的隐层特征向量;将获得节点的隐层特征向量输入异质网络影响力预测模块,获得输出的关注的社交网络事件对用户产生影响的预测概率;
[0010]依据异质网络图和邻居异质子图构建样本,判断样本是否符合训练条件,对于符合训练条件的样本,根据样本中用户是否参与关注事件添加正、负样本的标签,构建训练集和训练标签集合,通过训练集和训练标签集合训练影响力预测模型,直至模型收敛得到训练好的影响力预测模型;
[0011]将需要预测的用户和关注的社交网络事件数据进行处理得到异质网络图和邻居异质子图,输入训练好的输入影响力预测模型,获得输出的关注的社交网络事件对用户产生影响的预测概率,将预测概率与设定值进行比较,若大于设定值,则表示关注的社交网络事件对用户产生影响力,用户参与该社交网络事件,否则反之。
[0012]进一步的,所述的采集与关注的社交网络事件相关的事件数据与用户数据,包括关联事件历史博文,用户历史博文,用户与事件之间的关系数据以及相关的时间信息。
[0013]进一步的,所述的通过采集的数据构造异质网络图,具体包括:构造异质网络图G,异质网络图G包含事件节点E和用户节点U,表示为:
[0014]G=(V,R;O
V
,R
E
,A
V
)
[0015]其中,V表示图G中的节点,R表示图G中的关系,O
V
表示异质网络图的节点,包括用户节点U和事件节点E,R
E
包括用户与事件的关系R
ue
,事件与事件的关系R
ee
和用户与用户的关系R
uu
,R
E
=R
ue
∪R
ee
∪R
uu
,A
V
表示节点的属性特征,包括语义属性网络拓扑属性以及节点状态属性∪表示取并集;
[0016]语义属性包括和在用户历史博文中的用户兴趣主题列表中,使用去停用词后的词频统计方法进行抽取N个用户兴趣关键词,构成在事件的历史博文中的关键词列表中,使用TF

IDF的方法取出N个事件主题关键词,构成
[0017]通过Deepwalk方法计算每个节点的拓扑表示,得到网络拓扑属性
[0018]邻居异质子图的构建包括以下步骤:
[0019]以全局异质网络图G中的每个用户u为起点,利用重启游走算法RWR方法对固定数量为N
R
邻居节点进行采样;
[0020]对于得到的固定数量为N
R
邻居节点,使用随机游走概率和u

e

u元路径和u

u元路径进行采样,u

e

u元路径表示用户发布/参与事件,然后由其他用户转发/参与的路径,u

u元路径表示用户通过其他用户之间互相关注的路径,对固定长度为N,N<N
R
的邻居节点进行采样,使用采样得到的邻居节点构造邻居异质子图G
u

[0021]针对当前用户u
ego
,构建r阶邻居异质子图其中d(v,v
u
)是节点v到节点u的距离,将d(v,v
u
)<=r的节点作为邻居节点,当r固定后,定义G
u
为用户u的邻居异质子图;
[0022]对于节点状态属性针对关注事件e
target
和当前用户用u
ego
,判定邻居异质子图中是否存在当前用户u
ego
的邻居用户,在历史上参与过关注事件e
target
,如果存在,则认为该邻居用户节点是活跃的,设置该用户的节点状态属性否则设置判定u
ego

邻居事件节点是否与关注事件e
target
产生过关联,如果存在,则认为该邻居事件节点是活跃的,设置该事件的节点状态属否则设置
[0023]进一步的,所述影响力预测模型的异质语义特征融合模块包括word2vec词嵌入层、Bi

LSTM神经网络层、G本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于异质网络的社交网络影响力预测方法,其特征在于,包括以下步骤:在社交网络媒体中,采集与关注的社交网络事件相关的事件数据与用户数据;由采集的数据构造异质网络图,获取节点关系和节点属性,获取的节点关系包含用户与用户的关系、用户与事件的关系、事件与事件的关系,获取的节点属性包括节点的语义属性、网络拓扑属性和节点状态属性;建立影响力预测模型,所述影响力预测模型包括:异质语义特征融合模块、异质结构特征融合模块、异质多属性特征学习模块、异质网络影响力预测模块,将所述异质网络图的语义属性和邻居异质子图输入异质语义特征融合模块,获得输出的节点的语义特征向量;将所述异质网络图的网络拓扑属性和节点状态属性以及邻居异质子图输入异质结构特征融合模块,获得输出的节点的结构特征向量;将获得的节点的语义特征向量和结构特征向量输入异质多属性特征学习模块,获得输出的节点的隐层特征向量;将获得节点的隐层特征向量输入异质网络影响力预测模块,获得输出的关注的社交网络事件对用户产生影响的预测概率;依据异质网络图和邻居异质子图构建样本,判断样本是否符合训练条件,对于符合训练条件的样本,根据样本中用户是否参与关注事件添加正、负样本的标签,构建训练集和训练标签集合,通过训练集和训练标签集合训练影响力预测模型,直至模型收敛得到训练好的影响力预测模型;将需要预测的用户和关注的社交网络事件数据进行处理得到异质网络图和邻居异质子图,输入训练好的输入影响力预测模型,获得输出的关注的社交网络事件对用户产生影响的预测概率,将预测概率与设定值进行比较,若大于设定值,则表示关注的社交网络事件对用户产生影响力,用户参与该社交网络事件,否则反之。2.根据权利要求1所述的一种基于异质网络的社交网络影响力预测方法,其特征在于:所述的采集与关注的社交网络事件相关的事件数据与用户数据,包括关联事件历史博文,用户历史博文,用户与事件之间的关系数据以及相关的时间信息。3.根据权利要求1所述的一种基于异质网络的社交网络影响力预测方法,其特征在于:从构造的异质网络图中抽取节点的语义属性、网络拓扑属性,对于每个用户节点,采样得到用户的邻居异质子图,根据邻居异质子图得到邻居用户节点的节点状态属性。4.根据权利要求3所述的一种基于异质网络的社交网络影响力预测方法,其特征在于:所述的通过采集的数据构造异质网络图,具体包括:构造异质网络图G,异质网络图G包含事件节点E和用户节点U,表示为:G=(V,R;O
V
,R
E
,A
V
)其中,V表示图G中的节点,R表示图G中的关系,O
V
表示异质网络图的节点,包括用户节点U和事件节点E,R
E
包括用户与事件的关系R
ue
,事件与事件的关系R
ee
和用户与用户的关系R
uu
,R
E
=R
ue
∪R
ee
∪R
uu
,A
V
表示节点的属性特征,包括语义属性网络拓扑属性以及节点状态属性∪表示取并集;语义属性包括和在用户历史博文中的用户兴趣主题列表中,使用去停用词后的词频统计方法进行抽取N个用户兴趣关键词,构成在事件的历史博文中的关键词列表
中,使用TF

IDF的方法取出N个事件主题关键词,构成通过Deepwalk方法计算每个节点的拓扑表示,得到网络拓扑属性邻居异质子图的构建包括以下步骤:以全局异质网络图G中的每个用户u为起点,利用重启游走算法RWR方法对固定数量为N
R
邻居节点进行采样;对于得到的固定数量为N
R
邻居节点,使用随机游走概率和u

e

u元路径和u

u元路径进行采样,u

e

u元路径表示用户发布/参与事件,然后由其他用户转发/参与的路径,u

u元路径表示用户通过其他用户之间互相关注的路径,对固定长度为N,N<N
R
的邻居节点进行采样,使用采样得到的邻居节点构造邻居异质子图G
u
;针对当前用户u
ego
,构建r阶邻居异质子图其中d(v,v
u
)是节点v到节点u的距离,将d(v,v
u
)<=r的节点作为邻居节点,当r固定后,定义G
u
为用户u的邻居异质子图;对于节点状态属性针对关注事件e
target
和当前用户用u
ego
,判定邻居异质子图中是否存在当前用户u
ego
的邻居用户,在历史上参与过关注事件e
target
,如果存在,则认为该邻居用户节点是活跃的,设置该用户的节点状态属性否则设置判定u
ego
的邻居事件节点是否与关注事件e
target
产生过关联,如果存在,则认为该邻居事件节点是活跃的,设置该事件的节点状态属否则设置5.根据权利要求1所述的一种基于异质网络的社交网络影响力预测方法,其特征在于:所述影响力预测模型的异质语义特征融合模块包括word2vec词嵌入层、Bi

LSTM神经网络层、GCN图神经网络层,将所述异质网络图的语义属性和邻居异质子图,输入异质语义特征融合模块,获得节点的语义特征向量;所述影响力预测模型的异质结构特征融合模块包括network embedding网络嵌入层、向量拼接层、GCN图神经网络层,将所述异质网络图的网络拓扑属性和节点状态属性以及邻居异质子图,输入异质结构特征融合模块,获得节点的结构特征向量;所述影响力预测模型的异质多属性特征学习模块包括向量拼接层、GAT图注意网络层,将获得的节点的语义特征向量和结构特征向量输入异质多属性特征学习模块,获得节点的隐层特征向量;所述影响力预测模型的异质网络影响力预测模块包括顺序设置的全连接层和逻辑分类层,将获得节点的隐层特征向量输入异质网络影响力预测模块,获得输出的关注的社交网络事件对用户产生影响的预测概率。6.根据权利要求1所述的一种基于异质网络的社交网络影响力预测方法,其特征在于:在影响力预测模型的异质语义特征融合模块中,将表示语义属性的特征词输入word2vec词嵌入层,通过word2vec词嵌入的方法,获得输出的为长度为d
word2vec
的特征向量x
i
;将特征向量x
i
输入Bi

LSTM神经网络层,通过Bi

LSTM神经网络,获得输出的聚合特征向量H
S
(v),表示为:
其中,v表示邻居异质子图G
u
中的一个节点,I表示语义属性的特征词的数量,x
i
表示节点v的第i个关键词语义特征,H
S
(v)满足H
S
(v)∈R
d
×1,d表示语义特征嵌入维数,表示前向LSTM网络,表示后向LSTM网络,θ表示神经网络参数,算子||表示拼接操作;将聚合特征向量H
S
(v)和局部异构子图G
u
输入GCN图神经网络层,通过GCN图神经网络,获得输出的节点的语义特征向量H

S
(v),表示为:H

S
(v)=GCN(H
S
(v))=g(A(G
u
)H
S
(v)W
T
+b)其中,A是G
u
的邻接...

【专利技术属性】
技术研发人员:高立群周斌李爱平贾焰江荣涂宏魁王晔喻承汪海洋庄洪武席闻宋鑫刘宇嘉曾康王宸铭
申请(专利权)人:中国人民解放军国防科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1