一种基于图神经网络的社交网络影响力预测方法、装置制造方法及图纸

技术编号:31379884 阅读:19 留言:0更新日期:2021-12-15 11:24
本发明专利技术提供了基于图神经网络的社交网络影响力预测方法、装置及介质,其可以帮助社交平台给用户提供更加精准的社交内容推荐、朋友推荐,包括:从社交网络平台的数据中提取交互行为的关键字段,构建用户全局社交关系网络;采样得到用户局部社交关系网络;拼接网络结构特征与属性特征,得到用户节点的初始化特征表示;通过关键字段中的交互频次,重新对邻接矩阵进行赋值,得到连接强度矩阵,堆叠邻接矩阵和连接强度矩阵,获得多通道矩阵;构建包括图卷积神经网络层和图注意力神经网络层的图神经网络模型,得到用户节点经过图神经网络模型学习到的特征;基于全连接神经网络构建预测分类器,通过训练好的预测分类器,输出预测的社交网络影响力。交网络影响力。交网络影响力。

【技术实现步骤摘要】
一种基于图神经网络的社交网络影响力预测方法、装置


[0001]本专利技术属于网络舆情分析
,特别涉及一种基于图神经网络的社交网络影响力预测方法、装置。

技术介绍

[0002]随着Twitter、微博和Digg等在线社交媒体平台的蓬勃发展,用户通过发表评论、转发消息或投票等方式参与各种在线社交活动,与此同时用户在社交媒体上还能收到好友参与在线社交活动的通知,并且可能会被影响从而转发相同的消息,或投票支持相同的主题。业内将这种现象称为在线社交网络影响力,表示一个人的情绪、观点或行为受到他人的影响。在线社交网络影响力对社交媒体公司的成功有重大影响,也为传统媒体公司提供了新的营销机会。因此,近年来人们对开发社交影响力分析工具的研究越来越感兴趣。
[0003]与采用手工规则嵌入特征的传统方法不同,近几年的方法利用图神经网络来学习特征泛化性强的社交网络影响力预测模型。研究者主要利用早期采用者的时序特征和结构特征进行流行度预测,即预测给定信息项在未来的级联规模,现有的方法并未考虑单个用户,主要聚焦于信息级联的宏观层面。即预测一个转发总量;而在微观层面上,对于单个用户层面上研究,研究对某个人的影响力,预测某个人是不是会转发微博,当前并未聚焦类似的角度进行研究;
[0004]另一方面,以往的研究主要基于端到端的框架,利用网络结构特征和用户特定的特征,或学习子图的拓扑特征。现有的研究把用户间的关系用二元变量(是否为朋友)来表示,基于此来学习用户间的影响力。然而从建模和方法论的角度看,现有的研究都是不充分的。
>[0005]在建模的角度看,二元变量仅仅是粗略地表示了用户是否为朋友关系,忽视了用户在社交网络上的显式交互。结果是现有的研究方法在建模用户间的连接强度方面存在不足,而用户间的连接强度根据社会学常识是对社交网络影响力的预测是有帮助的。比如在现实生活中,用户更倾向转发好友的推文,相较于熟人。
[0006]为此,本专利技术旨在提供一种新的社交网络影响力预测方法来解决目前存在的问题。

技术实现思路

[0007]针对上述问题,本专利技术提供了一种基于图神经网络的社交网络影响力预测方法、装置以及计算机存储介质,其可以帮助社交平台给用户提供更加精准的社交内容推荐、朋友推荐;可以应用于舆情分析与控制,帮助维持国家的稳定。
[0008]本专利技术解决技术问题采用的技术方案是:一种基于图神经网络的社交网络影响力预测方法,其特征在于,包括以下步骤:
[0009]步骤1:从社交网络平台的数据中提取交互行为的关键字段,依据提取的交互行为的关键字段构建用户全局社交关系网络;
[0010]步骤2:采用重启的随机游走法对用户全局社交关系网络进行采样,得到用户局部社交关系网络,通过邻接矩阵表示用户局部社交关系网;
[0011]步骤3:使用DEEPWALK算法获取用户全局社交关系网络中用户节点的网络结构特征,再将网络结构特征与用户节点的属性特征拼接,得到用户节点的初始化特征表示;
[0012]步骤4:通过关键字段中的交互频次,重新对邻接矩阵进行赋值,得到表示连接强度特征的连接强度矩阵,堆叠邻接矩阵和连接强度矩阵,获得多通道矩阵,所述多通道矩阵表示融合特征;
[0013]步骤5:构建图神经网络模型,所述图神经网络模型包括图卷积神经网络层和图注意力神经网络层,将用户节点的初始化特征表示和表示融合特征的多通道矩阵输入图神经网络模型,输出用户节点经过图神经网络模型学习到的特征;
[0014]步骤6:基于全连接神经网络构建预测分类器,将用户节点经过图神经网络模型学习到的特征作为输入,训练预测分类器直至收敛,获得训练好的预测分类器;
[0015]步骤7:将需要预测的用户的社交网络数据处理得到的图结构特征,输入训练好的预测分类器,输出预测的社交网络影响力。
[0016]进一步的,在步骤1中,从社交网络平台的数据集中提取交互行为的关键字段,提取出交互行为的关键字段包括:用户ID,交互行为、交互对象ID,交互频次,交互行为包括评论,转发;
[0017]进一步的,在步骤1中,用户全局社交关系网络通过如下方式构建:
[0018]设置转发阈值e,对于用户v
i
,如果用户v
i
直接转发用户v
j
的推文达到或超过阈值e,则判定用户v
i
关注了用户v
j
,以用户v
i
为中心用户,将判定与用户v
i
存在关注关系的其他用户v
j
作为中心用户的邻居,存在关注关系的用户之间通过连边连接,构建得到用户全局社交关系网络。
[0019]进一步的,在步骤2中,采用重启的随机游走法在用户全局社交关系网络采样N个用户,设置用户随机游走回到起点的重启概率参数为P,用户移动到一个随机选择的邻居的概率为1

P,得到用户局部社交关系网,通过邻接矩阵A表示,邻接矩阵A的数值使用0/1二元变量进行初始化表示,0/1二元变量表示用户是否通过随机游走回到起点。
[0020]进一步的,步骤3中具体包括以下步骤:
[0021]步骤301:采用DEEPWALK算法,获取用户全局社交关系网络中用户节点的网络结构特征;
[0022]步骤302:通过两个0/1标志位表示用户节点的属性特征,其中一个0/1标志表示用户是否为局部社交关系网中的中心用户,是则置1,否则置0;另一个0/1标志表示用户是否进行转发,是则置1,否则置0;
[0023]步骤303:拼接网络结构特征和属性特征,得到用户节点的初始化特征表示。
[0024]进一步的,步骤4中具体包括以下步骤:
[0025]步骤401:计算用户间评论、转发的次数,得到交互频次;
[0026]步骤402:采用交互频次对邻接矩阵A进行重新赋值,得到连接强度矩阵B,强度矩阵B中的B
ij
=x表示用户v
i
和用户v
j
之间的交互频次为x;
[0027]步骤403:堆叠邻接矩阵A和连接强度矩阵B,得到多通道矩阵M,其中
M
··1=A,M
··2=B,M
··1和M
··2分别为多通道矩阵M在第一通道、第二通道下的表示,另外M中的..下标能够分别取值i、j,i、j∈N,多通道矩阵M的通道数为2,多通道矩阵M表示用户节点的融合特征;
[0028]进一步的,步骤5中,在图卷积神经网络层中,具体包括以下步骤:
[0029]步骤501A:将用户节点的融合特征和初始化特征表示进行输入,对邻居信息进行聚合更新节点的表示,通过如下公式表示:
[0030][0031]其中,H
l
是图卷积神经网络层的第l层节点的表示,同理H
l
‑1是第l

1层节点的表示,便是第l

1层节点在第一通道的表示,则是第l
‑<本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于图神经网络的社交网络影响力预测方法,其特征在于,包括以下步骤:步骤1:从社交网络平台的数据中提取交互行为的关键字段,依据提取的交互行为的关键字段构建用户全局社交关系网络;步骤2:采用重启的随机游走法对用户全局社交关系网络进行采样,得到用户局部社交关系网络,通过邻接矩阵表示用户局部社交关系网;步骤3:使用DEEPWALK算法获取用户全局社交关系网络中用户节点的网络结构特征,再将网络结构特征与用户节点的属性特征拼接,得到用户节点的初始化特征表示;步骤4:通过关键字段中的交互频次,重新对邻接矩阵进行赋值,得到表示连接强度特征的连接强度矩阵,堆叠邻接矩阵和连接强度矩阵,获得多通道矩阵,所述多通道矩阵表示融合特征;步骤5:构建图神经网络模型,所述图神经网络模型包括图卷积神经网络层和图注意力神经网络层,将用户节点的初始化特征表示和表示融合特征的多通道矩阵输入图神经网络模型,输出用户节点经过图神经网络模型学习到的特征;步骤6:基于全连接神经网络构建预测分类器,将用户节点经过图神经网络模型学习到的特征作为输入,训练预测分类器直至收敛,获得训练好的预测分类器;步骤7:将需要预测的用户的社交网络数据处理得到的图结构特征,输入训练好的预测分类器,输出预测的社交网络影响力。2.根据权利要求1所述的一种基于图神经网络的社交网络影响力预测方法,其特征在于:在步骤1中,从社交网络平台的数据中提取交互行为的关键字段,提取出交互行为的关键字段包括:用户ID,交互行为、交互对象ID,交互频次,交互行为包括评论,转发。3.根据权利要求2所述的一种基于图神经网络的社交网络影响力预测方法,其特征在于:在步骤1中,用户全局社交关系网络通过如下方式构建:设置转发阈值e,对于用户v
i
,如果用户v
i
直接转发用户v
j
的推文达到或超过阈值e,则判定用户v
i
关注了用户v
j
,以用户v
i
为中心用户,将判定与用户v
i
存在关注关系的其他用户v
j
作为中心用户的邻居,存在关注关系的用户之间通过连边连接,构建得到用户全局社交关系网络。4.根据权利要求3所述的一种基于图神经网络的社交网络影响力预测方法,其特征在于:在步骤2中,采用重启的随机游走法在用户全局社交关系网络采样N个用户,设置用户随机游走回到起点的重启概率参数为P,用户移动到一个随机选择的邻居的概率为1

P,得到用户局部社交关系网,通过邻接矩阵A表示,邻接矩阵A的数值使用0/1二元变量进行初始化表示,0/1二元变量表示用户是否通过随机游走回到起点。5.根据权利要求4所述的一种基于图神经网络的社交网络影响力预测方法,其特征在于:步骤3中具体包括以下步骤:步骤301:采用DEEPWALK算法,获取用户全局社交关系网络中用户节点的网络结构特征;步骤302:通过两个0/1标志位表示用户节点的属性特征,其中一个0/1标志表示用户是否为局部社交关系网中的中心用户,是则置1,否则置0;另一个0/1标志表示用户是否进行转发,是则置1,否则置0;步骤303:拼接网络结构特征和属性特征,得到用户节点的初始化特征表示。
6.根据权利要求5所述的一种基于图神经网络的社交网络影响力预测方法,其特征在于:步骤4中具体包括以下步骤:步骤401:计算用户间评论、转发的次数,得到交互频次;步骤402:采用交互频次对邻接矩阵A进行重新赋值,得到连接强度矩阵B,强度矩阵B中的B
ij
=x表示用户v
i
和用户v
j
之间的交互频次为x;步骤403:堆叠邻接矩阵A和连接强度矩阵B,得到多通道矩阵M,其中M
..1
=A,M
..2
=B,M
..1
和M

【专利技术属性】
技术研发人员:庄洪武周斌李爱平席闻高立群汪海洋刘宇嘉曾康宋鑫王宸铭
申请(专利权)人:中国人民解放军国防科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1