本发明专利技术公开了一种基于ReciprocityRank算法的微博网络影响力节点发现方法,其实现步骤为:首先建立节点数为N、有向边数为M的有向网络,引入一个背景节点与有向网络中的每个节点双向连接;然后为所有节点赋权值,背景节点权值为0,网络节点权值为1,初始化时间t=0;接着,时间t加1,对于每个网络节点,分别计算该网络节点与各个相邻节点之间的转移概率后和预设的概率阈值进行比较,并将该网络节点的权值分配给与其之间转移概率大于预设的概率阈值的相邻节点,重复该步骤,直至所有网络节点的权值达到稳态值;最后,根据节点的最终权值进行排序。
【技术实现步骤摘要】
本专利技术设及复杂网络中影响力节点发现方法,特别设及于基于ReciprocityRank 算法的微博网络影响力节点发现方法。
技术介绍
随着互联网和Web2. 0技术的快速发展,网络对于人们生活的影响越来越大,尤其 是W微博为代表的社交媒体平台已经随着网络的发展逐渐进入人们的生活。目前,微博已 经成为群众发布、获取、分享、讨论的主流平台之一,其特有的分列式信息传递方式使得用 户信息得到快速而广泛的传播,但是大量负面、虚假甚至是违法的信息也在网络中传播和 蔓延,因此怎样寻找网络中的影响力节点从而控制微博网络中的信息传播过程已成为一个 至关重要的问题。 网络中高影响力的节点通常更易于被感染,同时也更易于感染网络的其他节点。 为解决运个问题,各种各样的中屯、性指标被提出。如度中屯、性、介数中屯、性、紧密度中屯、性、 K-壳分解法等。在有向网络中,PageRank算法W其较好的排序效果化及较高的商业价值吸 引了研究者的关注,常被推广应用到各种不同的网络。LeaderRank算法在化geRank算法 的基本思想上进行改进。运两种算法均认为节点的影响力取决于跟随者的数量和质量,节 点的粉丝影响力越大,那么节点是高影响力节点的概率就越高。但是LeaderRank算法相比 于化geRank算法,在信息传播、抵抗噪声鲁棒性和抗击鲁棒性等方面全面优于化geRank算 法。但是运些算法均是只基于网络的拓扑结构提出来的,未考虑到节点自身行为的差异性 对节点影响力的影响。
技术实现思路
为了解决W上现有算法的缺陷,特别针对于LeaderRank算法中未考虑到节点自 身行为的差异性对节点影响力的影响,本专利技术提供了一种基于ReciprocityRank算法的微 博网络影响力节点发现方法,W提高影响力节点发现的准确度。 ,包括W下步骤: 阳006] 步骤1),建立节点数为N、有向边数为M的有向网络,其中,N、M均为自然数;步骤2),引入一个背景节点与步骤1)中的有向网络中的每个网络节点双向连接; 步骤3),为所有节点赋权值,背景节点权值为0,网络节点权值为1,初始化时间t =0 ;步骤4),时间t加1,对于每个网络节点,分别计算其与各个相邻节点之间的转移 概率; 步骤5),对于每个网络节点,分别将其与各个相邻节点之间的转移概率和预设的 概率阔值进行比较,并将该网络节点的权值分配给与其之间转移概率大于预设的概率阔值 的相邻节点; 步骤6),重复步骤4)至步骤5),直至所有网络节点的权值达到稳态值; 步骤7),根据网络节点的最终权值进行排序。 作为本专利技术进一步 的优化方案,所述步骤4)中转移概率的计算方法为: 作为本专利技术进一步 的优化方案,所述步骤5)中将网络节点的权值分配给与其之间转移概率大于预设的概率 阔值的相邻节点的具体公式如下:阳01引其中,RRi(t)表示节点i在t时刻的权值;RRww(t)表示背景节点在t时刻的权值;a。为有向网络的网络邻接矩阵中对应的项元素,a。二0。 阳019] 作为本专利技术进一步 的优化方案,所述预设的概率阔值为30%。 阳020] 作为本专利技术进一步 的优化方案,所述预设的概率阔值为50%。 本专利技术将基于节点出边互惠数和出度的ReciprocityRank算法用于微博网络影 响力节点发现,在保持较好的抵抗噪声鲁棒性和抗击鲁棒性等性能,还融入了节点行为差 异的因素,提高了算法的精确度。本专利技术对真实网络,尤其是社交网络的节点影响力发现效 果最佳。【附图说明】 图1是本专利技术的方法流程图; 图2-曰、图2-b分别为对采集的SM网络在取L= 50时本专利技术与化geRank算法、本 专利技术与LeaderRank算法的传播范围对比示意图; 图3-曰、图3-b分别为对采集的TM网络在取L= 50时本专利技术与化geRank算法、本 专利技术与LeaderRank算法的传播范围对比示意图; 阳0巧]图4-曰、图4-b分别为对采集的SM网络在取L= 20时本专利技术与化geRank算法、本 专利技术与LeaderRank算法的传播范围对比示意图; 阳0%] 图5-曰、图5-b分别为对采集的TM网络在取L= 20时本专利技术与化geRank算法、本 专利技术与LeaderRank算法的传播范围对比示意图。【具体实施方式】 为了使本专利技术的目的、技术方案及优点更加清楚明白,W下结合附图及实施例,对 本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用W解释本专利技术,并 不用于限定本专利技术。 阳02引如图1所示,该方法包括W下步骤: 步骤1,建立节点数为N、有向边数为M的有向网络; 为了更加直观的显式出本专利技术的实际效果,应用本专利技术于微博网络。通过对某两 种微博网络的数据采集,W用户为节点,节点间的关注与被关注关系为有向边,分别构建有 向关系网络SM和TM,其参数如表1所示。表1: 步骤2,引入一个背景节点与初始网络中的每个节点双向连接; 为了解决网络的不连通性而导致的排序结果不唯一,因此在初始有向网络中引入 一个背景节点,并且背景节点与初始有向网络中的所有节点双向连接,此时的网络节点数 为N+1,有向边数为M+2XN,网络为强连通网络。 步骤3,为所有节点赋权值,背景节点权值为0,网络节点权值为1,初始化时间t= 0 ; 步骤4,时间t加1,对于每个网络节点,分别计算其与各个相邻节点之间的转移概 率,然后将其与各个相邻节点之间的转移概率分别和预设的概率阔值进行比较,并将该网 络节点的权值分配给与其之间转移概率大于预设的概率阔值的相邻节点; 单位时间内,节点W转移概率Ci选择访问访问背景节点或是初始网络节点,运一 概率反映了节点的不活跃程度,节点越不活跃,显然也就不容易在自己的关注对象和粉丝 对象之间起到桥梁作用,自身的影响力也就不容易起到作用。最直观的感受,节点i关注的 对象越多,其获取的信息来源也就更广泛,则产生转发或发表信息行为的概率也就越高。同 样的,节点i有越多的真实好友使用微博网络,则其对于微博网络的重视程度也就越高于 那些没有或者只有少数朋友使用微博的用户,也就意味着节点i在微博活动中活跃度同样 也就会越高。根据上述所提出的思想,我们假设,节点的转移概率即访问背景节点的概率受其 关注数和互惠边数共同影响,即节点i的转移概率为:W40] 其中,Ci为节点i的转移概率;为加入背景节点后,网络中节点i的出度; 为加入背景节点后,网络中节点i的出边互惠数。引入互惠边因素W及背景节点后, 在时间t内逐个将节点的权值分发给访问节点,W边i一j为例,具体表达式如下:[当前第1页1 2 本文档来自技高网...
【技术保护点】
基于ReciprocityRank算法的微博网络影响力节点发现方法,其特征在于,包括以下步骤:步骤1),建立节点数为N、有向边数为M的有向网络,其中,N、M均为自然数;步骤2),引入一个背景节点与步骤1)中的有向网络中的每个网络节点双向连接;步骤3),为所有节点赋权值,背景节点权值为0,网络节点权值为1,初始化时间t=0;步骤4),时间t加1,对于每个网络节点,分别计算其与各个相邻节点之间的转移概率;步骤5),对于每个网络节点,分别将其与各个相邻节点之间的转移概率和预设的概率阈值进行比较,并将该网络节点的权值分配给与其之间转移概率大于预设的概率阈值的相邻节点;步骤6),重复步骤4)至步骤5),直至所有网络节点的权值达到稳态值;步骤7),根据网络节点的最终权值进行排序。
【技术特征摘要】
【专利技术属性】
技术研发人员:宋玉蓉,阚长江,付文豪,
申请(专利权)人:南京邮电大学,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。