本发明专利技术公开了一种面向微博特定类型用户的信息影响力最大化方法。包括:数据采集,即从微博网络采集用户的粉丝,交互信息以及用户的配置信息;数据处理,即从微博网络中提取用户的粉丝关关系、关注关系、交互关系以及用户的属性信息;用户分类,即根据给定的用户类型信息进行匹配用户对用户进行分类,删除无效节点;初始候选集合选取,即根据用户的交互信息以及用户属性等信息对用户进行初始降序排序,并选取前n个用户形成初始候选集合;初始激活集合生成,即根据候选集合节点建立网络子图,并通过信息传播模型选取初始的激活集合。本发明专利技术能够有效的解决微博特定类型用户的影响力最大化问题。
【技术实现步骤摘要】
本专利技术属于无线感知
,尤其涉及一种面向微博特定类型用户的信息影响 力最大化方法。
技术介绍
随着社会网络的飞速发展,社会媒体的多样化,以及社会网络用户的迅速增长,加 速了社会网络的大数据时代的来临。近年来,社会网络的研究一直是研究人员重视的方向, 社会网络的研究涉及到计算机科学,社会心理学,社会学等诸多领域。社会影响力最大化问 题一直是社会网络研究的热点。 早前的影响力最大化算法的研究,主要是针对传统的社会媒体,并且聚焦在如何 扩大影响数量以及降低时间复杂度等方面上。然而,近年来随着微博网络的兴起,带给了传 统社会网络的巨大冲击,国外知名的微博twitter,以及国内的新浪腾讯等博受到了广大网 络用户的追捧。截止到2014年7月,我国的微博用户已经达到了 2亿。因此,针对微博网 络的影响力最大化能够使得商家更加有效的定点投放广告,同时也可以针对影响力最大化 的节点进行监控防止微博谣言的传播。所以针对微博的影响力最大化算法的研究更应该受 到广大研究人员的重视。然而,面对如此巨大的用户群体,许多有效的微博网络影响力最大 化算法并不适用于微博网络。基于传播模型的方法在小规模网络中可以得很好的效果,然 而不适合大规模网络。启发式的算法由于在微博网络中存在大量的僵尸用户和机器人用户 对这类启发式的算法也产生了巨大的干扰。因此传统的算法无法有效的针对微博等大规模 社会网络获得很好的影响效果。 同时在商业领域以及网络舆情领域更希望关注特定类型的用户的激活问题。例 如,在商业领域中,一个女性用品的商家更希望他们所发的微博广告被更多的女性用户所 接受。但是现有的影响力最大化算法并没有考虑激活怎样类型的用户。
技术实现思路
本专利技术的目的是提供一种能够有效计算影响力最大化方法的,面向微博特定类型 用户的信息影响力最大化方法。 -种面向微博特定类型用户的信息影响力最大化方法,包括以下步骤, 步骤一:在微博网络中获取用户的粉丝、关注列表和配置信息,同时获取微博用户 在T时间段内的所有交互行为数据; 步骤二:根据提取的用户粉丝、关注列表构建用户关注关系并生成用户关注关系 图G〈U,E>其中U为微博用户集合,E为边的集合, 根据提取的用户交互行为数据,构建用户行为关系并形成用户行为关系图 <U,E,W>其中W表示边的权重; 根据提取的用户配置信息生成用户属性向量U1= {a i,a2,…an}; 步骤三:根据给定的用户类型信息进行匹配用户对用户进行分类,删除用户行为 关系图中的无效用户,形成简化后的用户行为关系图G"<U',E',W' >; 给定用户类型向量x = (X1, X2,…xj,进行用户类型匹配计算: 对于匹配结果sim(Ul,X)不等于1的用户,如果该用户没有粉丝或者该用户没有 活跃度,将该用户删除; 步骤四:使用BiasRank启发式的排序方法对简化后的用户行为关系图中的用户 进行降序排序,选取排序的前η个用户生成初始候选集合; 步骤五:根据生成的初始候选集合建立简化的社会网络关系图,在简化的社会网 络关系图上仿真模拟信息传播得到激活节点集合,计算激活节点集合的累积影响力值,选 取累积影响力值最大激活节点集合对应的m个初始用户集合,将m个初始用户集合作为初 始激活集合。 本专利技术,还可以包括: 1、使用BiasRank启发式的排序方法对简化后的用户行为关系图中的用户进行降 序排序的方法为: 对用户u求取影响力值: 其中A(V)表示用户V的的活跃度,W(v, u)为用户V对用户u在T时间段内的转 发数,对所有用户根据其影响力值进行降序排序。 2、激活节点集合的累积影响力值为 Iu= BiasRank(U) A激活节点集合,1。表示通过BiasRank启发式启发式算法计算的影响力值。 有益效果: 本专利技术针对现有的影响力最大化问题的不足,重点考虑如何针对特定类型的微博 用户的激活作为目标来进行研究,提出了一种基于用户行为和用户属性的用户影响力最大 化算法。该算法能够有效的解决微博特定类型用户的影响力最大化问题。 本专利技术提出,该技术主要考 虑微博网络中的用户多样性问题,来对传统的影响力最大化问题进行改进。并取得了良好 的影响效果。 本专利技术能够有效的针对微博类的大规模社会网络,具有较高的传播效果,可以用 于微博网络的信息传播引导。 本专利技术采用BiasRank启发式的排序方法对简化后的用户行为关系图中的用户进 行降序排序,考虑到微博中的活跃度和行为偏好,涉及更加符合微博用户的影响力计算方 法,使得本专利技术能够有效、快速地找到微博中影响力最大的m个初始用户集合。 本专利技术通过选取的初始候选集合建立简化的社会网络关系图,使得本专利技术的方法 计算复杂度低。【附图说明】 图1是本专利技术的微博特定类型用户影响力最大化的总体流程图。 图2是本专利技术提供的社会网络图映射的具体示意图。【具体实施方式】 下面将结合附图对本专利技术做进一步详细说明。 本专利技术实施提供,利用从微 博网络上获取的用户粉丝关系以及用户属性信息,通过初始排序用户并对用户信息进行仿 真信息传播来选取初始的激活用户从而实现对微博网络信息的影响力最大化。 为实现上诉专利技术目的,本专利技术提供一种面向微博特定类型用户的信息影响力最大 化方法实现包括以下阶段: Al数据采集; A2数据处理; A3用户分类; A4初始候选集合选取; A5初始激活集合生成。 所述步骤Al中,其所述数据采集的步骤包括: 步骤All :在微博网络中获取用户的粉丝和关注列表; 步骤A12 :获取微博用户在T时间段内的所有交互行为数据; 步骤A13 :获取微博用户的配置信息。 步骤A21 :根据用户的粉丝列表以及关注列表构建用户关注关系并生成用户关注 关系图; 步骤A22 :根据用户的交互行为数据,构建用户行为关系并形成用户行为关系图; 步骤A23 :根据用户属性生成用户属性向量。 所述步骤A3中,其所述用户分类的步骤为: 步骤A31 :根据给定的用户类型将用户分类; 步骤A32:对网络图中的无效用户节点进行删除,无效节点包括:僵尸用户,非给 定类型用户并且为叶子节点的用户。 所述步骤A4中,其所述的初始候选集合选取步骤为: 步骤A41 :使用BiasRank启发式的排序方法对网络中的用户进行降序排序; 步骤A42 :选取当前第1页1 2 本文档来自技高网...
【技术保护点】
一种面向微博特定类型用户的信息影响力最大化方法,其特征在于:包括以下步骤,步骤一:在微博网络中获取用户的粉丝、关注列表和配置信息,同时获取微博用户在T时间段内的所有交互行为数据;步骤二:根据提取的用户粉丝、关注列表构建用户关注关系并生成用户关注关系图G<U,E>其中U为微博用户集合,E为边的集合,根据提取的用户交互行为数据,构建用户行为关系并形成用户行为关系图G′<U,E,W>其中W表示边的权重;根据提取的用户配置信息生成用户属性向量ui={a1,a2,…an};步骤三:根据给定的用户类型信息进行匹配用户对用户进行分类,删除用户行为关系图中的无效用户,形成简化后的用户行为关系图G″<U′,E′,W′>;给定用户类型向量x={x1,x2,…xn},进行用户类型匹配计算:sim(ui,x)=x*uiΣxi∈xxi]]>对于匹配结果sim(ui,x)不等于1的用户,如果该用户没有粉丝或者该用户没有活跃度,将该用户删除;步骤四:使用BiasRank启发式的排序方法对简化后的用户行为关系图中的用户进行降序排序,选取排序的前n个用户生成初始候选集合;步骤五:根据生成的初始候选集合建立简化的社会网络关系图,在简化的社会网络关系图上仿真模拟信息传播得到激活节点集合,计算激活节点集合的累积影响力值,选取累积影响力值最大激活节点集合对应的m个初始用户集合,将m个初始用户集合作为初始激活集合。...
【技术特征摘要】
【专利技术属性】
技术研发人员:杨武,于淼,王巍,苘大鹏,玄世昌,
申请(专利权)人:哈尔滨工程大学,
类型:发明
国别省市:黑龙江;23
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。