基于两阶段启发的社交网络影响最大化问题求解方法技术

技术编号:13965760 阅读:175 留言:0更新日期:2016-11-09 11:40
本发明专利技术公开了基于两阶段启发的社交网络影响最大化问题求解方法,属于社交网络分析领域。该方法的处理过程如下:利用线性阈值模型的累积特性,将整个影响最大化算法过程分成两个阶段:(1)度折启发阶段。使用度折策略选取度数最大的种子节点,然后利用种子结点在整个网络中进行节点激活并将节点的影响力积累下来;(2)影响力启发阶段。选取影响力最大的节点作为目标节点,然后利用目标节点进行节点的激活。为了加快算法的求解速度,本发明专利技术在影响力启发阶段设计了一种近似估计节点影响力的计算方法。本发明专利技术能有效、快速的发掘出社交网络中的初始种子节点,有效的解决社交网络中的影响最大化问题,可用于市场营销,舆情监控和广告投放等领域。

【技术实现步骤摘要】

本专利技术涉及社交网路分析领域,特别是基于两阶段启发的社交网络影响最大化问题求解方法
技术介绍
社交网络是由网络中的个体组成的社会关系网,这个个体可以是个人、组织或用户名等任何在网络中出现的可以区别他人的识别码。近年来,各种大规模在线社交网络的兴起,产生了海量的网络数据,这些数据使得在全球范围内研究人类社会中出现的各种现象成为了可能。为了更好的挖掘社交网络中隐藏的信息,研究人员开展了各种各样的社交网络分析。后来,人们发现社交网络中的个人或组织的爱好和行为往往会影响其周边的个人或组织,这为在社交网络上进行“病毒式营销”提供了契机。在社交网络上进行病毒式营销,其中的关键问题是:如何以较小的代价寻找个营销节点组成的集合,最终使得对整个网络产生的影响达到最大,也叫影响最大化问题。影响最大化问题虽然起源于市场营销,但其在舆情监控、病毒传播、广告投放和选举等领域都得到了广泛应用。例如,在舆情监控领域中,我们只需找到散播谣言的源头加以控制,就能有效的控制流言扩散。影响最大化问题自从被Domingos和Richardson等提出以来,就一直是研究人员的关注的热点,并取得了大量的研究成果,这些成果主要集中于一些贪心算法和启发式算法。其中,启发式算法的效率优于贪心算法,但现有的启发式算法大都专注于单个启发因素,如度、介数等,没有考虑网络的整体结构,使得算法的精度较低且适应性差。
技术实现思路
1.专利技术目的:为了克服上述已有算法的不足,本专利技术提出一种基于两阶段启发的社交网络影响最大化问题求解方法,在保证算法效率的前提下提高种子节点的影响范围。2.技术方案:基于两阶段启发的社交网络影响最大化问题求解方法,其求解步骤如下:第一步,输入网络数据,计算各节点的“度数”,该度数需要经过一定的折扣计算,并对节点按照“度数”递减排列;第二步,选取“度数”排在前k1的节点作为种子节点加入种子节点集S,然后利用S根据线性阈值模型的传播过程对未激活节点进行激活,最后将激活的节点加入激活节点集A中;第三步,更新各未激活节点所受影响力;第四步,计算各节点产生的影响力,并对节点按照影响力的大小递减排列;第五步,清空种子节点集S,选取影响力排在前k2的节点作为种子节点加入种子节点集S,然后利用S根据线性阈值模型的传播过程对未激活节点进行激活,最后将激活的节点加入激活节点集A中。在上述的第四步中的节点v的影响力的计算方法描述如下:节点的影响力是指节点对同一网络中的所有其它节点产生的影响的量值。由于节点间的影响力随着距离而减弱,所以节点v只会在一定的范围内产生影响。本文将节点v的直接邻居(出边邻居)与v的距离定义为1,v与直接邻居的邻居的距离为2,以此类推定义节点间的距离D,节点v和节点w间的距离用Dv,w(或Dv,w)表示。节点v对单个节点的影响力用influ(v)表示,节点v对自身的不产生影响,节点v对直接邻居节点的影响力定义为influ1(v),节点v对与其距离为D的节点的影响力为influD(v),其计算公式如(1)所示:其中,表示节点u和w之间的影响力,u∈HD-1(v)∩N(w),w∈HD(v),u,(为节点w的入度,HD(v)为与v距离为D的节点组成的集合,A为激活节点组成的集合);表示度折启发阶段积累的影响力,s∈N(w)且s∈A;D的取值范围为1≤D≤LD,其中LD为节点间的最大影响距离。节点v对与其距离为D的所有节点的影响力之和为InfluD(v),其计算公式如(2)所示:InfluD(v)=∑influD(v) (5)节点v在整个网络的影响力SInflu(v)的近似计算公式如(3)所示: S I n f l u ( v ) = Σ D = 1 L D I n f l u ( v ) - - - ( 6 ) ]]>在本专利技术中节点v的最大影响距离LD定义为2。该计算方法具体步骤如下:(1)计算节点v对直接邻居(出边邻居)的影响力influ1(v),并将v对直接邻居的影响力进行求和计算得v对所有直接邻居的影响力Influ1(v);(2)计算节点v对直接邻居的邻居(出边邻居)的影响力influ2(v),并将v对直接邻居的邻居的影响力进行求和计算得v对所有直接邻居的邻居的影响力Influ2(v);(3)将步骤(1)中的Influ1(v)与步骤(2)中的Influ1(v)进行求和计算得节点v在整个网络中的影响力SInflu(v)。本专利技术的伪代码如下所示:输入:图G(V,E),θ,种子节点个数k,启发因子α输出:激活节点集A其中,S表示种子节点集,tv表示节点v的状态为激活的邻居个数,函数bCC(v)用来计算节点v的出度。在本专利技术伪代码中,第2至5行计算各节点的出度并保存。第6至20行为算法的第一阶段:启发阶段,其中,第6至19行对节点进行度折计算,并找到k1个种子节点,并将种子节点加入激活节点集A中;第20行的Active(S)函数用来将种子节点集在线性阈值模型下进行节点激活,激活节点(受到的影响力大于或等于节点的阈值θ)加入A中。第21行利用A更新未激活节点受到的影响力,将启发阶段中激活失败时产生的影响力累积起来。第23至31行为算法的影响力启发阶段,其中,第23至25行运用CI(v)函数进行未激活节点的影响力计算,其具体计算方法本文将在下一部分中详细介绍;第26至30行选取影响力最大的k2个节点加入种子集,并将种子节点加入激活节点集A中。第31行利用种子节点去激活其它未激活的节点,并将状态为激活的节点加入A中。3.有益效果:本专利技术具有以下优点:(a)传统的启发式算法,大都只关注单个启发因素,如度、介数和最短路径等。但这些启发因素只考虑了局部最优的情况,没有考虑网络的整体结构,从而使得算法的影响范围不佳且适应性不好。而本专利技术利用线性阈值模型的累积特性将基于局部最优的度折启发策略和基于全局的影响力启发策略相结合,这使得本专利技术最终获得的影响范围高于经典的度折启发。(b)节点的影响力是基于全局的,计算复杂度高,因此本专利技术在影响力启发阶段中提供了一种快速的算方法来近似计算节点的影响力,这使得本专利技术在运行效率上也优于经典的度折启发。附图说明图1为节点间存在多条路径的例图图2为节点间存在回路的例图图3为一个小型网络图4为本专利技术的流程图图5为在Wikipedia网络中对比算法的表现图6为在HepTh网络中对比算法的表现图7为在AstroPh网络中对比算法的表现图8为对比算法在三个网络中的运行时间具体实施方式下面结合实施实例和附图对本专利技术作进一步说明。本方法所涉及的相关知识如下:影响最大化算法就是在某种特定传播模型下,寻找一个k个节点组成的节点集,最终使得这个集合在整个网络中产生的影响达到最大。本专利技术所涉及的传播模型是线性阈值模型,介绍如下:线性阈值模型和独立级联模型本文档来自技高网...

【技术保护点】
基于两阶段启发的社交网络影响最大化问题求解方法,其特征在于包括下述步骤:第一步,输入网络数据,计算各节点的“度数”,该度数需要经过一定的折扣计算,并对节点按照“度数”递减排列;第二步,选取“度数”排在前k1的节点作为种子节点加入种子节点集S,然后利用S根据线性阈值模型的传播过程对未激活节点进行激活,最后将激活的节点加入激活节点集A中;第三步,更新各未激活节点所受影响力;第四步,计算各节点产生的影响力,并对节点按照影响力的大小递减排列;第五步,清空种子节点集S,选取影响力排在前k2的节点作为种子节点加入种子节点集S,然后利用S根据线性阈值模型的传播过程对未激活节点进行激活,最后将激活的节点加入激活节点集A中。

【技术特征摘要】
1.基于两阶段启发的社交网络影响最大化问题求解方法,其特征在于包括下述步骤:第一步,输入网络数据,计算各节点的“度数”,该度数需要经过一定的折扣计算,并对节点按照“度数”递减排列;第二步,选取“度数”排在前k1的节点作为种子节点加入种子节点集S,然后利用S根据线性阈值模型的传播过程对未激活节点进行激活,最后将激活的节点加入激活节点集A中;第三步,更新各未激活节点所受影响力;第四步,计算各节点产生的影响力,并对节点按照影响力的大小递减排列;第五步,清空种子节点集S,选取影响力排在前k2的节点作为种子节点加入种子节点集S,然后利用S根据线性阈值模型的传播过程对未激活节点进行激活,最后将激活的节点加入激活节点集A中。2.如权利要求1所述的基于两阶段启发的社交网络影响最大化求解方法,其特征在于所述的第四步中的节点v的影响力的计算方法描述如下:节点的影响力是指节点对同一网络中的所有其它节点产生的影响的量值。由于节点间的影响力随着距离而减弱,所以节点v只会在一定的范围内产生影响。本文将节点v的直接邻居(出边邻居)与v的距离定义为1,v与直接邻居的邻居的距离为2,以此类推定义节点间的距离D,节点v和节点w间的距离用Dv,w(或Dv,w)表示。节点v对单个节点的影响力用influ(v)表示,节点v对自身的不产生影响,节点v对直接邻居节点的影响力定义为influ1(v),节点v对与其距离为D的节点的影响力为influD(v),其计算公式如(1)所示:其中,表示节点u和w之间的影响力,u∈HD-1(v)∩N(w),w∈HD(v),(为节点w的入度,HD(v)为与v距离为D的...

【专利技术属性】
技术研发人员:杨书新刘成辉
申请(专利权)人:江西理工大学
类型:发明
国别省市:江西;36

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1