当前位置: 首页 > 专利查询>东北大学专利>正文

一种基于R覆盖率优先的社交网络观察点选取方法技术

技术编号:10743640 阅读:129 留言:0更新日期:2014-12-10 16:30
本发明专利技术公开了一种基于R覆盖率优先的社交网络观察点选取方法,该方法的核心思想,是将观察点集在网络中的R覆盖率作为判断观察点定位性能的依据,在指定观察点数量的情况下,选取网络中R覆盖率最大的一组节点作为观察点,使得这组观察点可以用尽可能小的计算消耗达到最高的定位准确率。本发明专利技术中的观察点选取方法是用于传播信息源定位的,对于相同的观察点数目,本发明专利技术具有更高的定位准确率。该方法能找到一组优化的观察点集合,这组观察点集合可以满足在固定观察点数量的情况下,其定位准确率更高;在保证定位准确率的情况下,需要的观察点更少,计算消耗也更小。

【技术实现步骤摘要】
一种基于R覆盖率优先的社交网络观察点选取方法
本专利技术属于社交网络
,具体为一种基于R覆盖率优先的社交网络观察点选取方法。
技术介绍
伴随着博客(Blog)、微博(Micro-Blog)等新型社交网络服务的大量出现,社交网络(SocialNetworksServices,SNS)已经成为社会大众获取信息的重要渠道之一。社交网络上的信息传播为人们带来方便的同时,也为网络谣言的扩散提供了一种途径。因此需要对社交网络中信息扩散源进行定位,进而对舆情进行监控。一种可行的定位方法,是在网络中部署观察点,对信息源进行似然估计。现有的观察点选取方法,是在网络中选取中心性特征值较大的节点作为观察点。通过这种方法得到的观察点,其定位准确率低,且计算消耗大,不适用于庞大的社交网络。针对上述情况,本专利技术提出了一种基于R覆盖率优先的社交网络观察点选取方法,其目的是提高扩散源定位的准确率。通过该方法得到的观察点集,在固定观察点数量的情况下,其定位准确率更高;在保证定位准确率的情况下,需要的观察点更少,计算消耗也更小。准确的定位社交网络中的谣言扩散源点,是一种有效的网络舆情监控手段。现有的一种定位方法,是在网络中部署少量的观察点,根据观察点记录的信息首次传入时间和传入方向,计算候选信息源的似然估计值,进而推断信息源。这种方法的定位准确性和计算消耗,都与观察点在网络中的部署位置有关。现有的观察点选取方法,一种是从网络中随机选取一定数量的观察点,另一种是优先选取网络中中心性特征值(例如度数中心性、介数中心性、紧密度中心性、特征向量中心性、聚类系数、K-核等)大的节点。这两类方法选取的观察点集合,其定位准确率均较低,如果需要保证一个较高的定位准确率,就需要增加观察点的个数。但是,随着观察点数量的增加,计算的消耗也随之增加。对于社交网络这样规模庞大的用户群体来说,这样的计算消耗会严重影响定位的及时性。
技术实现思路
为了解决现有技术中存在的问题,本专利技术提供一种基于R覆盖率优先的社交网络观察点选取方法,找到一组优化的观察点集合,这组观察点集合可以满足在固定观察点数量的情况下,其定位准确率更高;在保证定位准确率的情况下,需要的观察点更少,计算消耗也更小。该方法的核心思想,是将观察点集在网络中的R覆盖率作为判断观察点定位性能的依据(理论依据下面有证明过程),在指定观察点数量的情况下,选取网络中R覆盖率最大的一组节点作为观察点,使得这组观察点可以用尽可能小的计算消耗达到最高的定位准确率。其技术方案为:一种基于R覆盖率优先的社交网络观察点选取方法,用m表示种群规模,G表示遗传代数,t表示当前种群代数,G(t)表示第t代种群,size(G(t))表示第t代种群中染色体个数,算法:R覆盖率优先观察点集选取算法,输入:遗传代数G,种群规模m,输出:一组R覆盖率优先的观察点集,包括以下步骤:步骤1:当t=0时,初始化G(0);步骤2:如果t<G;步骤3:计算G(t)中染色体的适应度函数值:取为适应度函数,其中Ti满足即对于染色体上的基因xi来说,当xi=0时,Ti为空;当xi=1时,以网络中节点i为根做R阶生成树,得到全部满足|E(s,xi)|≤R的节点的集合步骤4:对G(t)进行复制操作,将父染色体存入G(t+1);步骤5:如果size(G(t))<m;步骤6:执行交叉操作,将新生成的染色体存入G(t+1);步骤7:执行变异操作,将新生成的染色体存入G(t+1);步骤8:如果size(G(t))≥m,则t+1,跳到步骤2;步骤9:如果t≥G,则得到当前种群中适应度函数值最大的染色体,解码得到对应的观察点集合。与现有技术相比,本专利技术的有益效果为:本专利技术在已知网络拓扑结构和观察点数量的情况下,应用该算法,可以找到网络中一组R覆盖率最大的节点集合。该算法以遗传算法为基础,将网络中的节点映射为染色体中的基因。观察点选取方法是用于传播信息源定位的,与其他观察点选取方法相比,对于相同的观察点数目。本方法具有更高的定位准确率其有益效果具体表现在以下两个方面:1.当网络中的观察点数量指定时,通过本专利技术所提出的观察点选取策略得到的观察点集,可以达到更高的定位准确率,提高了网络定位的性能。2.当应用中需要保证一个较高的定位准确率时(例如,定位准确率不能低于80%),那么本专利技术所提出的观察点选取策略需要的观察点数量明显少于现有方法,可以大大减少定位过程中的计算消耗。附图说明图1是覆盖集合示意图;图2是交叉操作的过程;图3是变异操作的过程。具体实施方式下面结合附图和具体实施方式对本专利技术的技术方案作进一步说明。本专利技术提出的基于R覆盖率优先的社交网络观察点选取方法,其目的是找到一组优化的观察点集合,这组观察点集合可以满足在固定观察点数量的情况下,其定位准确率更高;在保证定位准确率的情况下,需要的观察点更少,计算消耗也更小。该方法的核心思想,是将观察点集在网络中的R覆盖率作为判断观察点定位性能的依据(理论依据下面有证明过程),在指定观察点数量的情况下,选取网络中R覆盖率最大的一组节点作为观察点。进一步,为了得到网络中R覆盖率最大的一组节点,本专利技术提出了基于R覆盖率优先的观察点集选取算法。在已知网络拓扑结构和观察点数量的情况下,应用该算法,可以找到网络中一组R覆盖率最大的节点集合。该算法以遗传算法为基础,将网络中的节点映射为染色体中的基因,具体内容如下:用m表示种群规模,G表示遗传代数,t表示当前种群代数,G(t)表示第t代种群,size(G(t))表示第t代种群中染色体个数。算法:R覆盖率优先观察点集选取算法,输入:遗传代数G,种群规模m,输出:一组R覆盖率优先的观察点集,BEGIN1.当t=0时,初始化G(0);2.IFt<G;3.计算G(t)中染色体的适应度函数值;4.对G(t)进行复制操作,将父染色体存入G(t+1);5.IFsize(G(t))<m;6.执行交叉操作,将新生成的染色体存入G(t+1);7.执行变异操作,将新生成的染色体存入G(t+1);8.IFsize(G(t))≥m,则t+1,跳到步骤2;9.IFt≥G,则得到当前种群中适应度函数值最大的染色体,解码得到对应的观察点集合;END对于一个社交网络,应用R覆盖率优先观察点集选取算法得到的,即为指定观察点数量下的一组优化观察点集合。将这组观察点集合部署在网络中,记录每个观察点首次收到信息的信息传入时间和信息传入方向,就可以计算网络中的候选源点(非观察点节点)的似然估计值估计值最大的候选源点,即为估算的信息扩散源点。具体计算公式如下:其中,[d]k=tk+1-t1,[μs]k=μ·(|p(si,ok+1)|-|p(si,o1)|),p(u,v)表示u到v之间的最短路径,|p(u,v)|表示这条最短路径的长度;μ表示网络中信息从一个节点传播到另一个节点所需时间的均值,σ2表示方差。理论依据证明:为了得到一种有效的观察点选取方法,本专利技术从观察点部署位置与定位准确率之间的关系入手,通过分析观察点部署位置对特定信息源和任意信息源定位准确率想影响,得到一种基于R覆盖率优先的观察点选取策略。具体过程如下:对于网络G和观察点集合定义信息源点定位的准确率为:定义1(特定源点的定位准确率)。令信息扩散源点为si,独立进本文档来自技高网
...
一种基于R覆盖率优先的社交网络观察点选取方法

【技术保护点】
一种基于R覆盖率优先的社交网络观察点选取方法,其特征在于,用m表示种群规模,G表示遗传代数,t表示当前种群代数,G(t)表示第t代种群,size(Gt))表示第t代种群中染色体个数,算法.R覆盖率优先观察点集选取算法输入:遗传代数G,种群规模m输出:一组R覆盖率优先的观察点集包括以下步骤:步骤1:当t=0时,初始化G(0);步骤2:如果t<G步骤3:计算G(t)中染色体的适应度函数值:取一组节点的R覆盖率值为该组节点的适应度函数,记为f(xi)=|∪i=1NTi|]]>其中Ti满足ifxi=0,Ti=φifxi=1,Ti=Txi.]]>即对于染色体上的基因xi来说,当xi=0时,Ti为空;当xi=1时,以网络中节点i为根做R阶生成树,得到全部满足|E(s,xi)|≤r的节点的集合步骤4:对G(t)进行复制操作,将父染色体存入G(t+1);步骤5:如果size(G(t))<m;步骤6:执行交叉操作,将新生成的染色体存入G(t+1);步骤7:执行变异操作,将新生成的染色体存入G(t+1);步骤8:否则步骤9:t+1,跳到步骤2;步骤10:否则步骤11:得到当前种群中适应度函数值最大的染色体,解码得到对应的观察点集合。...

【技术特征摘要】
1.一种基于R覆盖率优先的社交网络观察点选取方法,其特征在于,用m表示种群规模,G表示遗传代数,t表示当前种群代数,G(t)表示第t代种群,size(G(t))表示第t代种群中染色体个数,算法:R覆盖率优先观察点集选取算法,输入:遗传代数G,种群规模m,输出:一组R覆盖率优先的观察点集,包括以下步骤:步骤1:当t=0时,初始化G(0);步骤2:如果t<G;步骤3:计算G(t)中染色体的适应度函数值:取一组节点的R覆盖率值为该组节点的适应度函数,记为其中Ti满足即对于染色体上的基因...

【专利技术属性】
技术研发人员:张锡哲张聿博张斌吕天阳
申请(专利权)人:东北大学
类型:发明
国别省市:辽宁;21

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1