一种动态网络PageRank值的实时跟踪方法技术

技术编号：21612114 阅读：49 留言：0更新日期：2019-07-13 20:37

本发明专利技术公开了一种动态网络PageRank值的实时跟踪方法。针对随机游走会再次访问网络中的节点和边的情况，本发明专利技术引入一种重访问概率模型。在更新PageRank值时，首先依据重访问概率模型计算出需要调整的随机游走路径的精确数量，然后从保存的历史路径中删除并重新模拟相应数量的随机游走路径，得到更新后的PageRank值。每次网络中有新的边加入或者移除时，就对现有的PageRank值进行实时的增量更新，从而达到动态网络PageRank值的跟踪目的。本发明专利技术提出的方法适用于大规模的动态网络，显著提升了动态网络PageRank值的跟踪效率，并且在长期的跟踪过程中不会累积误差。

A Real-time Tracking Method of PageRank Value in Dynamic Network

全部详细技术资料下载

【技术实现步骤摘要】
一种动态网络PageRank值的实时跟踪方法
本专利技术涉及网络科学技术中节点影响力计算领域，适用于大规模动态网络的PageRank值的实时跟踪。
技术介绍
网络是对象集合以及对象间关系的一种强有力的表达方式。随着互联网，万维网，以及社交网络的快速发展，对于网络数据的研究和分析也变得越来越重要。其中有关中心性的概念，特别是PageRank中心性度量在网络研究领域也受到很大的关注。1998年，谷歌的搜索引擎首次使用PageRank算法对万维网上的网页进行排序，从而给用户提供更好的搜索结果。PageRank算法仅从万维网的拓扑网络结构来衡量页面的受欢迎程度,而不考虑页面的具体内容。由于PageRank算法考虑了从重要节点的获得的中心性会因为共享而被稀释的情况，因此相比于原有的特征向量中心性和Katz中心性能够更加合理地度量节点的中心性，从而被广泛地应用于社会学、物理学、生物学和计算机科学等领域。然而现实中的网络往往是动态变化的。例如在万维网中，每秒钟都有超过60万个新网页产生。现实网络的另外一个特点是，它们的规模都非常庞大。根据Facebook公司在2017年公布的数据，Facebook的日活跃用户达到了13.2亿，每天发送的消息更是多达几百亿条。在这样一种情境下，传统的静态网络PageRank算法无法满足对网络PageRank值的实时跟踪。因此需要一类能够通过增量迭代，实时跟踪网络中节点的PageRank值的算法。尽管目前的算法能够增量的计算动态网络的PageRank近似值，却依旧存在以下两点不足。首先，这些算法在增量计算PageRank值时都会累积误差，而...

【技术保护点】
1.一种动态网络PageRank值的实时跟踪方法，其特征在于，包括以下步骤：步骤1、对于初始网络，以网络中的每个节点为起始点，以重置概率∈模拟R条随机游走，保存所有得到的随机游走路径，并且对于网络中的每个节点u，保存状态值S(u)和V(u)；步骤2、有新的边e(u，w)加入网络或者从网络中移除，依据重访问概率模型计算出需要调整的随机游走路径数量M；M的值的计算方式为：当添加边e(u,w)时,需要调整的随机游走路径数量M＝|S(u)|/(d(u)+1‑d(u)*R(u))，其中d(u)为节点u的出度；当删除边e(u,w)时，需要调整的随机游走路径数量M为经过边e(u,w)的随机游走路径数量；步骤3、从与网络变化有关的随机游走路径中随机选取中M条进行调整；随机游走路径的调整方式为：当添加边e(u,w)时，对于每条经过节点u的随机游走路径，以M/|S(u)|的概率从路径第一次经过节点u的位置开始，使其经过边e(u,w)重新模拟随机游走；当删除边e(u,w)时，对于所有经过边e(u,w)的随机游走路径，从路径第一次经过节点u的位置开始重新模拟随机游走；步骤4、如果同时有节点新加入或者被移除，则...

【技术特征摘要】
1.一种动态网络PageRank值的实时跟踪方法，其特征在于，包括以下步骤：步骤1、对于初始网络，以网络中的每个节点为起始点，以重置概率∈模拟R条随机游走，保存所有得到的随机游走路径，并且对于网络中的每个节点u，保存状态值S(u)和V(u)；步骤2、有新的边e(u，w)加入网络或者从网络中移除，依据重访问概率模型计算出需要调整的随机游走路径数量M；M的值的计算方式为：当添加边e(u,w)时,需要调整的随机游走路径数量M＝|S(u)|/(d(u)+1-d(u)*R(u))，其中d(u)为节点u的出度；当删除边e(u,w)时，需要调整的随机游走路径数量M为经过边e(u,w)的随机游走路径数量；步骤3、从与网络变化有关的随机游走路径中随机选取中M条进行调整；随机游走路径的调整方式为：当添加边e(u,w)时，对于每条经过节点u的随机游走路径，以M/|S(u)|的概率从路径第一次经过节点u的位置开始，使其经过边e(u,w)重新模拟随机游走；当删除边e(u,w)时，对于所有经过边e(u,w)的随机游走路径，从路径第一次经过节点u的位置开始重新模拟随机游走；步骤4、如果同时有节点新加入或者被移除，则进行相应的处理，具体处理方式为：如果有节点u新加入网络中,则在上述路径调整的工作外，以节点u为起始点模拟R条随机游走，并将产生的路径保存；如果有节点u被从网络中删除，则从哈希表中删除所有起始点为u的随机游走路径；步骤5、通过归一化所有节点的V(u)组成的向量，得到更新后的Page...

【专利技术属性】
技术研发人员：胡瑞敏，詹泽行，潘翔，李登实，胡文怡，王晓晨，
申请(专利权)人：武汉大学，
类型：发明
国别省市：湖北,42

全部详细技术资料下载我是这个专利的主人