一种基于二阶局部社团和节点度信息的预测网络未知连边的方法技术

技术编号:14445336 阅读:92 留言:0更新日期:2017-01-15 11:10
一种基于二阶局部社团和节点度信息的预测网络未知连边的方法,构建网络模型,获取一对未连接节点的一阶共同邻居节点和二阶共同邻居节点,这些节点及其之间的连边构成二阶局部社团;记录该社团的节点和连边总数,同时记录每个节点在整体网络中的度和在该社团中的度;计算该社团的度系数、边聚类系数、简谐平均距离和二阶局部社团系数;计算节点对之间的相似性分数指标;遍历整个网络,对任意两个未连接节点,计算相应的节点对之间的相似性分数指标,将所有的未连接节点对之间的相似性分数按降序排列,取前m个指标对应的节点对为预测连边。本发明专利技术考虑了二阶局部社团和节点度信息,充分利用了网络局部结构信息,预测效果好,准确率高。

【技术实现步骤摘要】

本专利技术涉及网络与链路预测领域,特别是指一种基于二阶局部社团和节点度信息的预测网络未知连边的方法
技术介绍
随着科学飞速发展,人类进入了网络时代。各类以互联网为载体的技术与产业也应运而生,极大地改善了人们的学习与生活。我们生活在形形色色的网络中。与人交往就会出现关系网,出行则会有交通网络。自然科学的快速发展,使得我们对世界的认识越来越多。人类研究的网络越来越庞大且复杂,在如今大数据的背景下,随着需要处理的单个数据规模和数据总规模的增大,数据的平均质量却是在下降,而数据的不完整性造成的影响变得更加突出。这时就可使用链路预测来预测或重构接近真实且较完整的数据。链路预测技术可应用于任何可以将实体及其间接关系抽象成网络形式的系统中,如在线社交网络、电子商务网站等,从而产生可观的商业价值。因此,链路预测的研究显得十分有必要。网络的链路预测包括对未知连边的预测,还包括对未来的连边预测。出于某种原因网络的信息会存在少量丢失的情况,利用网络中已知的信息去分析,最终还原缺失信息,这种就属于前者。考虑到网络的变化,节点及节点间的联系均存在变化,根据现有信息对网络中未来信息(现在不存在,但未来可能会存在)的预测则是后者。链路预测简单的说就是通过已知的节点信息去预测其他还未直接相连或未知状态的节点间产生连接的概率。近些年来,对于链路预测的研究主要是基于节点相似性,分别基于节点与路径对真实网络数据进行测试,如:AA指标,CN指标。周涛等在此基础上提出两种新指标:资源分配指标和局部路径指标。刘伟平和吕琳媛提出了两种局部随机游走指标。有限步的随机游走有时会比全局收敛后的预测精度要高,而最优的游走步数受到网络平均距离的强烈影响。传统上人们在解决问题时,往往考虑一阶共同邻居节点并对二阶共同邻居节点对整个网络的链路预测的重要作用考虑的不够多,本专利技术提出了一种基于二阶局部社团和节点度信息的预测网络未知连边的方法,考虑了种子节点的共同邻居节点之间的联系,同时还考虑到了边聚类系数、平均最短路径和局部社团内部节点度信息的影响。充分利用网络中的局部信息是提高链路预测算法准确性的一种新的有效手段。本专利技术针对相似性算法进行了扩展,种子节点的社团信息由原来的一阶邻居节点扩展到二阶邻居节点。
技术实现思路
为了克服已有链路预测算法准确率低,信息利用率低的不足,本专利技术提出一种准确率高、预测效果良好的基于二阶局部社团和节点度信息的链路预测方法。本专利技术解决其技术问题所采用的技术具体步骤是:一种基于二阶局部社团和节点度信息的预测网络未知连边的方法,包括如下步骤:步骤一:在保证整个网络保持连通的条件下建立网络模型G(V,E),其中V为网络中的节点,E为网络中的边;步骤二:选取网络中一对没有连边的节点i和j作为两个种子节点,提取所有i和j的一阶共同邻居节点和二阶共同邻居节点以及这些节点之间的连边,构成二阶局部社团,其中i和j之间长度为2的路径的中间的一个节点为一阶共同邻居,长度为3的路径的中间2个节点为二阶共同邻居;步骤三:遍历整个二阶局部社团,节点总数记为CNij,总连边数量记为LCLij,每个节点在整体网络中的度记为kg,每个节点在二阶局部社团中的度记为γg,其中g表示二阶局部社团中的一个节点;步骤四:计算二阶局部社团的度系数:步骤五:计算二阶局部社团的边聚类系数:pij=LCLij/CNij(CNij-1)2;]]>步骤六:计算二阶局部社团的简谐平均距离:其中上式中,g和h表示二阶局部社团中任意两个节点,dgh为g和h两个节点之间的路径长度;步骤七:计算二阶局部社团系数:TLCCij=pij/Lij‾;]]>步骤八:计算节点i,j之间的相似性分数指标:LCRAij=λij*TLCCij;步骤九:遍历整个网络,对任意两个未连接节点,重复步骤二至步骤八,计算相应的LCRA指标作为节点对之间的相似性分数指标,相似性分数越高,相应的节点对之间出现连边的可能性越大,将所有的未连接节点对之间的相似性分数按降序排列,取前m个指标对应的节点对为预测连边,m≦M,M为整个网络中所有未连接节点对的总数。本专利技术的技术构思为:网络的二阶邻居节点对整个网络的链路预测有着不可忽视的影响,本专利技术在考虑二阶局部社团的简谐平均距离和边聚类系数时,同时考虑了局部社团节点度在整体网络度中所占的比例,充分利用网络中的局部信息,在具有局部特性结构的网络中有很好的预测效果,可以提高链路预测算法准确性。本专利技术的有益效果为:本专利技术将局部社团从一阶邻居扩展到二阶邻居,同时考虑了局部社团节点度在整体网络度中所占的比例,充分利用了已知的网络节点以及网络局部结构信息,算法的精确度高。附图说明图1为二阶局部社团描述图,黑色圆点为种子节点,白色圆点为共同邻居节点,虚线为邻居节点之间存在的连边,实线为种子节点与共同邻居之间的连边,白色圆点和虚线构成了二阶局部社团。具体实施方式下面结合附图对本专利技术做进一步说明。参照图1,一种基于二阶局部社团和节点度信息的预测网络未知连边的方法,包括以下步骤:步骤一:在保证整个网络保持连通的条件下建立网络模型G(V,E),其中V为网络中的节点,E为网络中的边;步骤二:选取网络中一对没有连边的节点i和j作为两个种子节点,即图1中黑色圆点,提取所有i和j的一阶共同邻居节点和二阶共同邻居节点以及这些节点之间的连边,如图1中的白色圆点及其连边,构成二阶局部社团,其中i和j之间长度为2的路径的中间的一个节点为一阶共同邻居,长度为3的路径的中间2个节点为二阶共同邻居;步骤三:遍历整个二阶局部社团,节点总数记为CNij,总连边数量记为LCLij,每个节点在整体网络中的度记为kg,每个节点在二阶局部社团中的度记为γg,其中g表示二阶局部社团中的一个节点;步骤四:计算二阶局部社团的度系数:步骤五:计算二阶局部社团的边聚类系数:pij=LCLij/CNij(CNij-1)2;]]>步骤六:计算二阶局部社团的简谐平均距离:其中上式中,g和h表示二阶局部社团中任意两个节点,dgh为g和h两个节点之间的路径长度;步骤七:计算二阶局部社团系数:TLCCij=pij/Lij‾;]]>步骤八:计算节点i,j之间的相似性分数指标:LCRAij=λij*TLCCij;步骤九:遍历整个网络,对任意两个未连接节点,重复步骤二至步骤八,计算相应的LCRA指标作为节点对之间的相似性分数指标,相似性分数越高,相应的节点对之间出现连边的可能性越大,将所有的未连接节点对之间的相似性分数按降序排列,取前m个指标对应的节点对为预测连边,m≦M,M为整个网络中所有未连接节点对的总数。如上所述,本专利实施的具体实现步骤使本专利技术更加清晰。在本专利技术的精神和权利要求的保护范围内,对本专利技术作出的任何修改和改变,都落入本专利技术的保护范围。本文档来自技高网
...
一种基于二阶局部社团和节点度信息的预测网络未知连边的方法

【技术保护点】
一种基于二阶局部社团和节点度信息的预测网络未知连边的方法,其特征在于:包括以下步骤:步骤一:在保证整个网络保持连通的条件下建立网络模型G(V,E),其中V为网络中的节点,E为网络中的边;步骤二:选取网络中一对没有连边的节点i和j作为两个种子节点,提取所有i和j的一阶共同邻居节点和二阶共同邻居节点以及这些节点之间的连边,构成二阶局部社团,其中i和j之间长度为2的路径的中间的一个节点为一阶共同邻居,长度为3的路径的中间2个节点为二阶共同邻居;步骤三:遍历整个二阶局部社团,节点总数记为CNij,总连边数量记为LCLij,每个节点在整体网络中的度记为kg,每个节点在二阶局部社团中的度记为γg,其中g表示二阶局部社团中的一个节点;步骤四:计算二阶局部社团的度系数:步骤五:计算二阶局部社团的边聚类系数:步骤六:计算二阶局部社团的简谐平均距离:其中上式中,g和h表示二阶局部社团中任意两个节点,dgh为g和h两个节点之间的路径长度;步骤七:计算二阶局部社团系数:步骤八:计算节点i,j之间的相似性分数指标:LCRAij=λij*TLCCij;步骤九:遍历整个网络,对任意两个未连接节点,重复步骤二至步骤八,计算相应的LCRA指标作为节点对之间的相似性分数指标,相似性分数越高,相应的节点对之间出现连边的可能性越大,将所有的未连接节点对之间的相似性分数按降序排列,取前m个指标对应的节点对为预测连边,m≦M,M为整个网络中所有未连接节点对的总数。...

【技术特征摘要】
1.一种基于二阶局部社团和节点度信息的预测网络未知连边的方法,其特征在于:包括以下步骤:步骤一:在保证整个网络保持连通的条件下建立网络模型G(V,E),其中V为网络中的节点,E为网络中的边;步骤二:选取网络中一对没有连边的节点i和j作为两个种子节点,提取所有i和j的一阶共同邻居节点和二阶共同邻居节点以及这些节点之间的连边,构成二阶局部社团,其中i和j之间长度为2的路径的中间的一个节点为一阶共同邻居,长度为3的路径的中间2个节点为二阶共同邻居;步骤三:遍历整个二阶局部社团,节点总数记为CNij,总连边数量记为LCLij,每个节点在整体网络中的度记为kg,每个节点在二阶局部社团中的度记为γg,其中g表示二阶局部社团中的...

【专利技术属性】
技术研发人员:杨旭华程之杨旭华
申请(专利权)人:浙江工业大学
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1