一种基于节点热度采样的图流三角形计数方法及装置制造方法及图纸

技术编号:33206080 阅读:16 留言:0更新日期:2022-04-24 00:52
本发明专利技术公开一种基于节点热度采样的图流三角形计数方法及装置,其方法包括:步骤S0:初始化计数单元,将计数单元中全局三角形数目与局部三角形数目均设为0,并清空采样集;步骤S1:将边流输入计数单元,采样单元从计数单元获取边流并进行采样,边流中的边均为无向边;步骤S2:将所述热度节点型蓄水池与所述非热度节点型蓄水池设置于采样集中;步骤S3:计数单元根据得到的当前无向边的两个顶点的采样结果,评估当前时刻的全局三角形数目和局部三角形数目。形数目。形数目。

【技术实现步骤摘要】
一种基于节点热度采样的图流三角形计数方法及装置


[0001]本专利技术涉及数据处理
,具体而言,涉及一种基于节点热度采样的图流三角形计数方法及装置。

技术介绍

[0002]三角形计数是图数据分析的基础之一,具有广泛的应用场景。例如,垃圾邮件检测、推荐系统、社团发现、社交网络等。但由于图流的规模巨大及计算机内存空间的有限性,将图流的边全部存储在内存中,再进行准确地计算三角形数目是不可取的;而将图流数据存储在外部存储器(硬盘、光盘等)中,其与内存进行数据传输时,会极大的影响处理效率,无法满足实时反馈的需求。因此,目前大多技术采取采样的方式,近似的计算图流中的三角形数目,经过观察可以知道热度节点(节点度数大于一定阈值),从而更易形成三角形。
[0003]申请号为201910233454.6的中国专利提出了一种“关系网络中实体间连接关系特征的获取方法及系统”,同时引入了基础蓄水池和渐增蓄水池,在利用蓄水池抽样得到孤立边时,能够捕获与这些孤立边具有连接关系的边,并得到实际网络实体之间的连接关系特征。这种方法以是否与基础蓄水池形成三角形作为能够进去渐增蓄水池的一个重要因素,因此,在其蓄水池/基础蓄水池空间一定的情况下,当图流规模过大时孤立边采样率较低,影响三角形数目评估的准确性。
[0004]而申请号为201810499136.X的中国专利提供了“一种基于随机抽样的数据图流中的三角形计数方法及装置”,其对数据流图中的三角形计数评估采用了三个模块单元,即为抽样单元、子图统计单元和原图估算单元。具体来讲,首先,是对接收的原始数据流图中的边进行抽样得到子图,并计算存留比;然后,对抽样获得的子图中的三角形的数量进行统计;最后,再根据统计得到的子图中三角形的数量及所述的存留比,估算接收到的原始数据流图中的三角形数量。但是,这种方法仅支持全局三角形计数评估,不能对局部三角形数量进行评估,且其抽样方法在抽样空间一定的情况下,采样率也有可能受到图流规模的影响而降低,从而影响三角形评估的准确性。

技术实现思路

[0005]为了解决上述问题,本专利技术提供一种基于节点热度采样的图流三角形计数方法及装置,通过增加热度节点特征的分析,将图流中边的节点划分为热度节点与非热度节点,充分利用热度节点更易形成三角形的特征,在抽样空间一定的情况下为热度节点设置更高的采样率,用以发现更多的三角形数目,从而提高三角形评估结果的准确性。同时,本专利技术不但支持全局三角形计数评估,还能够对局部三角形数量进行评估。
[0006]为达到上述目的,本专利技术提供了一种基于节点热度采样的图流三角形计数方法,其包括以下步骤:
[0007]步骤S0:初始化计数单元,将计数单元中全局三角形数目与局部三角形数目均设为0,并清空采样集;
[0008]步骤S1:将边流输入计数单元,采样单元从计数单元获取边流并进行采样,所述边流中的边均为无向边,其中,采样单元进行采样的过程具体为:
[0009]步骤S101:当一无向边e1到达采样单元时,采样单元判断无向边e1的两个顶点u和v是否为热度节点,当判断u和v的任一顶点为热度节点时,进入步骤S102;当判断u和v的任一顶点为非热度节点时,进入步骤S104;
[0010]步骤S102:为热度节点赋以采样概率q,并将热度节点存储至热度节点型蓄水池中;
[0011]步骤S103:根据热度节点型蓄水池中所有热度节点的节点度数的最小值更新热度节点阈值,以用于下一条无向边的判断;
[0012]步骤S104:为非热度节点赋以采样概率p,并将非热度节点存储至非热度节点型蓄水池中,其中,q大于p;
[0013]步骤S105:重复步骤S101~S104用以对下一条达到的无向边的顶点进行判断;
[0014]步骤S2:将所述热度节点型蓄水池与所述非热度节点型蓄水池设置于采样集中;
[0015]步骤S3:计数单元根据步骤S101~步骤S105得到的当前无向边的两个顶点的采样结果,评估当前时刻的全局三角形数目和局部三角形数目。
[0016]在本专利技术一实施例中,其中,步骤S101中采样单元判断u和v的任一顶点是否为热度节点具体为:采样单元中预设热度节点阈值,在获取顶点u和v时获取对应的节点度数,并将节点度数与热度节点阈值比较,当节点度数大于热度节点阈值时,判断对应顶点为热度节点,否则为非热度节点。
[0017]在本专利技术一实施例中,其中,步骤S3的具体过程包括:
[0018]步骤S301:从采样集中获取无向边e1的两个顶点u和v的共同邻居顶点的集合;
[0019]步骤S302:从共同邻居顶点的集合中获取任一共同邻居顶点c,并将顶点u、v和共同邻居顶点c作为三角形的三个顶点;
[0020]步骤S303:评估无向边e1与共同邻居顶点c组成局部三角形的数目,具体为:
[0021]如果顶点u、v与共同邻居顶点c均为热度节点,则无向边e1与共同邻居顶点c组成局部三角形的数目τ=1/q2;
[0022]如果顶点u和共同邻居顶点c的组合与顶点v和共同邻居顶点c的组合只有一个组合的顶点全部为热度节点,则无向边e1与共同邻居顶点c组成局部三角形的数目τ=1/(p*q);
[0023]如果以上两种情况均不存在,则无向边e1与共同邻居顶点c组成局部三角形的数目τ=1/p2;
[0024]步骤S304:将得到的局部三角形的数目τ与上一时刻局部三角形数目相加得到当前时刻的局部三角形数目;
[0025]步骤S305:遍历步骤S301中共同邻居顶点的集合中所有共同邻居顶点,并重复步骤S302~S304,得到无向边e1的局部三角形数目为v


[0026]步骤S306:将从步骤S303中得到的局部三角形的数目τ与上一时刻全局三角形数目相加得到当前时刻的全局三角形数目;
[0027]步骤S307:遍历步骤S301中共同邻居顶点的集合中所有共同邻居顶点,并重复步骤S302~S303及S306,得到无向边e1到来时的全局三角形数目;
[0028]步骤S308:重复步骤S301~S307对边流陆续的多条无向边e2、e3、
……
e
i
进行评估,得到局部三角形数目的集合{v

,v

,v

……
v

}与全局三角形数目Δ,其中,v

为无向边e2的局部三角形数目,v

为无向边e3的局部三角形数目,v

为无向边e
i
的局部三角形数目。
[0029]为达到上述目的,本专利技术提供了一种基于节点热度采样的图流三角形计数装置,其包括:
[0030]一采样单元,用于对输入的边流进行采样以进行热度节点特征判断;
[0031]一计算单元,作为所述边流的输入端并与所述采样单元连接,用于根据所述边流输入的当前边及其采样结果本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于节点热度采样的图流三角形计数方法,其特征在于,包括以下步骤:步骤S0:初始化计数单元,将计数单元中全局三角形数目与局部三角形数目均设为0,并清空采样集;步骤S1:将边流输入计数单元,采样单元从计数单元获取边流并进行采样,所述边流中的边均为无向边,其中,采样单元进行采样的过程具体为:步骤S101:当一无向边e1到达采样单元时,采样单元判断无向边e1的两个顶点u和v是否为热度节点,当判断u和v的任一顶点为热度节点时,进入步骤S102;当判断u和v的任一顶点为非热度节点时,进入步骤S104;步骤S102:为热度节点赋以采样概率q,并将热度节点存储至热度节点型蓄水池中;步骤S103:根据热度节点型蓄水池中所有热度节点的节点度数的最小值更新热度节点阈值,以用于下一条无向边的判断;步骤S104:为非热度节点赋以采样概率p,并将非热度节点存储至非热度节点型蓄水池中,其中,q大于p;步骤S105:重复步骤S101~S104用以对下一条达到的无向边的顶点进行判断;步骤S2:将所述热度节点型蓄水池与所述非热度节点型蓄水池设置于采样集中;步骤S3:计数单元根据步骤S101~步骤S105得到的当前无向边的两个顶点的采样结果,评估当前时刻的全局三角形数目和局部三角形数目。2.根据权利要求1所述的基于节点热度采样的图流三角形计数方法,其特征在于,步骤S101中采样单元判断u和v的任一顶点是否为热度节点具体为:采样单元中预设热度节点阈值,在获取顶点u和v时获取对应的节点度数,并将节点度数与热度节点阈值比较,当节点度数大于热度节点阈值时,判断对应顶点为热度节点,否则为非热度节点。3.根据权利要求2所述的基于节点热度采样的图流三角形计数方法,其特征在于,步骤S3的具体过程包括:步骤S301:从采样集中获取无向边e1的两个顶点u和v的共同邻居顶点的集合;步骤S302:从共同邻居顶点的集合中获取任一共同邻居顶点c,并将顶点u、v和共同邻居顶点c作为三角形的三个顶点;步骤S303:评估无向边e1与共同邻居顶点c组成局部三角形的数目,具体为:如果顶点u、v与共同邻居顶点c均为热度节点,则无向边e1与共同邻居顶点c组成局部三角形的数...

【专利技术属性】
技术研发人员:马丽娜朱亚涛吴冬冬
申请(专利权)人:北京睿芯高通量科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1