一种优化的新型稠密子图提取方法、系统、装置及介质制造方法及图纸

技术编号:38487406 阅读:17 留言:0更新日期:2023-08-15 17:02
本发明专利技术公开了一种优化的新型稠密子图提取方法、系统、装置及介质,其中方法包括:获取原图中所有三角形,计算每个三角形的权重和顶点权重;初始化参数λ,根据计算的权重构造有向流图,将有向流图改造成相应的二部图;应用二部图的最大流算法求解最大流,进行二分搜索参数λ,并更新有向流图;根据搜索出的顶点集求解导出子图,作为目标稠密子图。本发明专利技术将原有向流图改造成二部图后,使用二部图的preflow

【技术实现步骤摘要】
一种优化的新型稠密子图提取方法、系统、装置及介质


[0001]本专利技术涉及图网络数据挖掘领域,尤其涉及一种优化的新型稠密子图提取方法、系统、装置及介质。

技术介绍

[0002]图作为一种高级数据结构,可以表征对象间复杂的多对多关系,应用十分广泛。从复杂的图数据中提取出稠密子图,是图挖掘中一个基础和重要的研究方向,具有很高的实际应用价值。例如,在社交网络中,稠密子图通常代表着有紧密社交关系的用户群体,可以用来进行社区检测;在蛋白质网络中,稠密子图对应着功能联系密切的蛋白质,可以用来挖掘蛋白质复合物;在论文引用网络中,稠密子图代表着大量共同发表的论文、著作的研究者群体,可以用来挖掘具有相同研究方向的团体;在电商用户评论行为二部曲中,稠密子图对应着异常行为类似的用户,可以用来进行水军团伙检测。总的来说,稠密子图抽取有助于分析和理解图数据,研究图的拓扑结构和功能模块,并与社区发现、生物信息学、自然语言处理等现实问题联系紧密,具有很高的理论意义和实际研究价值,吸引了众多学者进行大量的研究。
[0003]稠密子图提取方法的考量主要有两方面,第一是提取出子图的稠密程度,其评价指标主要有边密度δ2和三角密度δ4。给定一个无向图G(V,E),图G的边密度定义是图G的边数目与G顶点构成完全图时边数目的比值,即为图G的三角密度定义是图G的三角形数目与G顶点构成完全图时所含三角形数目的比值,即为其中Δ
G
是图G中存在的三角形集合。δ2和δ4取值位于0到1之间,值越高则图的稠密度越高,因此目标是提取的子图拥有较大的边密度δ2和三角密度δ4。第二是方法提取子图的复杂性,我们期望算法的时间复杂性尽可能低,从而能够实际应用在大型图上。
[0004]现阶段平衡这两个方面却是目前存在的挑战,例如Densest subgraph、Triangle densest subgraph等方法提取出的子图不够稠密,MWED、MWTD方法提取的子图稠密度较高,然而其复杂性很高。当图的顶点数边数较小时运行时间是没问题的,在大型图上(如顶点数为104~105时),运行时间将难以承受,难以在实际场景下应用。寻找一种复杂性低且提取效果好的稠密子图提取方法是本领域亟待解决的问题。

技术实现思路

[0005]为至少一定程度上解决现有技术中存在的技术问题之一,本专利技术的目的在于提供一种优化的新型稠密子图提取方法、系统、装置及介质。
[0006]本专利技术所采用的技术方案是:
[0007]一种优化的新型稠密子图提取方法,包括以下步骤:
[0008]获取原图中所有三角形,计算每个三角形的权重和顶点权重;
[0009]初始化参数λ,根据计算的权重构造有向流图,将有向流图改造成相应的二部图;
[0010]应用二部图的最大流算法求解最大流,进行二分搜索参数λ,并更新有向流图;
[0011]根据搜索出的顶点集求解导出子图,作为目标稠密子图。
[0012]进一步地,所述三角形的权重为三角形从属的4团的个数,顶点的权重值为该顶点从属的三角形权重值的总和。
[0013]进一步地,所述初始化参数λ,根据计算的权重构造有向流图,包括:
[0014]设原图为G(V,E);其中V为图G中的顶点集合,E为图G的边集合;
[0015]初始化顶点集V

={s}∪Z∪V∪{t},即原图中的三角形集、顶点集、源点s以及汇点t;其中,Z为与原图中三角形集合对应的顶点集,集合Z中顶点和原图中三角形集合中三角形存在一一对应的关系;
[0016]对于每个三角形t
p
∈Z,存在一有向边s

t
p
,权重为三角形t
p
的权重W(t
p
);其中,

代表有向边的方向,起点是s,终点是t
p

[0017]对于三角形中顶点v∈t
p
,存在一有向边t
p

v,权重为+∞;
[0018]对于原图中每个顶点v∈V,存在一有向边v

t,权重为λ,λ在后续二分搜索会被不断更新。
[0019]进一步地,所述将有向流图改造成相应的二部图,包括:
[0020]根据原图中三角形数目t和顶点数目n,将有向流图改造成相应的二部图;
[0021]当t≥n时,向顶点集V

中加入节点s1,并添加一有向边s1→
s,权重为
[0022]当t<n时,原有向流图已是一个二部图,无需再添加新的节点和边。
[0023]进一步地,所述应用二部图的最大流算法求解最大流,进行二分搜索参数λ,并更新有向流图,包括:
[0024]A1、初始设置搜索边界lo=0,当hi

lo≥condition时,进行循环二分搜索;其中n是原图G的节点数;
[0025]A2、设置并更新有向流图中有向边v

t的权重;
[0026]A3、应用二部图的preflow

push算法,求解s/s1→
t的最小割;其中preflow

push算法中增加了bipush操作,以求解源点s(t<n时)或s1(t≥n时)到汇点t的最大流;其中,s为t≥n时的源点,s1为t<n时的源点;
[0027]A4、当s所在的割集S恰为{s}或s1所在的割集S为{s,s1}时,设置上边界hi=λ,否则设置下边界lo=λ;
[0028]A5、更新子图顶点集subV为割集S和原图顶点集V的交集;
[0029]A6、重复步骤A2

A5,直到hi

lo<condition不满足循环条件时退出循环。
[0030]进一步地,所述根据搜索出的顶点集求解导出子图,作为提取出的目标子图,包括:
[0031]根据搜索出的顶点集subV,求顶点集subV在原图G中导出的子图subG,作为目标稠密子图。
[0032]本专利技术所采用的另一技术方案是:
[0033]一种优化的新型稠密子图提取系统,包括:
[0034]权重计算模块,用于获取原图中所有三角形,计算每个三角形的权重和顶点权重;
[0035]二部图构建模块,用于初始化参数λ,根据计算的权重构造有向流图,将有向流图改造成相应的二部图;
[0036]参数更新模块,用于应用二部图的最大流算法求解最大流,进行二分搜索参数λ,并更新有向流图;
[0037]子图导出模块,用于根据搜索出的顶点集求解导出子图,作为目标稠密子图。
[0038]进一步地,所述三角形的权重为三角形从属的4团的个数,顶点的权重值为该顶点从属的三角形权重值的总和。
[0039]本专利技术所采用的另一技术方案是:
[0040]一种优化的新型稠密子图提取装置,包括:
[0041]至少一个处理本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种优化的新型稠密子图提取方法,其特征在于,包括以下步骤:获取原图中所有三角形,计算每个三角形的权重和顶点权重;初始化参数λ,根据计算的权重构造有向流图,将有向流图改造成相应的二部图;应用二部图的最大流算法求解最大流,进行二分搜索参数λ,并更新有向流图;根据搜索出的顶点集求解导出子图,作为目标稠密子图。2.根据权利要求1所述的一种优化的新型稠密子图提取方法,其特征在于,所述三角形的权重为三角形从属的4团的个数,顶点的权重值为该顶点从属的三角形权重值的总和。3.根据权利要求1所述的一种优化的新型稠密子图提取方法,其特征在于,所述初始化参数λ,根据计算的权重构造有向流图,包括:设原图为G(V,E);其中V为图G中的顶点集合,E为图G的边集合;初始化顶点集V

={s}∪Z∪V∪{t},即原图中的三角形集、顶点集、源点s以及汇点t;其中,Z为与原图中三角形集合对应的顶点集;对于每个三角形t
p
∈Z,存在一有向边s

t
p
,权重为三角形t
p
的权重W(t
p
);对于三角形中顶点v∈t
p
,存在一有向边t
p

v,权重为+∞;对于原图中每个顶点v∈V,存在一有向边v

t,权重为λ。4.根据权利要求3所述的一种优化的新型稠密子图提取方法,其特征在于,所述将有向流图改造成相应的二部图,包括:根据原图中三角形数目t和顶点数目n,将有向流图改造成相应的二部图;当t≥n时,向顶点集V

中加入节点s1,并添加一有向边s1→
s,权重为当t<n时,原有向流图已是一个二部图,无需再添加新的节点和边。5.根据权利要求1所述的一种优化的新型稠密子图提取方法,其特征在于,所述应用二部图的最大流算法求解最大流,进行二分搜索参数λ,并更新有向流图,包括:A1、初始设置搜索边界lo=0,当hi

lo≥condition时,进行循环二分搜索;其中n是原图G的节点数;A...

【专利技术属性】
技术研发人员:王钢王家兵
申请(专利权)人:华南理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1