当前位置: 首页 > 专利查询>山东大学专利>正文

一种基于k-truss和图核的图分类方法及其用途技术

技术编号:34373641 阅读:16 留言:0更新日期:2022-07-31 12:23
本发明专利技术公开了一种基于k

A graph classification method based on k-truss and graph kernel and its application

【技术实现步骤摘要】
k

truss;如果此时G不为空,k增加1,重复步骤(4)

(6);如果此时G为空,分解过程结束。
[0018]进一步地,分解过程结束后获得的嵌套子图的层次结构表示如下:
[0019][0020]其中,ω
*
(G)表示为图中所有边truss值的最大值,用于衡量图的密集程度。
[0021]进一步地,所述步骤三的具体方法如下:
[0022](1)两图之间的图核函数定义为:
[0023]k(G,G

)=<φ(G),φ(G

)>;
[0024](2)选择一种图核作为基础图核,用于图分类任务;
[0025](3)将基础图核的核函数作用于步骤二得到的嵌套子图的层次结构,将单一的核函数扩展为一组核函数的和,生成一种truss变体形式的图核,基础图核k的truss变体形式k
t
定义为:
[0026][0027]其中,和分别表示图G和图G

的2

truss,3

truss,...,子图,表示两个图各自图中所有边truss值的最大值(ω
*
(G)值)中的较小值;
[0028](4)采用这种truss变体形式的图核函数获得用于描述图数据中每两个图之间相似性的核矩阵,并利用图类别标签信息,训练C

支持向量机分类器。
[0029]进一步地,所述的图核选自R

卷积图核、相交图核、分配图核中的任一种。
[0030]本专利技术还提供一种所述基于k

truss和图核的图分类方法的用途,该方法可以用于生物酶的分类。
[0031]与现有技术相比,本专利技术具有如下有益效果:
[0032](1)本专利技术通过k

truss分解构建一个嵌套子图的层次结构,这允许在多个不同尺度上比较图。
[0033](2)本专利技术提出了一种新的图核改进方法,增强了基础图核对复杂子结构的表达能力,特别的,该方法生成的truss变体形式的图核函数提高了基础图核在图分类任务上的性能。
附图说明
[0034]图1为本专利技术实施例所公开的一种基于k

truss和图核的图分类方法流程示意图;
[0035]图2为图G的k

truss分解阶段的流程示意图;
[0036]图3为计算truss变体形式的图核函数值的具体流程示意图。
[0037]图4为给定图G和G

,基础图核Weisfeiler

Lehman子树核(WL)在迭代次数h=1 时的计算过程;
[0038]图5为酶的三维结构建模为图的示意图;
[0039]图6为图G中所有的k

truss子图的分解过程示意图。
具体实施方式
[0040]为了便于理解本专利技术,下面结合附图和具体实施例,对本专利技术进行更详细的说明。
附图中给出了本专利技术的较佳的实施例。但是,本专利技术可以以许多不同的形式来实现,并不限于本说明书所描述的实施例。相反地,提供这些实施例的目的是使对本专利技术公开内容的理解更加透彻全面。
[0041]实施例一 本实施例提供了一种基于k

truss和图核的图分类方法,流程如图1所示,具体包括以下步骤:
[0042]步骤一,获取需要分类的图数据,图分类数据的每个样本均带有其类别标签;
[0043]步骤二,利用图的k

truss分解对每个样本建立一个嵌套子图的层次结构;进一步的技术方案中,分解方法如图2所示,具体如下:
[0044](1)已经知道2

truss就是整个图,所以初始化k=3。
[0045](2)计算所有边的support值,即包含该边的三角形个数;
[0046](3)根据边的support值由小到大的顺序,对边进行排序;
[0047](4)找到一条以u和v为端点的边e,假设u的度数小于等于v的度数,它的support 值小于k

2,那么对于u的每个邻居w,如果w和v之间也有边存在,即u,v,w构成一个三角形),则将(u,w)和(v,w)两边的support值减少1;
[0048](5)从G中删掉边e,更新剩余边的顺序,维护边的support值由小到大的顺序;
[0049](6)重复(4)和(5)直到找不到符合满足support值小于k

2的边,则输出当前G为原图G的k

truss子图,记为T
k
;如果此时G不为空,k增加1,重复步骤(4)

(6);如果此时G为空,分解过程结束。
[0050]将图所有边truss值的最大值记为ω
*
(G),则truss分解产生的结果就形成了一个嵌套的“链”:
[0051][0052]显然,图G中属于(k+1)

truss的边一定属于k

truss。
[0053]步骤三,利用truss变体形式的图核函数分别测量每两个图之间的相似性,生成核矩阵,并利用图类别标签信息,训练C

支持向量机(SVM)分类器,具体方法如下:
[0054]现有文献中提出了许多图核,即图之间的核函数,以解决图之间的相似性评估问题,例如:R

卷积图核、相交图核和分配图核,R

卷积图核包括小图图核(GR)、Weisfeiler

Lehman 子树核(WL)、最短路径核(SP)等,相交图核包括邻域哈希核(NH)等,分配图核包括金字塔匹配图核(PM)等。图核隐式地将图嵌入希尔伯特空间中,并计算这些向量表示之间的内积来表达相似性,并用核函数值来表示。本专利技术的方法中,可以选择上述图核中的任意一种,来解决图分类任务。
[0055]1、本实施例中选择Weisfeiler

Lehman子树核作为基础图核,用于图分类任务;
[0056]Weisfeiler

Lehman子树核(WL)的基本思想是通过提取图结构的子部分,通过比较子部分的结构相似性来衡量两图的相似性,并将相似度作为图核的核值,Weisfeiler

Lehman子树核(WL)是基于一维WL图匹配算法,该算法的关键思想是通过对相邻节点的节点标签排序后的集合来扩展节点标签,并将这些扩展后的标签压缩为新的短标签,其具体过程如下:
[0057](1)给定两个图G和G

,如图4中a所示。聚合两图中每个节点及其邻居节点的标签,当前节点自身的标签和其邻居节点标签之间用逗号隔开,邻居节点标签按升序排列,如图4 中b所示本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于k

truss和图核的图分类方法,其特征在于,包括如下步骤:步骤一,获取需要分类的图数据,图分类数据的每个样本均带有其类别标签;步骤二,利用图的k

truss分解对每个样本建立一个嵌套子图的层次结构;步骤三,利用truss变体形式的图核函数分别测量每两个图之间的相似性,生成核矩阵,并利用图类别标签信息,训练C

支持向量机分类器;步骤四,将待分类的图数据输入训练好的分类器,得到分类结果。2.根据权利要求l所述的基于k

truss和图核的图分类方法,其特征在于,所述步骤二中,利用图的k

truss分解对每个样本建立一个嵌套子图的层次结构,分解方法具体如下:(1)已经知道2

truss就是整个图,所以初始化k=3。(2)计算所有边的support值,即包含该边的三角形个数;(3)根据边的support值由小到大的顺序,对边进行排序;(4)找到一条以u和v为端点的边e,假设u的度数小于等于v的度数,它的support值小于k

2,那么对于u的每个邻居w,如果w和v之间也有边存在,即u,v,w构成一个三角形,则将(u,w)和(v,w)两边的support值减少1;(5)从G中删掉边e,更新剩余边的顺序,维护边的support值由小到大的顺序;(6)重复(4)和(5)直到找不到满足support值小于k

2的边,则输出当前G为k

truss;如果此时G不为空,k增加1,重复步骤(4)

(6);如果此时G为空,分解过程结束。3.根据权利要求1所述的基于k

【专利技术属性】
技术研发人员:于东晓张子春罗琦
申请(专利权)人:山东大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1