一种基于标签图的模式匹配子图查找方法技术

技术编号:13741535 阅读:53 留言:0更新日期:2016-09-22 23:21
本发明专利技术公开一种基于标签图的模式匹配子图查找方法,该方法将模式匹配子图查找问题定义成标签图模型,从全局角度求解标签图中的模式匹配子图,通过剪枝优化和深度优先搜索算法等策略获取可行解空间。所述标签图中模式匹配子图的查找问题描述如下:设给定一个包含一组标签的标签图,再给定包含一组标签的查询图,基于标签图的模式匹配子图查找方法找到和查询图模式匹配的子图。假定标签图为G=(V,E,l),查询图为Q=(Vq,Eq,lq),标签图G=(V,E,l)中每个顶点看作待查询的对象,图中每个顶点都具有一个标签;标签图和查询图均为有向图。我们的目标是从标签图G=(V,E,l)中寻找到所有和查询图Q=(Vq,Eq,lq)满足模式匹配条件的子图。

【技术实现步骤摘要】

本专利技术涉及标签图中的模式匹配子图查找方法,主要利用剪枝优化与深度优先搜索算法从全局角度求解标签图中的模式匹配子图,属于计算机技术、信息技术、数据挖掘交叉

技术介绍
图是一种描述现实世界中各类实体和它们之间关系的重要数据结构。随着信息技术的发展,图通常包含丰富的标签信息,称之为标签图。在标签图中,如何根据给定的查询图,在标签图中找到与查询图模式匹配的子图,成为广泛研究的课题。本专利技术主要采用剪枝优化和深度优先搜索算法,从全局角度求解标签图中的模式匹配子图。剪枝优化,在搜索算法中指通过某种判断,避免一些不必要的遍历过程,即剪去搜索树中的某些“枝条”。深度优先搜索算法,是搜索算法的一种,即沿着树的深度对树的节点进行遍历,尽可能深的搜索树的分支,它的目的是要达到被搜索结构的叶节点。在本专利技术中,应用剪枝优化和深度优先搜索算法,求解标签图中的模式匹配子图。本专利技术能够形成解决全局情况下标签图中的模式匹配子图方案,使标签图中的模式匹配子图查找问题在解决过程在时间和空间复杂度上得到优化,并且避免早熟收敛。本专利技术给出一种模式匹配子图的查找方法,该方法将模式匹配子图查找问题定义成标签图模型,从全局角度求解标签图中的模式匹配子图,通过剪枝优化和深度优先搜索算法等策略获取可行解空间。
技术实现思路
技术问题:本专利技术的目的是提供一种基于标签图的模式匹配子图查找方法,解决标签图中模式匹配子图的查找问题,该问题是指给定一个各顶点注有相应标签的图,即标签图,以及一个各顶点注有相应标签的查询图。其中,查询图的规模比标签图小。从标签图所有顶点中选择部分顶点构成子图,使得该子图与查询图满足模式匹配的条件。技术方案:所述标签图中模式匹配子图的查找问题描述如下:设给定一个包含一组标签的标签图,再给定包含一组标签的查询图,基于标签图的模式匹配子图查找方法找到和查询图模式匹配的子图。假定标签图为G=(V,E,l),查询图为Q=(Vq,Eq,lq),标签图G=(V,E,l)中每个顶点看作待查询的对象,图中每个顶点都具有一个标签;标签图和查询图均为有向图。我们的目标是从标签图G=(V,E,l)中寻找到所有和查询图Q=(Vq,Eq,lq)满足模式匹配条件的子图。本专利技术所述的基于标签图的模式匹配子图查找方法将网络中的模式匹配子图查找问题定义成标签图模型,以及采用剪枝优化与深度优先搜索算法获得解空间。本专利技术所述的基于标签图的模式匹配子图查找方法包括以下步骤:步骤1)根据用户输入的信息,构建网络图中的模式匹配子图查找问题的标签图G=(V,E,l),所述V是顶点集合,E是边集合,l是顶点到标签的映射。所述映射,是指两个元素集合之间元素相互对应的关系。所述标签图G=(V,E,l)在建立后,每个顶点均对应一个标签。具体步骤如下:步骤11)用户输入包含顶点集合、边集合及每个顶点对应的标签,构建标签图模型G=(V,E,l)。给定查询图,该查询图包含若干个顶点、各顶点之间的关系及各顶点对应的标签。其中,用户输入的顶点集合记为V,输入的边集合记为E,顶点ver对应的标签记作l(ver),查询图记作Q=(Vq,Eq,lq)。所述标签图G=(V,E,l)与查询图Q=(Vq,Eq,lq),均为不带权有向图;所述Vq是指查询图中的顶点集合,Eq是指查询图中的边集合,lq是指查询图Q=(Vq,Eq,lq)中的顶点到标签的映射。步骤12)将顶点集合V中所有顶点看作标签图模型G=(V,E,l)中的顶点。步骤13)定义(u,v),表示顶点u和顶点v之间相连的边。定义Φ(u),表示顶点u对应的可行匹配集合,即在标签图G=(V,E,l)中其标签和l(u)相同的所有顶点构成的集合。其中,u∈V且v∈V,Φ(u)={v|v∈V,l(v)=l(u)本文档来自技高网...

【技术保护点】
一种基于标签图中的模式匹配子图查找方法,其特征在于该方法包括以下步骤:步骤1)根据用户输入的信息,构建网络图中的模式匹配子图查找问题的标签图G=(V,E,l),所述V是顶点集合,E是边集合,l是顶点到标签的映射;所述映射,是指两个元素集合之间元素相互对应的关系;所述标签图G=(V,E,l)在建立后,每个顶点均对应一个标签;步骤2)采用剪枝优化和深度优先搜索算法,获得模式匹配子图查找问题在标签图模型G=(V,E,l)上的解空间,具体步骤如下:步骤21)定义目标解空间Solution,表示与查询图Q=(Vq,Eq,lq)模式匹配的所有子图构成的集合,初始化步骤22)定义目标可行匹配集合matches,初始化步骤23)定义临时匹配集合Φ0,求解查询图Q=(Vq,Eq,lq)中,每个顶点uq对应的可行匹配集合Φ(uq),其中uq∈Vq,Φ0表示由每个可行匹配集合Φ(uq)构成的集合;|Vq|表示查询图中的顶点个数,则顶点u0对应的可行匹配集合为Φ(u0),将Φ(u0)加入到Φ0中,同理将顶点u1对应的可行匹配集合Φ(u1)加入到Φ0中,继续操作,直至将顶点对应的可行匹配集合加入到Φ0中,从而得到最终的可行匹配集合构成的集合Φ0;24)执行剪枝算法DualSim(G,Q,Φ0),对临时匹配集合中的元素进行筛选,更新Φ0=DualSim(G,Q,Φ0),所述DualSim()即为剪枝优化算法,用来缩小查询过程中的搜索空间,通过以下两个限制条件对临时匹配集合Φ0中的元素进行剪枝:对于使得(v,v′)∈E;对于使得(v,v′)∈E;步骤25)执行深度优先搜索算法Search(G,Q,Φ0,depth),引入变量depth表示遍历的深度并初始化depth=0,求解目标解空间Solution;步骤26)确定最终目标解空间Solution,该解空间中包含与查询图Q=(Vq,Eq,lq)模式匹配的所有子图。...

【技术特征摘要】
1.一种基于标签图中的模式匹配子图查找方法,其特征在于该方法包括以下步骤:步骤1)根据用户输入的信息,构建网络图中的模式匹配子图查找问题的标签图G=(V,E,l),所述V是顶点集合,E是边集合,l是顶点到标签的映射;所述映射,是指两个元素集合之间元素相互对应的关系;所述标签图G=(V,E,l)在建立后,每个顶点均对应一个标签;步骤2)采用剪枝优化和深度优先搜索算法,获得模式匹配子图查找问题在标签图模型G=(V,E,l)上的解空间,具体步骤如下:步骤21)定义目标解空间Solution,表示与查询图Q=(Vq,Eq,lq)模式匹配的所有子图构成的集合,初始化步骤22)定义目标可行匹配集合matches,初始化步骤23)定义临时匹配集合Φ0,求解查询图Q=(Vq,Eq,lq)中,每个顶点uq对应的可行匹配集合Φ(uq),其中uq∈Vq,Φ0表示由每个可行匹配集合Φ(uq)构成的集合;|Vq|表示查询图中的顶点个数,则顶点u0对应的可行匹配集合为Φ(u0),将Φ(u0)加入到Φ0中,同理将顶点u1对应的可行匹配集合Φ(u1)加入到Φ0中,继续操作,直至将顶点对应的可行匹配集合加入到Φ0中,从而得到最终的可行匹配集合构成的集合Φ0;24)执行剪枝算法DualSim(G,Q,Φ0),对临时匹配集合中的元素进行筛选,更新Φ0=DualSim(G,Q,Φ0),所述DualSim()即为剪枝优化算法,用来缩小查询过程中的搜索空间,通过以下两个限制条件对临时匹配集合Φ0中的元素进行剪枝:对于使得(v,...

【专利技术属性】
技术研发人员:王宇虹陈志岳文静陈志远
申请(专利权)人:南京邮电大学
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1