一种基于模式前缀共享的多模式图匹配查询方法及装置制造方法及图纸

技术编号:37604763 阅读:17 留言:0更新日期:2023-05-18 11:56
本发明专利技术公开了一种基于模式前缀共享的多模式图匹配查询方法及装置,实现了在给定大量图模式的情况下,进行高效的图模式匹配。本发明专利技术在系统的编译态和运行态都进行了一定的优化。获取规则后,将规则解析为模式图集合,并且通过一种类Java Lambda的DSL语言表示,该DSL语言包括了多种算子,拥有良好的可扩展性。从全局出发,提出了一种新的数据结构,将数千个模式图之间的相同前缀进行合并,因此可以大大加快多模式图匹配的速度,提高多模式图匹配算法的可伸缩性,并且降低计算时带来的各方面开销。本发明专利技术适用于使用大量数据的实时反欺诈领域,能够显著提升进行多模式图匹配计算时的速度和效率。度和效率。度和效率。

【技术实现步骤摘要】
一种基于模式前缀共享的多模式图匹配查询方法及装置


[0001]本专利技术是图匹配查询领域,尤其提供一种基于模式前缀共享的多模式图匹配查询方法及装置,利用不同图查询模式之间的相同前缀来统一对输入模式的处理,并且提供了一种通用的模式定义语言。主要适用于拥有大量数据的反欺诈信息安全领域。

技术介绍

[0002]在实时反欺诈领域中,在办理某个在线业务时,可能存在如下场景:
[0003](1)申请人需要填写例如姓名、身份证号、邮箱、家庭住址等信息;
[0004](2)反欺诈系统中已经存在很多个欺诈规则,例如检测到的申请人IP在一天中变动多次、并且这些IP为多个申请人所共用等。
[0005](3)在申请人进行申请的过程中需要进行实时检测,如果申请行为能够和欺诈规则中的一个或多个匹配,则证明申请人存在欺诈行为,需要及时阻止并且作出应对措施。
[0006]在上述场景下,通过将申请行为以及欺诈规则抽象为属性图,以借助多模式图匹配的方法来进行欺诈行为的识别。
[0007]图的模式匹配是指给定数据图集合以及特定的模式图,在数据图集合中匹配到与给定模式图同构的图。图的多模式匹配是其单模式匹配的一个扩展,主要的问题是降低在多个模式图之间并发匹配的效率和开销。
[0008]现有的图模式匹配算法,如TurboISO、VF2等大部分都属于单模式图匹配,多模式图匹配方向的算法较为缺乏,因为在存在多个模式的情况下,顺序处理或是简单的并行匹配并不是最有效的。现有的多模式图匹配优化方法包括模式重写、共享公共子图等,减少多个模式图匹配时的大量重复计算。这类优化的可伸缩性较低,并且也受到很高计算开销的限制,并且在计算速度方面也都有所欠缺,不能够很好地满足反欺诈领域高实时性的技术要求。
[0009]现有的多模式图匹配查询装置,对于每一组申请行为,都会需要从规则管理平台中重新读取规则并抽象,并没有使用简明的方式定义解析和定义这些规则;除此之外,对同组申请行为的判定结果也没有进行记录。这些操作都会大大增加耗费的时间,并不符合实时反欺诈场景中实时性较高的需求。

技术实现思路

[0010]本专利技术的目的在于针对现有技术的不足,设计了一种基于模式前缀共享的多模式图匹配查询方法及装置。在一些申请行为中,由于团伙欺诈的存在,由欺诈规则抽象得到的图模式常常存在大量相同前缀,通过合并这些前缀可以显著地提高反欺诈系统的运行效率。该方法可以很好地应用到实时反欺诈领域中,并且为非技术人员提供了一种简明易懂的模式定义方式。
[0011]本专利技术的目的是通过以下技术方案来实现的:一种基于模式前缀共享的多模式图匹配查询方法,该方法包括以下步骤:
[0012](1)在一次申请行为到来时,系统会将其解析为查询图。所有的规则都注册在规则管理平台中,系统在运行态读取规则,并解析为相应的模式图结构,将获取的第i条反欺诈规则表示为图模式结构Pattern
i
=(V,E)。是节点的集合,其中第j个顶点又表示为v
j
=(tagV,pkey,prop),tagV表示节点的标签,pkey表示节点的关键字,prop表示节点的属性,用键值对存储;E是边的集合,其中第k条边表示为e
k
=(tagE,startv,endv),tagE表示边的标签,startv表示起点的标签和关键字,endv表示终点的属性和关键字。
[0013](2)在反欺诈信息安全领域中,规则通常会存在相似的部分,因此由规则解析来的模式图常常会存在共同的子图,称作前缀。对模式图结构的共同前缀进行合并;从全局出发,在运行态将所有模式图结构中重复的前缀进行合并,并且根据图中每条边的权重和标签来重新赋值,得到合并后的查询树。最终根据以上两种数据结构,将当前查询图从中间结果的根节点开始遍历,判断当前图是否能够和查询树上的模式图结构匹配。
[0014](3)返回匹配后的结果,如果成功匹配到结果则确认此申请行为存在欺诈,反之没有。
[0015]进一步地,步骤(2)中,将各个模式中重复的前缀进行合并,之后得到去重且合并后的模式图Pattern
a
,并且在Pattern
a
的基础上,将其转换成查询树Tree
a
,具体步骤如下:
[0016](2.1)Pattern
a
中的每条边均对应到Tree
a
中的每一条树边,并且在Tree
a
中存在重复的顶点;
[0017](2.2)根据Pattern
a
中每条边的出度和入度来计算顶点的维度δ,并且选择δ最小的顶点作为Tree
a
的根;
[0018](2.3)将所有边从上一级指向下一级,生成Tree
a

[0019]第二方面,本专利技术还提供了一种基于模式前缀共享的多模式图匹配查询装置,包括存储器和一个或多个处理器,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,用于实现所述的基于模式前缀共享的多模式图匹配查询方法的步骤。
[0020]第三方面,本专利技术还提供了一种计算机可读存储介质,其上存储有程序,该程序被处理器执行时,实现所述的基于模式前缀共享的多模式图匹配查询方法的步骤。
[0021]本专利技术的优点及有益效果是:
[0022](1)优化多模式图匹配方法:
[0023]本专利技术通过将多模式匹配定义为一个全局优化问题,通过共享模式的共同前缀,在满足场景约束的前提下,构建了一个最优且高效的解决方案。本专利技术中使用的算法高度精确,并且和其他的一些多模式图匹配的算法相比,在时间上有极大的优势。除此之外,在本专利技术适用场景下,其可扩展性和优于现有的最先进的方法。
[0024](2)提供一种通用的规则表达和抽象方式:
[0025]定义了多种模式定义算子,使用了类似Java Lambda语言的表达方法,逻辑清晰,并且具有较好的可扩展性。在后续增加规则时,只需要在提供的算子中进行选择和组合,就可以定义一种新的模式,方便非技术人员学习和使用。
附图说明
[0026]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图做简单地介绍,显而易见地,下面描述中的附图仅仅是本
专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动前提下,还可以根据这些附图获得其他附图。
[0027]图1为本专利技术的多模式图匹配查询系统的整体架构图;
[0028]图2为本专利技术的优化过程图;
[0029]图3为本方法和传统方法性能对比图;
[0030]图4为本专利技术提供的一种基于模式前缀共享的多模式图匹配查询装置的结构图。
具体实施方式
[0031]下面结合附图对本专利技术作进一步描述。
[0032]本专利技术提供的一种基于模式前缀共享的多模式图匹配查询方法如图1所示。对于一系列的申请行本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于模式前缀共享的多模式图匹配查询方法,其特征在于,该方法包括以下步骤:(1)在一次申请行为到来时,系统会将其解析为查询图。所有的规则都注册在规则管理平台中,系统在运行态读取规则,并解析为相应的模式图结构,将获取的第i条反欺诈规则表示为图模式结构Pattern
i
=(V,E)。V是节点的集合,其中第j个顶点又表示为v
j
=(tagV,pkey,prop),tagV表示节点的标签,pkey表示节点的关键字,prop表示节点的属性,用键值对存储;E是边的集合,其中第k条边表示为e
k
=(tagE,startv,endv),tagE表示边的标签,startv表示起点的标签和关键字,endv表示终点的属性和关键字。(2)在反欺诈信息安全领域中,规则通常会存在相似的部分,因此由规则解析来的模式图常常会存在共同的子图,称作前缀。对模式图结构的共同前缀进行合并;从全局出发,在运行态将所有模式图结构中重复的前缀进行合并,并且根据图中每条边的权重和标签来重新赋值,得到合并后的查询树。最终根据以上两种数据结构,将当前查询图从中间结果的根节点开始遍历,判断当前图是否能够和查询树上的模式图结构匹配。(3)返回匹配后的结果,如果成功匹配到结果则确认此申请行为存在欺诈,反之没有。2.根据权利要求1所述的一种基于模式前...

【专利技术属性】
技术研发人员:王新宇王新根陈伟鲍迪恩彭聪
申请(专利权)人:浙江邦盛科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1