基于流程树的模型相似度计算方法与系统技术方案

技术编号:36251619 阅读:15 留言:0更新日期:2023-01-07 09:45
本发明专利技术公开了一种基于流程树的模型相似度计算方法与系统,包括:1)获取两个任意类型的流程模型并标准化处理,把流程模型转换为流程树模型;2)遍历两个流程树层数最深的操作符结点,分别获得当前操作符结点的孩子结点;3)判断孩子结点类型及操作符类型,根据对应的变迁邻接关系对获取规则得到变迁邻接关系对;4)根据流程树模型的结构依次向上递归重复步骤3),将获取的变迁邻接关系对加入集合,直到当前操作符结点为根结点结束递归,获得最终变迁邻接关系对集合;5)将两个流程树模型的变迁邻接关系对集合使用Jaccard系数进行计算,得到模型相似度值。本发明专利技术解决了TAR算法不能区分循环结构和顺序结构、无法解决模型中含不可见变迁的问题。变迁的问题。变迁的问题。

【技术实现步骤摘要】
基于流程树的模型相似度计算方法与系统


[0001]本专利技术涉及流程挖掘
,尤其是指一种基于流程树的模型相似度计算方法、系统、存储介质及计算设备。

技术介绍

[0002]流程挖掘旨在从事件日志中提取关于业务流程的信息,发现、监控和改进业务流程。流程发现可以从事件日志中发现流程模型,流程模型的相似性计算是业务流程管理中不可缺少的任务,广泛应用于组织合并、用户需求变更、模型仓库管理等多个场景。流程模型相似性度量算法用于计算两个给定流程模型的相似性。已有流程模型相似性度量算法例如TAR算法不能区分循环结构和顺序结构、无法解决模型中含不可见变迁的问题,同时降低模型结构的复杂性,保留模型的行为特征。

技术实现思路

[0003]本专利技术的第一目的在于克服现有技术的缺点和不足,提供一种基于流程树的模型相似度计算方法,能够处理已有模型相似度计算方法TAR算法不能区分循环结构和顺序结构、无法解决模型中含不可见变迁的问题,并且首次使用流程树模型计算模型相似度,为模型相似度的计算提供了新思路,此外,还可以应用到采样评估、聚类评估等领域中,具有实用性。
[0004]本专利技术的第二目的在于提供一种基于流程树的模型相似度计算系统。
[0005]本专利技术的第三目的在于提供一种存储介质。
[0006]本专利技术的第四目的在于提供一种计算设备。
[0007]为实现本专利技术的第一目的,本专利技术所提供的技术方法为:基于流程树的模型相似度计算方法,包括以下步骤:
[0008]1)获取基础数据,即两个任意类型的流程模型,进行标准化处理,把两个流程模型转换为两个流程树模型;
[0009]2)遍历步骤1)中获取的两个流程树模型的层数最深的操作符结点,分别获得当前操作符结点的孩子结点;
[0010]3)判断步骤2)获取的操作符结点的孩子结点类型及操作符类型,根据对应的变迁邻接关系对获取规则得到变迁邻接关系对;
[0011]4)根据流程树模型的结构依次向上递归重复步骤3),将获取的变迁邻接关系对加入集合,直到当前操作符结点为根结点则结束递归,获得最终变迁邻接关系对集合;
[0012]5)将步骤4)中得到的两个流程树模型的变迁邻接关系对集合使用Jaccard系数进行计算,得到模型相似度值。
[0013]进一步,在步骤1)中,所述流程模型有Petri网、BPMN等,最常见的是Petri网,所述Petri网由库所、变迁和有向弧三种基本元素组成,每个库所的前后通过有向弧连接变迁,每个变迁的前后通过有向弧连接库所,所述变迁是业务流程中事件的表示,所述流程树模
型是一种块结构的流程模型,它以一种树的形式呈现给用户,其中树的结点由操作符结点和事件活动组成,其中流程树操作符结点是非叶子结点,事件活动为叶子结点。
[0014]进一步,在步骤2)中,遍历步骤1)中获取的两个流程树模型的层数最深的操作符结点,分别获得当前操作符结点的孩子结点,所述操作符结点为流程树中的非叶子结点,所述操作符结点的孩子结点为操作符结点对应的深一层次的结点。
[0015]进一步,在步骤3)中,判断步骤2)获取的操作符孩子结点类型及操作符类型,所述操作符类型包括顺序、选择、并发和循环四种,它们的规则如下:
[0016]顺序操作符的规则为:从子流程A到子流程B有出边无入边;
[0017]选择操作符的规则为:子流程A与子流程B之间没有任何关联,两个子流程只能选择执行一个;
[0018]并发操作符的规则为:子流程A到子流程B既有出边又有入边,两者彼此交叉,并行存在;
[0019]循环操作符的规则为:一个活动从子流程A出发,到达子流程B中,再由B重新回到A;
[0020]根据对应的变迁邻接关系对获取规则得到变迁邻接关系对,所述变迁邻接关系对为模型行为执行顺序中当前变迁与其后继变迁构成的关系对,所述后继变迁为相对当前变迁的后一个变迁,变迁邻接关系对的获取规则如下:
[0021]a、规则1:操作符结点为顺序结构,其孩子结点全为叶子结点;
[0022]获取规则1:将满足规则1的顺序操作符结点的孩子结点按照位置进行划分,将最左侧叶子结点加入开始点集合,最右侧叶子结点加入结束点集合,同时从最左侧叶子结点开始遍历,将当前叶子结点与其后继叶子结点相互组合构成变迁邻接关系对;
[0023]b、规则2:操作符结点为选择结构,其孩子结点全为叶子结点;
[0024]获取规则2:将满足规则2的选择操作符结点的孩子结点按照位置进行划分,当前操作符所有叶子结点均加入到开始点集合和结束点集合中,由于选择结构的孩子结点之间互不关联,所以此处获得的变迁邻接关系对为原始变迁邻接关系对集合中的关系对,不再有新增变迁邻接关系对;
[0025]c、规则3:操作符结点为并发结构,其孩子结点全为叶子结点;
[0026]获取规则3:将满足规则3的并发操作符结点的孩子结点按照位置进行划分,当前操作符所有叶子结点均加入到开始点集合和结束点集合中去,同时将所有叶子结点两两相互组合构成变迁邻接关系对;
[0027]d、规则4:操作符结点为循环结构,其孩子结点全为叶子结点;
[0028]获取规则4:将满足规则4的循环操作符结点的孩子结点按照位置进行划分,将最左侧叶子结点加入开始点集合和结束点集合,同时从最左侧叶子结点开始遍历,将当前叶子结点与其后继结点构成的变迁邻接关系对,由于最右侧叶子结点无后继结点,因此将其与最左侧叶子结点组合构成变迁邻接关系对;
[0029]e、规则5:操作符结点为顺序结构,其孩子结点不全为叶子结点;
[0030]获取规则5:将满足规则5的顺序操作符结点的孩子结点按照位置进行划分,从最左侧孩子结点开始遍历,若当前孩子结点为叶子结点,则其开始点集合和结束点集合中的元素为它自己,将当前孩子结点结束点集合中的元素与其后继结点开始点集合中的元素两
两组合,构成变迁邻接关系对;
[0031]f、规则6:操作符结点为选择结构,其孩子结点不全为叶子结点;
[0032]获取规则6:将满足规则6的选择操作符结点的孩子结点按照位置进行划分,获取每个孩子结点的开始点集合、结束点集合分别加入当前结点的开始点集合中、结束点集合中,获取当前结点所有孩子结点的变迁邻接关系对;
[0033]g、规则7:操作符结点为并发结构,其孩子结点不全为叶子结点;
[0034]获取规则7:将满足规则7的并发操作符结点的孩子结点按照位置进行划分,从最左侧孩子结点开始遍历,将所有孩子结点的结束点集合与其它结点的开始点集合两两相互组合,构成变迁邻接关系对;
[0035]h、规则8:操作符结点为循环结构,其孩子结点不全为叶子结点;
[0036]获取规则8:将满足规则8的循环操作符结点的孩子结点按照位置进行划分,从最左侧孩子结点开始遍历,将当前孩子结点的结束点集合与其后继结点的开始点集合两两组合、最右侧孩子结点的结束点集合与最左侧孩子结点的开始点集合两两组合构成本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于流程树的模型相似度计算方法,其特征在于,包括以下步骤:1)获取基础数据,即两个任意类型的流程模型,进行标准化处理,把两个流程模型转换为两个流程树模型;2)遍历步骤1)中获取的两个流程树模型的层数最深的操作符结点,分别获得当前操作符结点的孩子结点;3)判断步骤2)获取的操作符结点的孩子结点类型及操作符类型,根据对应的变迁邻接关系对获取规则得到变迁邻接关系对;4)根据流程树模型的结构依次向上递归重复步骤3),将获取的变迁邻接关系对加入集合,直到当前操作符结点为根结点则结束递归,获得最终变迁邻接关系对集合;5)将步骤4)中得到的两个流程树模型的变迁邻接关系对集合使用Jaccard系数进行计算,得到模型相似度值。2.根据权利要求1所述的基于流程树的模型相似度计算方法,其特征在于:在步骤1)中,所述流程模型有Petri网、BPMN等,最常见的是Petri网,所述Petri网由库所、变迁和有向弧三种基本元素组成,每个库所的前后通过有向弧连接变迁,每个变迁的前后通过有向弧连接库所,所述变迁是业务流程中事件的表示,所述流程树模型是一种块结构的流程模型,它以一种树的形式呈现给用户,其中树的结点由操作符结点和事件活动组成,其中流程树操作符结点是非叶子结点,事件活动为叶子结点。3.根据权利要求2所述的基于流程树的模型相似度计算方法,其特征在于:在步骤2)中,遍历步骤1)中获取的两个流程树模型的层数最深的操作符结点,分别获得当前操作符结点的孩子结点,所述操作符结点为流程树中的非叶子结点,所述操作符结点的孩子结点为操作符结点对应的深一层次的结点。4.根据权利要求3所述的基于流程树的模型相似度计算方法,其特征在于:在步骤3)中,判断步骤2)获取的操作符孩子结点类型及操作符类型,所述操作符类型包括顺序、选择、并发和循环四种,它们的规则如下:顺序操作符的规则为:从子流程A到子流程B有出边无入边;选择操作符的规则为:子流程A与子流程B之间没有任何关联,两个子流程只能选择执行一个;并发操作符的规则为:子流程A到子流程B既有出边又有入边,两者彼此交叉,并行存在;循环操作符的规则为:一个活动从子流程A出发,到达子流程B中,再由B重新回到A;根据对应的变迁邻接关系对获取规则得到变迁邻接关系对,所述变迁邻接关系对是模型行为执行顺序中当前变迁与其后继变迁构成的关系对,所述后继变迁是相对当前变迁的后一个变迁,所述变迁邻接关系对的获取规则如下:a、规则1:操作符结点为顺序结构,其孩子结点全为叶子结点;获取规则1:将满足规则1的顺序操作符结点的孩子结点按照位置进行划分,将最左侧叶子结点加入开始点集合,最右侧叶子结点加入结束点集合,同时从最左侧叶子结点开始遍历,将当前叶子结点与其后继叶子结点相互组合构成变迁邻接关系对;b、规则2:操作符结点为选择结构,其孩子结点全为叶子结点;获取规则2:将满足规则2的选择操作符结点的孩子结点按照位置进行划分,当前操作
符所有叶子结点均加入到开始点集合和结束点集合中,由于选择结构的孩子结点之间互不关联,所以此处获得的变迁邻接关系对为原始变迁邻接关系对集合中的关系对,不再有新增变迁邻接关系对;c、规则3:操作符结点为并发结构,其孩子结点全为叶子结点;获取规则3:将满足规则3的并发操作符结点的孩子结点按照位置进行划分,当前操作符所有叶子结点均加入到开始点集合和结束点集合中去,同时将所有叶子结点两两相互组合构成变迁邻接关系对;d、规则4:操作符结点为循环结构,其孩子结点全为叶子结点;获取规则4:将满足规则4的循环操作符结点的孩子结点按照位置进行划分,将最左侧叶子结点加入开始点集合和结束点集...

【专利技术属性】
技术研发人员:刘聪苏轩李会玲李彩虹王雷王志强
申请(专利权)人:山东理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1