基于拟间接依赖的过程模型挖掘新方法,涉及事件日志的预处理、初始模型的建立和调整以及含有间接依赖模型的挖掘,属于过程挖掘领域。现存的大多数过程挖掘方法仅考虑任务间的直接依赖关系而忽视了任务间的间接依赖关系。本发明专利技术提出了基于拟间接依赖的过程挖掘方法,该方法以事件日志的行为轮廓为基础,其主要目的是基于拟间接依赖关系挖掘出含有间接依赖的过程模型。在挖掘的过程中会产生多个候选模型,通过计算适合性和行为适当性选出最优模型。本发明专利技术把交叉序细分为并行交叉序和循环交叉序,能够有效地挖掘出并行任务和循环任务。另外,本发明专利技术把拟间接依赖的定义形式化,使得在挖掘过程中能够快速地找出具有拟间接依赖关系的任务对。
【技术实现步骤摘要】
本专利技术属于过程挖掘领域,涉及过程模型挖掘的一种新方法,包括寻找具有拟间 接依赖关系的任务和一种基于拟间接依赖的过程模型挖掘方法,特别适用于含有间接依赖 的过程模型的挖掘。
技术介绍
随着信息技术的不断发展,信息系统在业务流程管理中越来越重要,由于信息系 统记录的事件日志数量急剧增长,使得过程挖掘这种自动建模技术成为研究的热点。过程 挖掘旨在从信息系统记录的事件日志中挖掘出过程模型,从而帮助人们改善或重建业务流 程。 近年来各种过程模型挖掘方法相继出现,但是大多数的挖掘方法仅仅考虑了任务 间的直接依赖关系而忽略了间接依赖关系。间接依赖这个概念是由van der Aalst教授最 先提出的,现存的过程挖掘方法中比较理想的挖掘含有间接依赖的过程模型的方法是a ++ 算法,该方法虽然能挖掘出含有间接依赖的过程模型,但是没有从过程行为的角度进行分 析。 本专利技术提出,把交叉序细分为并行交叉 序和循环交叉序,扩展了事件日志行为轮廓的关系,从过程行为的角度进行分析建模。另外 本专利技术把拟间接依赖的定义形式化,使得在挖掘过程中能够快速地找出具有拟间接依赖关 系活动对,进而对模型进行调整,最终挖掘出含有间接依赖的过程模型。
技术实现思路
本专利技术为了丰富已有的过程挖掘技术,提出了一种基于拟间接依赖的过程模型挖 掘的新方法,以日志的行为轮廓为基础建立初始模型,根据计算适合性和行为适当性用增 量日志来调整模型,然后找出具有拟间接依赖关系的活动对并对模型进行调整,最后进行 模型选择,得到最优模型。 在挖掘的过程中,首先,从信息系统中提取事件日志,去除不完备的日志序列并且 合并日志以提高模型质量及减少工作量;然后根据直接严格序、间接严格序、并行交叉序、 循环交叉序、排他序建立行为轮廓关系表,构建初始模型;紧接着是对模型进行调整,根据 适合性和行为适当性设置评价标准,在不符合要求的情况下运用增量日志调整模型;最后 寻找出具有拟间接依赖关系的活动对并调整模型,根据评价标准选出最优模型。 本专利技术提出的拟间接依赖关系的定义为:设LgP(n是流程Petri网模型PM = (S,T,F,C,s,e)中的事件日志,〇 t Jytn为事件日志L中的日志序列,则一个活动变 迀对(a,b) G OYXIY)(不考虑在每条日志序列中都共同出现的活动对)具有拟间接依赖 关系,记为a oc b,当且仅当: 其中k为给定的执行日志的不同事件轨迹数,Ii1表示第i类事件轨迹中所包含 的过程实例数,r(b, 〇1)用来判断活动变迀b是否在〇1中出现,若b在在〇 i中出现,则 r (b, 〇 ;) = 1,若不出现则r (b, 〇 ;) = 0 ;R(a - id b, 〇 ;)用来判断a和b是否以间接严格 序关系出现,若是,则R(a - id b, 〇 ;) = 1,若不是,则R(a - id b, 〇 ;) = 0。 本专利技术的优点是运用基于弱序关系的次序关系改进了日志行为轮廓的概念,这些 次序关系包括:直接严格序、间接严格序、并行交叉序、循环交叉序、排他序。另外,提出了拟 间接依赖的概念,并把拟间接依赖的定义形式化,进而基于拟间接依赖调整模型,提高了模 型的质量,并且能够有效挖掘出一部分含有间接依赖的过程模型。【附图说明】 图1是本专利技术实施的结构图。 图2是本专利技术的构建初始模型的步骤图。 图3是本专利技术的寻找具有拟间接依赖关系活动对的步骤图。 图4是本专利技术的基于拟间接依赖调整模型的步骤图。【具体实施方式】 本专利技术提出。 以下结合附图对本专利技术作进一步的说明。 图1是本专利技术整个实施过程的结构图。如图所示,它主要包括四部分,分别是预处 理事件日志、建立初始模型、调整初始模型和基于拟间接依赖调整模型并择优选出最终模 型。 图2是本专利技术的构建初始模型的步骤图。如图所示,首先,基于弱序关系的五种次 序关系(直接严格序、间接严格序、并行交叉序、循环交叉序、排他序)建立行为轮廓关系 表,然后根据行为轮廓对应的基本结构确定流关系,构建出初始模型。 图3是本专利技术的寻找具有拟间接依赖关系活动对的步骤图。如图所示,首先对于 任意的活动对(a,b) G OYXIY)(不考虑在每条日志序列中都共同出现的活动对),判断b 在某条日志序列中是否出现,得出r的值,再判断活动对(a,b)在某条日志序列中是否以间 接严格序关系出现,得出R的值,紧接着计算P (a,b)是否等于1,直到所有的活动对查询完 毕,记录下使P(a,b) = 1的活动对,这些活动对即是具有拟间接依赖关系的活动对。 图4是本专利技术的基于拟间接依赖调整模型的步骤图。如图所示,在找出所有具有 拟间接依赖关系的活动对后,对运用增量日志调整后的初始模型进一步作调整,使得具有 拟间接依赖关系的两个活动间都有一个库所直接将它们相连,以保证它们之间的依赖性。 这样,调整后的模型中,具有拟间接依赖关系的活动变迀对也具有间接依赖关系,因此,基 于拟间接依赖能够挖掘出含有间接依赖的过程模型。【主权项】1. 基于拟间接依赖的过程模型挖掘新方法,包括预处理事件日志、建立初始模型、调整 初始模型和基于拟间接依赖调整模型并择优选出最终模型。其特征在于:从信息系统中提 取事件日志,去除不完备的日志序列并且合并日志,提高了模型质量并减少了工作量;根据 直接严格序、间接严格序、并行交叉序、循环交叉序、排他序建立行为轮廓关系表,构建初始 模型,能够有效地挖掘并行任务和循环任务;根据拟间接依赖的形式化定义找出具有拟间 接依赖关系的活动对并调整模型,根据评价标准选出最优模型,最终能够挖掘含有间接依 赖的过程模型。2. 根据权利要求1所述的初始模型的建立,其特征在于:根据直接严格序、间接严格 序、并行交叉序、循环交叉序、排他序建立行为轮廓关系表,对事件日志的行为进行分析,然 后根据行为轮廓对应的基本结构确定流关系,构建初始模型。3. 根据权利要求1所述的基于拟间接依赖调整模型并择优选出最终模型,其特征在 于:把拟间接依赖的定义量化,使寻找过程简化;找出具有拟间接依赖关系的活动变迀对 后,调整模型使得具有拟间接依赖关系的两个变迀之间都有一个库所直接把它们相连,以 保证它们之间的依赖性;基于适合性和行为适当性设置评价标准,若满足,则选择基于拟间 接依赖调整后的模型,若不满足,则选择利用增量日志调整的模型。【专利摘要】基于拟间接依赖的过程模型挖掘新方法,涉及事件日志的预处理、初始模型的建立和调整以及含有间接依赖模型的挖掘,属于过程挖掘领域。现存的大多数过程挖掘方法仅考虑任务间的直接依赖关系而忽视了任务间的间接依赖关系。本专利技术提出了基于拟间接依赖的过程挖掘方法,该方法以事件日志的行为轮廓为基础,其主要目的是基于拟间接依赖关系挖掘出含有间接依赖的过程模型。在挖掘的过程中会产生多个候选模型,通过计算适合性和行为适当性选出最优模型。本专利技术把交叉序细分为并行交叉序和循环交叉序,能够有效地挖掘出并行任务和循环任务。另外,本专利技术把拟间接依赖的定义形式化,使得在挖掘过程中能够快速地找出具有拟间接依赖关系的任务对。【IPC分类】G06F17/30【公开号】CN105069044【申请号】CN201510437577【专利技术人】方贤文, 化佩, 刘祥伟, 方欢, 殷志祥本文档来自技高网...
【技术保护点】
基于拟间接依赖的过程模型挖掘新方法,包括预处理事件日志、建立初始模型、调整初始模型和基于拟间接依赖调整模型并择优选出最终模型。其特征在于:从信息系统中提取事件日志,去除不完备的日志序列并且合并日志,提高了模型质量并减少了工作量;根据直接严格序、间接严格序、并行交叉序、循环交叉序、排他序建立行为轮廓关系表,构建初始模型,能够有效地挖掘并行任务和循环任务;根据拟间接依赖的形式化定义找出具有拟间接依赖关系的活动对并调整模型,根据评价标准选出最优模型,最终能够挖掘含有间接依赖的过程模型。
【技术特征摘要】
【专利技术属性】
技术研发人员:方贤文,化佩,刘祥伟,方欢,殷志祥,
申请(专利权)人:安徽理工大学,
类型:发明
国别省市:安徽;34
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。