基于聚类的业务过程资源组织挖掘方法技术

技术编号:34931786 阅读:13 留言:0更新日期:2022-09-15 07:27
本发明专利技术提出了一种基于聚类的业务过程资源组织挖掘方法,包括读取XES日志文件并转换为DataFrame数据结构,获取相应的数据特征;学习业务流程工作内容;获取资源日志数据;获取资源特征矩阵,并作为数据集;根据资源日志,统计每个资源在所有工作内容中出现的频率,构成资源特征矩阵,即数据集;划分测试数据集和训练数据集;训练数据Kmeans初始化;利用重叠聚类模型挖掘业务流程组织结构,并判断模型有效性;利用测试数据评估组织模型;为挖掘的组织模型的每一个资源组分配工作内容;分析模型结构,工作内容与资源组相关;发布资源组织模型,输出挖掘的组织模型,查看资源分类结果。本发明专利技术可以识别重叠的组织模型。明可以识别重叠的组织模型。明可以识别重叠的组织模型。

【技术实现步骤摘要】
基于聚类的业务过程资源组织挖掘方法


[0001]本专利技术属于业务过程挖掘领域,特别涉及一种基于聚类的业务过程资源组织挖掘方法。

技术介绍

[0002]目前,随着现代社会的发展,企业的业务范围愈加广泛,涉及的制造资源尤其是人员的数量越来越庞大,这对管理者充分认识真实的人员组织状况,人员之间的互动,部门之间的协调机制,以及人员是如何参与业务流程带来了一定的挑战。
[0003]不可否认,组织挖掘是业务流程挖掘的一个重要方面,它是人们认识业务中真实的资源组织状况的有效手段,为业务管理、组织知识推荐提供帮助。
[0004]目前大部分组织挖掘手段无法发现具有重叠效果的组织模型,这使得传统的挖掘手段无法发现真实的组织分布情况,更加无法发现组织之间的协作机制以及“多面手”资源。

技术实现思路

[0005]本专利技术的目的在于提供一种业务过程组织模型挖掘方法,利用业务流程的历史日志,挖掘得到资源组织模型。
[0006]实现本专利技术目的的技术解决方案为:
[0007]一种基于聚类的业务过程资源组织挖掘方法,包括以下步骤:
[0008]S1、读取XES日志文件并转换为DataFrame数据结构,获取相应的数据特征;
[0009]S2、学习业务流程工作内容:工作内容由一个案例类型、一个活动名称和时间戳组成;学习表达工作内容的元组;
[0010]S3、获取资源日志数据:利用初始的DataFrame类型的事件日志,以及S2学习的工作内容集合,计算每一个事件日志的资源日志
[0011]S4、获取资源特征矩阵profiles,并作为数据集;根据S3的资源日志,统计每个资源在所有工作内容co中出现的频率,构成资源特征矩阵,获得的资源特征矩阵即为数据集;
[0012]S5、划分测试数据集和训练数据集:将获取到的资源特征矩阵按照比例进行划分,分为训练数据和测试数据,训练数据用于组织模型的发现,测试数据用于评估组织模型的好坏;
[0013]S6、训练数据Kmeans初始化;
[0014]S7:利用重叠聚类模型挖掘业务流程组织结构,并判断模型有效性;
[0015]S8、利用测试数据评估组织模型;为挖掘的组织模型的每一个资源组分配工作内容;
[0016]S9、分析模型结构,工作内容co与资源组rg相关;
[0017]S10、发布资源组织模型,输出挖掘的组织模型,查看资源分类结果。
[0018]本专利技术与现有技术相比,其显著优点是:
[0019]本专利技术提出了一种基于聚类的业务过程资源组织挖掘方法,对比传统的组织挖掘方法,可以识别重叠的组织模型,发现通才,为业务过程管理提供支持。
附图说明
[0020]图1为本专利技术具体执行流程图。
[0021]图2为业务流程事件日志数据。
[0022]图3为资源事件日志示例图。
[0023]图4为资源特征矩阵示例图。
[0024]图5为Kmeans聚类示意图。
[0025]图6为重叠聚类模型示意图
具体实施方式
[0026]下面结合附图及具体实施例对本专利技术做进一步的介绍。
[0027]结合图1

图6,本专利技术的一种基于重叠聚类的业务过程组织知识推荐方法,包括以下步骤:
[0028]S1、读取XES日志文件并转换为DataFrame数据结构,具体为:读取XES格式的业务流程日志数据,获取相应的数据特征,例如:资源名称、案例名称、活动名称、时间戳等等,统计日志中事件数量和案例数量并反馈。
[0029]业务流程事件日志EL=(E,Att,π)
[0030]其中,E代表事件日志集,Att表示事件属性集,π函数为:E

Att,关于事件日志对其属性Att的映射,对于事件e∈E拥有属性集合dom(π(e)),对于事件属性x∈dom(π(e)),拥有属性值π
x
(e),其中π
x
(e)表示事件e关事件属性x的属性值。
[0031]事件日志属性Event Attributes
[0032]作为事件日志的最低要求,事件有三个标准属性:案例标识符(case)、活动名称(act)和时间戳(time)。另外,事件还记录了执行该活动的资源(res)。除了这四个常见的属性外,事件日志还可以记录的事件属性,如客户类型和成本,这些属性在不同的流程和信息系统中是不同的。
[0033]让分别代表案例的集合、活动的集合、时间戳的集合以及资源的集合,每个事件日志EL=(E,Att,π)都拥有四个基本属性:对于事件对于事件是事件e所属的案例,是事件e对应的活动任务,是事件e对应的时间戳属性,是事件e对应的资源属性值。
[0034]S2、学习业务流程工作内容,具体为:
[0035]S2.1、制定感兴趣的内容作为日志的工作内容,例如:案例类型、活动名称、时间类型,并将其作为一个元组来表达事件的工作内容。案例类型通常拥有:案例号、案例是否成功、案例成本、客户级别、案例报价等等;时间类型通常有:星期几、上下午、具体时辰(24小时制)等。
[0036]工作内容co=(ct,at,tt)
[0037]工作内容由一个案例类型、一个活动名称和时间戳组成。每个co元组都描述了流
程中某个事件被执行的方式和具体内容。
[0038]其中,co代表某一个事件的工作内容,ct表示案例类型、at表示活动名称、tt表示时间戳,由这三个属性值构成的元组,表示该事件的工作内容。
[0039]S2.2、学习表达工作内容的元组(由日志三个属性构成),对DataFrame类型日志中的每个事件e进行逐个遍历,统计对应事件e的三个属性的属性值,即为三个属性的类别。与此同时,三个属性类别的不同组合构成了不同的工作内容。
[0040]S3、获取资源日志数据,具体为:利用初始的DataFrame类型的事件日志,以及S2学习的工作内容集合,计算每一个事件日志的资源日志。
[0041]对DataFrame类型的事件日志中的每个事件e依次遍历,过滤不具有具体属性信息的事件日志,提取每个事件的资源属性值r,并对应该事件e的工作内容co,注意每一个资源日志对应的格式为(r,(ct,at,tt)),其中如下表1资源事件日志示例所示。该示例中,案例类型选用的是客户级别,时间类型选用的是上下午类型。
[0042]表1:资源事件日志示例
[0043][0044][0045]S4、获取资源特征矩阵profiles,并作为数据集,具体为:根据S3的资源日志,统计每个资源在所有工作内容co中出现的频率,构成资源特征矩阵,该矩阵行索引为资源类型值,列索引为工作内容co,如下表2为资源特征矩阵示例。获得的资源特征矩阵即为数据集。
[0046]表2:资源特征矩阵示例
[0047][0048]S5、划分测试数据集和训练数据集,具体为,将获取到的资源特征本文档来自技高网
...

【技术保护点】

【技术特征摘要】
两个点的坐标值,对应资源特征矩阵中的特征值,j表示,该点有j个坐标值,即资源特征矩阵有j个特征。6.根据权利要求4所述的基于聚类的业务过程资源组织挖掘方法,其特征在于,各个维度的均值center,计算公式如下:node
i
表示类簇中的某个点,q表示该类簇共有q个点。7.根据权利要求1所述的基于聚类的业务过程资源组织挖掘方法,其特征在于,利用重叠聚类模型挖掘业务流程组织结构,并判断模型有效性,具体为:设置模型需要查找的模型组数n_group,作为先验数据,将资源特征矩阵profiles的训练数据集train_set作为输入,同样的依据由train_set进行Kmeans初始化得到的分类结果,获得资员的分类矩阵;将资源分类矩阵输入重叠聚类模型;搭建MOC重叠聚类模型,设置模型结果是否为重叠模型is_disjoint,输入值为布尔类型,false为非重叠模型,true为重叠模型;返回资源分类矩阵m_best作为模型的训练结果;判断挖掘的模型是否有效,遍历资源分类矩阵m_best,判断每一个资源是否至少属于一个资源组,若是,则模型有效,若不是,则模型无效。8.根据权利要求1所述的基于聚类的业务过程资源组织挖掘方法,其特征在于,利用测试数据评估组织模型,具体为:依据挖掘的重叠聚类模型,计算各个分组的聚类质心cluster_centroids,利用测试数据test_set,计...

【专利技术属性】
技术研发人员:施伟伟刘庭煜焦磊
申请(专利权)人:南京理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1