支持RPA和基于图神经网络的活动分类方法及系统技术方案

技术编号：44614628 阅读：11 留言：0更新日期：2025-03-14 13:07

本发明专利技术公开了一种支持RPA和基于图神经网络的活动分类方法及系统。本发明专利技术依据输出的重构特征再进行聚类的操作，能够有效地处理用户操作行为日志中多轨迹交错、存在复杂流程时分类效果不佳的问题。本发明专利技术在构建模型时，将边和节点信息融合进注意力机制，所得的消息特征表示综合考虑了上下文的节点和边之间关系和更复杂的语义信息，所得到的重构向量可以更加准确表示活动之间的交互，从而有利于对用户操作行为日志的复杂轨迹任务进行正确分类。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及机器人自动化领域，尤其涉及一种支持rpa(机器人流程自动化)和基于图神经网络的活动分类方法及系统。

技术介绍

1、随着企业数字化转型的推进，企业业务流程中出现大量的重复性任务成为企业发展的瓶颈，机器人自动化能够满足这种需求并减少人力开销，降低任务的执行成本并且提高任务执行效率，提高企业竞争力，对于企业的发展具有显著影响。

2、机器人流程自动化（robotic process automation，简称rpa）是一项流程自动化技术，适用于处理大量重复性任务的场景。这些场景通常具有明显的操作规则和标准化的流程，如生成报表，信息录入，处理订单等。机器人流程自动化能够有效地替代人力执行任务。当前，实现机器人流程自动一般分为以下4个步骤：(1)获取用户操作行为日志；(2)从用户操作行为日志中提取可重复执行任务；(3)生成可自动执行的任务代码；(4)执行任务代码并进行监控。

3、活动分类是指将用户操作行为日志中记录的各个活动按其所属的任务进行归类。其中，将相似度高的共享活动和相似度低的决策活动划分到同一任务中，从而有利于形成正确的轨迹。这里，任务是指为了达成某个目的而进行的一系列操作集合(例如将excel表格中记录的一系列用户信息转录至web网页)的总称、可以用流程模型表示；活动是指用户在应用程序界面上发生的一次具体操作(例如点击某个按钮、拷贝某项数据、粘贴某项内容等操作记录)，不同的活动可能属于同一个事件(例如点击、拷贝、粘贴等)；而轨迹是指多个活动按照时间顺序形成的一条操作路径(例如点击→粘贴→拷贝→点击→粘贴等)。

4、在实际应用中，一份用户操作行为日志往往存在多条轨迹交错执行的情况，如相同的事件在不同的轨迹中出现；决策点出现也可能导致不能正确识别复杂的单轨迹。这种情况使得传统的过程挖掘算法无法有效挖掘出清晰并且正确的可执行流程模型。因此，机器人流程自动化的核心之一在于如何正确识别用户操作行为日志中隐藏的不同轨迹中的活动所属的任务，从而有助于后续得到正确的轨迹。

5、目前国内外已有的活动分类研究主要聚焦于发现频繁模式、构建直接跟随图等方法。上述方法仅仅适应简单任务场景，但对于多流程轨迹交错执行场景，仍存在一定的局限性。

技术实现思路

1、本专利技术针对多流程轨迹交错执行、进而引发活动分类不准确的问题，提出一种支持机器人流程自动化和基于图神经网络的活动分类方法及系统。

2、本专利技术的第一方面，提供了一种支持rpa和基于图神经网络的活动分类方法，包括以下步骤：

3、收集多轨迹交错执行情况下的用户与应用程序的交互日志；

4、基于交互日志构建流程异构图，其中图的每个节点代表用户的不同活动、边代表两个活动之间的关系；

5、将节点标签添加到流程异构图中，节点标签代表活动所属任务；

6、基于流程异构图，构建包含输入层、多个图神经网络层、输出层的模型；

7、计算图神经网络层中的查询向量、键向量、值向量，通过融合边特征的自定义消息函数计算注意力分数，用来衡量输入的各个节点特征的重要性和相关性，融合注意力分数聚合得到重构的节点特征；

8、设置自定义的对比损失函数，使用图对比学习方法，将经过图神经网络层处理后的重构节点特征作为输入，计算对比损失；

9、将流程异构图作为模型的输入，通过对比损失函数，优化并调整模型参数，得到最终模型和优化后的节点特征；

10、利用谱聚类和k - 均值算法对优化后的节点特征进行聚类，得到各个活动所属的任务。

11、本专利技术的第二方面，提供了一种支持rpa和基于图神经网络的活动分类系统，包括：

12、日志收集模块，用于收集多轨迹交错执行情况下的用户与应用程序的交互日志；

13、图构建模块，用于基于交互日志构建流程异构图；

14、标签添加模块，用于将节点标签添加到流程异构图中；

15、模型构建模块，用于基于流程异构图构建包含输入层、多个图神经网络层、输出层组成的模型；

16、特征计算模块，用于计算图神经网络层中的查询向量、键向量、值向量，通过融合边特征的自定义消息函数计算注意力分数，融合注意力分数聚合得到重构的节点特征；

17、损失计算模块，用于设置自定义的对比损失函数，使用图对比学习方法，将经过图神经网络层处理后的重构节点特征作为输入，计算对比损失；

18、模型优化模块，用于将流程异构图作为模型的输入，通过对比损失函数，优化并调整模型参数，得到最终模型和优化后的节点特征；

19、聚类模块，用于利用谱聚类和k-均值算法对优化后的节点特征进行聚类，得到各个活动所属的任务。

20、本专利技术的第三方面，提供了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现上述活动分类方法。

21、本专利技术的有益效果：本专利技术依据输出的重构特征再进行聚类的操作，能够有效地处理用户操作行为日志中多轨迹交错、存在复杂流程时分类效果不佳的问题。本专利技术在构建模型时，将边和节点信息融合进注意力机制，所得的消息特征表示综合考虑了上下文的节点和边之间关系和更复杂的语义信息，所得到的重构向量可以更加准确表示活动之间的交互，从而有利于对用户操作行为日志的复杂轨迹任务进行正确分类。

本文档来自技高网...

【技术保护点】

1.支持RPA和基于图神经网络的活动分类方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的方法，其特征在于，所述交互日志中的活动按照时间戳进行升序排序，事件采用事件术语定义。

3.根据权利要求1所述的方法，其特征在于，所述构建流程异构图时，对活动中的URL进行处理，移除其前缀，以减少不同任务之间的相似性。

4.根据权利要求3所述的方法，其特征在于，使用Word2Vec模型将每个活动的描述转化为固定维度的向量表示，上下文窗口大小设置为2，同时设置最小词频为1。

5.根据权利要求1所述的方法，其特征在于，所述图神经网络层中，多头注意力机制中的查询向量、键向量、值向量的定义如下：

6.根据权利要求5所述的方法，其特征在于，所述计算注意力分数的消息函数定义如下：

7.根据权利要求1至6中任一项所述的方法，其特征在于，设置自定义的对比损失函数，计算对比损失函数的步骤包括：

8.根据权利要求1所述的方法，其特征在于，所述对优化后的节点特征进行聚类的步骤包括：

9.支持RPA和基于图神经网络

10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现如权利要求1至8任一项所述的支持RPA和基于图神经网络的活动分类方法。

...

【技术特征摘要】

1.支持rpa和基于图神经网络的活动分类方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的方法，其特征在于，所述交互日志中的活动按照时间戳进行升序排序，事件采用事件术语定义。

3.根据权利要求1所述的方法，其特征在于，所述构建流程异构图时，对活动中的url进行处理，移除其前缀，以减少不同任务之间的相似性。

4.根据权利要求3所述的方法，其特征在于，使用word2vec模型将每个活动的描述转化为固定维度的向量表示，上下文窗口大小设置为2，同时设置最小词频为1。

5.根据权利要求1所述的方法，其特征在于，所述图神经网络层中，多头注意力机制中的...

【专利技术属性】
技术研发人员：俞东进，徐闻如，张枨，程玉莹，
申请(专利权)人：杭州电子科技大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人