System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术属于流程表单设计,具体涉及轻量化流程表单智能预测方法及系统。
技术介绍
1、目前,当下常见的流程引擎中表单搭建主要有四种方式:
2、1.新建表单,通过前端页面的表单搭建工具(常见是拖拉的方式)逐个组件的搭建表单;
3、2.复制现有的表单,再对复制后的表单通过页面的表单搭建工具进行修改;
4、3.通过识别文件(word、图片)自动创建表单,再通过页面的表单搭建工具进行修改;
5、4.基于ai大模型来辅助表单建模,通过智能问答方法产生多个假设性答案供用户选择,指导用户搭建表单;
6、以上方式中除第一种是完全由零开始搭建外,其他方式都基于现有的表单、文档或者数据生成表单,结合后续的手动调整完成表单搭建。其中第四种方式在后续的调整中提供了ai大模型的智能化推荐的功能,同样致力于在表单生成和后续调整过程中给予用户智能化的体验,提供一种覆盖表单搭建全周期的表单预测服务,。
7、然而,已知ai大模型的训练需要获取大量完整的业务数据,而多数企业的业务数据因为存在敏感信息而无法提供完整的业务数据供大模型训练学习;此外企业不同业务系统在数据层面对业务逻辑的表达也存在较大差异,这种差异会影响录入数据的有效性,进而会影响训练结果的准确性;随着企业的发展会存在组织和业务的变动,表单的组成也会存在大批量的更新,ai大模型相应的需要新的微调或者重新训练,更新成本会比较高。
8、综上,在企业级表单建模场景中ai技术的结合也仅仅是应用了大模型的通用语义理解能力,但是因为
9、基于上述问题,设计一种使用户能够便捷的搭建表单,并对搭建过程提供智能化预测,且训练过程不依赖大量业务数据,能够快速适配不断变化企业业务需要的轻量化流程表单智能预测方法及系统,就显得十分重要。
技术实现思路
1、本专利技术是为了克服现有技术中,现有表单搭建方法存在训练过程需依赖大量业务数据,更新成本高以及难以满足企业应用场景需要的问题,提供了一种使用户能够便捷的搭建表单,并对搭建过程提供智能化预测,且训练过程不依赖大量业务数据,能够快速适配不断变化企业业务需要的轻量化流程表单智能预测方法及系统。
2、为了达到上述专利技术目的,本专利技术采用以下技术方案:
3、轻量化流程表单智能预测方法,包括如下步骤;
4、s1,从各个业务系统获取结构统一的流程实体信息和组件实体信息,并组成数据集;
5、s2,生成模型字典,根据数据集并通过机器学习方法对模型字典进行增强训练,获得数据字典;所述数据字典具有数据匹配功能;
6、s3,根据不同企业的需求,在系统中导入数据字典,用于提供轻量的数据模型服务;所述数据模型服务包括预测组件列表和输出流程表单。
7、作为优选,步骤s1中,所述流程实体信息包括流程id和流程名称;所述组件实体信息包括组件id、组件名称、组件类型和排序号。
8、作为优选,步骤s2包括如下步骤:
9、s21,从数据集获取实体信息,并对流程名称和组件名称进行分词,生成语义上的词元;同时维护流程模板和组件列表的关系,允许通过流程id获取到流程信息及所有组件,允许通过流程名称的词元获取到所有关联的组件,允许通过流程名称的词元获取所有带相同词元的流程模板,允许通过组件词元获取同词元的组件列表;其中,所述词元指文本按语义分解后,生成的多个单字或词组;
10、s22,对流程名称产生的词元进行排列组合,并利用tf-idf算法统计流程词元组合对应关联组件词元的权值,筛选出流程词元组合对应的关键组件词元,并存入模型字典;
11、s23,将流程词元组合对应的流程模板列表作为过滤范围,从关键组件词元对应的组件列表中过滤出存在于对应流程模板范围内的组件,从而获取到流程词元组合对应的关键组件列表;
12、s24,采用tf-idf算法,对关键组件列表中的组件词元做算法统计,获取词元权重;
13、s25,对关键组件列表中的组件进行相似度计算,保留相似度大于设定阈值的组件,得到相似组件列表;再通过步骤s24中获取的词元权重,给相似组件列表中的组件赋上权重值,用于后续选择需要保留的组件,实现相似度去重;所述相似度计算采用余弦相似性计算;
14、s26,合并流程词元组合与关键组件词元,采用fp-growth算法对合并的流程词元组合与关键组件词元进行关联规则挖掘,获取高关联度的词元关系组合,并对所述词元关系组合内关联的组件进行步骤s25的相似度去重处理操作;
15、s27,生成流程词元组合与关键组件列表映射的数据字典;所述数据字典支持通过行业信息,流程名称关键字获取匹配的组件列表;所述数据字典支持基于步骤s26中流程词元和组件词元的关联关系,实现用户输入组件名称,推荐高关联度词元对应的组件。
16、作为优选,步骤s25中,所述相似度去重具体指对相似组件列表中的每个组件取词元权重的最大值,保留对应词元权重的最大值为最大的组件;所述词元权重的最大值通过累加一个组件包含的所有词元的权重值获得。
17、作为优选,步骤s27包括如下步骤:
18、s271,依据步骤s26的结果构建初始数据集,即组件实体与对应所有相似度大于设定阈值的关键组件词元的组合;
19、s272,对组件实体的分类名再次进行分类,并将分类后的数据再合并入步骤s271中的数据集;
20、s273,根据步骤s26中获得的词元关系组合,获取对应的分类标签集合,并对分类标签进行排序编号,生成词元关系组合的标签向量;每个标签向量是一个形状为(n_sames,n_class)的数组,n_sames表示对应词元,n_class表示对应标签数;
21、s274,按预设的比例,将对步骤s272获得的数据集拆分成训练集和测试集;根据训练集,并利用机器学习中的多标签分类方法,对模型字典进行训练,获得数据字典;训练过程中,输入参数x词元向量,参数y标签向量,分类器选择朴素贝叶斯分类器,模型字典的模型选择为线性支持向量机模型;
22、s275,将测试集输入数据字典得到测试结果集,与原测试集的标签向量构建混淆矩阵,查看预测值与标签值的差异;
23、s276,通过数据字典预测当前系统已有的组件或用户新建的组件对应的词元标签,并将组件实体和词元的关系存入数据字典中。
24、作为优选,步骤s3中,所述输出流程表单包括如下过程:
25、当用户创建流程模板后,通过对流程名称的词元,从数据字典中匹配出组件列表;同时根据组件本身和关联的相似组件列表中组件的排序,合并计算出最终的组件排列,而组件类型依据组件本身和相似组件列表中高频的类型作为最终类型,由此预测出一个完整的流程表单;所述计算出最终的组件排列具体指求每一个组件排序号的标准差,去掉离散本文档来自技高网...
【技术保护点】
1.轻量化流程表单智能预测方法,其特征在于,包括如下步骤;
2.根据权利要求1所述的轻量化流程表单智能预测方法,其特征在于,步骤S1中,所述流程实体信息包括流程ID和流程名称;所述组件实体信息包括组件ID、组件名称、组件类型和排序号。
3.根据权利要求2所述的轻量化流程表单智能预测方法,其特征在于,步骤S2包括如下步骤:
4.根据权利要求3所述的轻量化流程表单智能预测方法,其特征在于,步骤S25中,所述相似度去重具体指对相似组件列表中的每个组件取词元权重的最大值,保留对应词元权重的最大值为最大的组件;所述词元权重的最大值通过累加一个组件包含的所有词元的权重值获得。
5.根据权利要求3所述的轻量化流程表单智能预测方法,其特征在于,步骤S27包括如下步骤:
6.根据权利要求5所述的轻量化流程表单智能预测方法,其特征在于,步骤S3中,所述输出流程表单包括如下过程:
7.根据权利要求6所述的轻量化流程表单智能预测方法,其特征在于,步骤S3中,所述预测组件列表包括如下过程:
8.轻量化流程表单智能预测系统,
...【技术特征摘要】
1.轻量化流程表单智能预测方法,其特征在于,包括如下步骤;
2.根据权利要求1所述的轻量化流程表单智能预测方法,其特征在于,步骤s1中,所述流程实体信息包括流程id和流程名称;所述组件实体信息包括组件id、组件名称、组件类型和排序号。
3.根据权利要求2所述的轻量化流程表单智能预测方法,其特征在于,步骤s2包括如下步骤:
4.根据权利要求3所述的轻量化流程表单智能预测方法,其特征在于,步骤s25中,所述相似度去重具体指对相似组件列表中的每个组件取词元权重的最大值,保留对应词元权重的最大值为最大的组件;所述词元权...
【专利技术属性】
技术研发人员:李子彦,韩彤,俞哲峰,
申请(专利权)人:杭州微宏科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。