System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于数据的RPA代码生成方法及相关装置制造方法及图纸_技高网

一种基于数据的RPA代码生成方法及相关装置制造方法及图纸

技术编号:41931783 阅读:6 留言:0更新日期:2024-07-05 14:27
本申请公开了一种基于数据的RPA代码生成方法及相关装置,所述方法包括:获取业务需求,并从操作记录中获取有用数据;所述操作记录表示为记录用户在用户界面的所有操作信息的数据,所述有用数据表示为对生成代码有用的数据;对所述有用数据进行无损压缩预处理,得到压缩数据;将所述压缩数据和所述业务需求输入至大语言模型,获取大语言模型生成的过滤条件;其中所述过滤条件为大语言模型根据所述压缩数据和所述业务需求生成的;根据所述过滤条件,对操作记录进行过滤,得到过滤后的数据;将所述过滤后的数据和所述业务需求输入至大语言模型,获取大语言模型生成的代码,其中所述代码为大语言模型根据所述过滤后的数据和所述业务需求生成的。

【技术实现步骤摘要】

本申请涉及一种基于数据的rpa代码生成方法、装置、设备及存储介质,属于数据处理。


技术介绍

1、目前,使用大语言模型(llm)生成代码已经是一种常用的解决方案,但由于llm生成的内容往往是根据训练数据进行推理的,也就是说生成的代码往往脱离实际需求;在rpa场景下也不例外,rpa的代码往往需要使用到外界真实的数据作为参数,例如:元素的xpath、界面的窗口标题、账号密码等现实世界的数据;但llm通常是无法知道这些数据的,只是根据自己的知识去推理生成参数,这也就导致即使生成的代码逻辑正确,但由于生成的参数不存在或与实际数据不匹配,而不能正确运行rpa代码程序。

2、之前的rpa代码生成方法:根据业务需求生成代码后在虚拟环境中测试代码,用测试结果不断对代码进行更正,甚至需要人为介入提供现实世界的参数:xpath等,不断重复以上步骤直到代码成功运行。

3、随着llm模型能力的进步和上下文窗口的扩大,llm模型基本能正确生成符合业务需求逻辑的代码,而且上下文窗口大小也可容纳更多的文本信息(包括提示词和生成内容),那么现在着重需要解决的问题就是llm如何获取和使用现实世界的数据。


技术实现思路

1、当前,利用llm处理数据的方式主要是直接把数据一次性传给llm,然后根据提示词让llm通过语义理解和推理完成数据处理的任务,这种方式通常会遇到几个问题:1.数据量太大,llm的上下文窗口无法容纳;2.通过llm的推理能力推理不可靠,如同让llm完成数学计算一样,都是推理出来的,而不是算出来的,通常解决办法是外接一个计算器函数/程序,把计算部分分离出来,这样用程序计算得到的结果更准确、可靠;同样的,让llm进行数据处理,也是推理得到的处理结果,而不是真正进行准确的数据处理得到的结果。所以,把这种思想迁移到数据处理中,把执行数据处理部分分离出来,这就是本申请中数据处理部分的主要思想。

2、目的:鉴于以上技术问题中的至少一项,本申请提供一种基于数据的rpa代码生成方法及相关装置,通过提取最近与业务需求最相关的数据以利用现实世界的数据生成能正确运行的rpa代码,同时减少tokens消耗(即减少提示词对上下文窗口的占用),同时还能提高生成代码的质量(过滤掉与业务需求不相关的数据,减少噪音,能提高llm推理生成代码的准确度)。

3、技术方案:为解决上述技术问题,本申请采用的技术方案为:

4、第一方面,本申请提供了一种基于数据的rpa代码生成方法,所述方法包括:

5、获取业务需求,并从操作记录中获取有用数据;其中,所述操作记录表示为记录用户在用户界面的所有操作信息的数据,所述有用数据表示为对生成代码有用的数据;

6、对所述有用数据进行无损压缩预处理,得到压缩数据;其中,所述压缩数据表示为能够用于大语言模型生成过滤条件的数据;

7、将所述压缩数据和所述业务需求输入至大语言模型,获取大语言模型生成的过滤条件,其中所述过滤条件为大语言模型根据所述压缩数据和所述业务需求生成的;

8、根据所述过滤条件,对操作记录进行过滤,得到过滤后的数据;

9、将所述过滤后的数据和所述业务需求输入至大语言模型,获取大语言模型生成的代码,其中所述代码为大语言模型根据所述过滤后的数据和所述业务需求生成的。

10、在一些实施例中,在将所述过滤后的数据和所述业务需求输入至大语言模型之前,还包括:执行以下循环步骤,直至所述过滤后的数据达到设定要求,其中所述循环步骤包括:

11、对所述过滤后的数据进行无损压缩预处理,得到新的压缩数据;其中,所述压缩数据表示为能够用于大语言模型生成过滤条件的数据;

12、将所述压缩数据和所述业务需求输入至大语言模型,获取大语言模型生成的过滤条件,其中所述过滤条件为大语言模型根据所述压缩数据和所述业务需求生成的;

13、根据所述过滤条件,对操作记录进行过滤,得到新的过滤后的数据。

14、在一些实施例中,所述有用数据选自操作记录中最近n条数据且对生成代码有用的字段。

15、在一些实施例中,所述无损压缩预处理为对文本信息的压缩,包括:对所述有用数据进行聚合或将有用数据聚合成目标任务的关键信息。

16、在一些实施例中,若所述操作记录为在网页上的操作,所述压缩数据为一个以主域名为键,以窗口标题列表为值的字典。

17、进一步地,对应的,所述过滤条件为与业务需求相关的主域名。

18、第二方面,本申请提供了一种基于数据的rpa代码生成装置,所述装置包括:

19、数据获取模块,用于:获取业务需求,并从操作记录中获取有用数据;其中,所述操作记录表示为记录用户在用户界面的所有操作信息的数据,所述有用数据表示为对生成代码有用的数据;

20、压缩模块,用于:对所述有用数据进行无损压缩预处理,得到压缩数据;其中,所述压缩数据表示为能够用于大语言模型生成过滤条件的数据;

21、第一获取模块,用于:将所述压缩数据和所述业务需求输入至大语言模型,获取大语言模型生成的过滤条件,其中所述过滤条件为大语言模型根据所述压缩数据和所述业务需求生成的;

22、过滤模块,用于:根据所述过滤条件,对操作记录进行过滤,得到过滤后的数据;

23、第二获取模块,用于:将所述过滤后的数据和所述业务需求输入至大语言模型,获取大语言模型生成的代码,其中所述代码为大语言模型根据所述过滤后的数据和所述业务需求生成的。

24、第三方面,本申请提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现第一方面所述方法的步骤。

25、第四方面,本申请提供了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现第一方面所述方法的步骤。

26、第五方面,本申请提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现第一方面所述方法的步骤。

27、有益效果:本申请提供的基于数据的rpa代码生成方法及相关装置,具有以下优点:1、对于数据处理:将对数据的处理部分从llm中分离出来,使得llm处理大量数据成为可能,提高数据处理结果的可靠性,并且大大减少tokens的消耗,降低成本。

28、2、对于rpa代码生成:从大量操作数据中提取与业务需求最近最相关的数据,使llm能够使用现实世界的数据生成参数存在的可正确运行的rpa代码。

本文档来自技高网...

【技术保护点】

1.一种基于数据的RPA代码生成方法,其特征在于,所述方法包括:

2.根据权利要求1所述的基于数据的RPA代码生成方法,其特征在于,在将所述过滤后的数据和所述业务需求输入至大语言模型之前,还包括:执行以下循环步骤,直至所述过滤后的数据达到设定要求,其中所述循环步骤包括:

3.根据权利要求1所述的基于数据的RPA代码生成方法,其特征在于,所述有用数据选自操作记录中最近N条数据且对生成代码有用的字段。

4.根据权利要求1或2所述的基于数据的RPA代码生成方法,其特征在于,所述无损压缩预处理为对文本信息的压缩,包括:对所述有用数据进行聚合或将有用数据聚合成目标任务的关键信息。

5.根据权利要求1或2或4所述的基于数据的RPA代码生成方法,其特征在于,若所述操作记录为在网页上的操作,所述压缩数据为一个以主域名为键,以窗口标题列表为值的字典。

6.根据权利要求5所述的基于数据的RPA代码生成方法,其特征在于,所述过滤条件为与业务需求相关的主域名。

7.一种基于数据的RPA代码生成装置,其特征在于,所述装置包括:

8.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6任一项所述方法的步骤。

9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6任一项所述方法的步骤。

10.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至6任一项所述方法的步骤。

...

【技术特征摘要】

1.一种基于数据的rpa代码生成方法,其特征在于,所述方法包括:

2.根据权利要求1所述的基于数据的rpa代码生成方法,其特征在于,在将所述过滤后的数据和所述业务需求输入至大语言模型之前,还包括:执行以下循环步骤,直至所述过滤后的数据达到设定要求,其中所述循环步骤包括:

3.根据权利要求1所述的基于数据的rpa代码生成方法,其特征在于,所述有用数据选自操作记录中最近n条数据且对生成代码有用的字段。

4.根据权利要求1或2所述的基于数据的rpa代码生成方法,其特征在于,所述无损压缩预处理为对文本信息的压缩,包括:对所述有用数据进行聚合或将有用数据聚合成目标任务的关键信息。

5.根据权利要求1或2或4所述的基于数据的rpa代码生成方法,其特征在于,若所述操作记录...

【专利技术属性】
技术研发人员:林平吴鑫唐琦松曾俊铭
申请(专利权)人:上海艺赛旗软件股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1