System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 数据处理方法、装置和分布式数据处理系统制造方法及图纸_技高网

数据处理方法、装置和分布式数据处理系统制造方法及图纸

技术编号:41814816 阅读:1 留言:0更新日期:2024-06-24 20:31
本说明书的实施例提供了一种数据处理方法、装置和分布式数据处理系统。在应用于基于Ray的分布式数据处理系统的有状态数据处理装置的数据处理方法中,响应于接收到有状态数据处理任务,执行有状态数据处理任务中的数据处理操作,有状态数据处理任务通过对程序源代码进行解析得到;确定数据处理操作的处理结果所对应的对象标识;以及根据所确定的对象标识,将数据处理操作的处理结果以对象标识‑数据对象的形式存储到本地存储空间中。

【技术实现步骤摘要】

本说明书实施例通常涉及计算机,尤其涉及数据处理方法、装置和分布式数据处理系统


技术介绍

1、随着数据规模越来越大以及对计算的要求越来越高,分布式数据处理技术得到飞速的发展。基于分布式计算框架ray的数据处理系统可以通过调度来将不同的任务(task)分配到相应的任务处理装置(worker)来处理。


技术实现思路

1、鉴于上述,本说明书实施例提供了一种数据处理方法、装置和分布式数据处理系统。利用该方法、装置和系统,可以实现对数据的高效处理。

2、根据本说明书的实施例的一个方面,提供一种数据处理方法,应用于基于ray的分布式数据处理系统的有状态数据处理装置,所述数据处理方法包括:响应于接收到有状态数据处理任务,执行所述有状态数据处理任务中的数据处理操作,所述有状态数据处理任务通过对程序源代码进行解析得到;确定所述数据处理操作的处理结果所对应的对象标识;以及根据所确定的对象标识,将所述数据处理操作的处理结果以对象标识-数据对象的形式存储到本地存储空间中。

3、根据本说明书的实施例的又一个方面,提供一种有状态数据处理装置,包括:执行单元,被配置为响应于接收到有状态数据处理任务,执行所述有状态数据处理任务中的数据处理操作,所述有状态数据处理任务通过对程序源代码进行解析得到以及存储单元,被配置为确定所述数据处理操作的处理结果所对应的对象标识;以及根据所确定的对象标识,将所述数据处理操作的处理结果以对象标识-数据对象的形式存储到本地存储空间中。

4、根据本说明书的实施例的另一方面,提供一种基于ray的分布式数据处理系统,包括:调度装置,被配置为将通过对程序源代码进行解析而生成的有状态数据处理任务和至少一个数据使用任务分别调度给第一有状态数据处理装置和至少一个第二数据处理装置来执行;第一有状态数据处理装置,被配置为响应于接收到有状态数据处理任务,执行所述有状态数据处理任务中的数据处理操作;确定所述数据处理操作的处理结果所对应的对象标识;以及根据所确定的对象标识,将所述数据处理操作的处理结果以对象标识-数据对象的形式存储到本地存储空间中;以及第二数据处理装置,被配置为执行所接收到的数据使用任务中的数据使用操作。

5、根据本说明书的实施例的另一方面,提供一种数据处理装置,包括:至少一个处理器,以及与所述至少一个处理器耦合的存储器,所述存储器存储指令,当所述指令被所述至少一个处理器执行时,使得所述至少一个处理器执行如上所述的数据处理方法。

6、根据本说明书的实施例的另一方面,提供一种计算机可读存储介质,其存储有计算机程序,所述计算机程序被处理器执行时实现如上所述的数据处理方法。

7、根据本说明书的实施例的另一方面,提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行来实现如上所述的数据处理方法。

本文档来自技高网...

【技术保护点】

1.一种数据处理方法,应用于基于Ray的分布式数据处理系统的有状态数据处理装置,所述数据处理方法包括:

2.如权利要求1所述的数据处理方法,其中,在所述本地存储空间中维护对象标识-数据对象对应表,

3.如权利要求1所述的数据处理方法,其中,在所述本地存储空间中维护对象标识-数据对象对应表,所述数据处理方法还包括:

4.如权利要求2所述的数据处理方法,还包括:

5.如权利要求1所述的数据处理方法,其中,所述数据处理操作具有根据所述数据处理操作的操作上下文而确定的原地操作性指示信息,

6.如权利要求1所述的数据处理方法,其中,在所述本地存储空间中维护对象标识-数据对象对应表,

7.如权利要求2所述的数据处理方法,其中,所述对象标识包括全局对象标识,所述从所述对象标识-数据对象对应表中获取所述数据处理操作所涉及的数据对象所对应的对象标识包括:

8.如权利要求7所述的数据处理方法,其中,所述根据所述对象标识从本地存储空间和/或异地存储空间的存储区域获取所述数据处理操作所针对的数据对象的对象值包括:

9.如权利要求2所述的数据处理方法,其中,所述对象标识包括局部对象标识,以及在控制装置处维护数据对象-数据处理装置对应表,

10.如权利要求2所述的数据处理方法,其中,所述对象标识包括局部对象标识,以及在控制装置处维护全局对象标识-数据对象对应表,

11.一种有状态数据处理装置,包括:

12.如权利要求11所述的数据处理装置,其中,在所述本地存储空间中维护对象标识-数据对象对应表,所述存储单元进一步被配置为:

13.如权利要求11所述的数据处理装置,其中,所述数据处理装置还包括:

14.一种基于Ray的分布式数据处理系统,包括:

15.如权利要求14所述的分布式数据处理系统,其中,所述分布式数据处理系统还包括控制装置,

16.一种数据处理装置,包括:至少一个处理器,与所述至少一个处理器耦合的存储器,以及存储在所述存储器上的计算机程序,所述至少一个处理器执行所述计算机程序来实现如权利要求1到10中任一所述的数据处理方法。

...

【技术特征摘要】

1.一种数据处理方法,应用于基于ray的分布式数据处理系统的有状态数据处理装置,所述数据处理方法包括:

2.如权利要求1所述的数据处理方法,其中,在所述本地存储空间中维护对象标识-数据对象对应表,

3.如权利要求1所述的数据处理方法,其中,在所述本地存储空间中维护对象标识-数据对象对应表,所述数据处理方法还包括:

4.如权利要求2所述的数据处理方法,还包括:

5.如权利要求1所述的数据处理方法,其中,所述数据处理操作具有根据所述数据处理操作的操作上下文而确定的原地操作性指示信息,

6.如权利要求1所述的数据处理方法,其中,在所述本地存储空间中维护对象标识-数据对象对应表,

7.如权利要求2所述的数据处理方法,其中,所述对象标识包括全局对象标识,所述从所述对象标识-数据对象对应表中获取所述数据处理操作所涉及的数据对象所对应的对象标识包括:

8.如权利要求7所述的数据处理方法,其中,所述根据所述对象标识从本地存储空间和/或异地存储空间的存储区域获取所述数据处理操作所...

【专利技术属性】
技术研发人员:冯皓楠胡东文张兴盟胡晓龙赵彩贝
申请(专利权)人:支付宝杭州信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1