System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 数据处理方法、装置、产品和设备制造方法及图纸_技高网

数据处理方法、装置、产品和设备制造方法及图纸

技术编号:44279916 阅读:4 留言:0更新日期:2025-02-14 22:17
本申请公开了一种数据处理方法、装置、产品和设备,该方法包括:获取操作语句的候选计划树及候选计划树的N个子树,N为正整数,候选计划树用于执行操作语句;获取数据集,数据集中包括M个历史子树在历史执行过程中各自消耗的资源数据,历史子树是历史执行过的历史计划树的子树,M为正整数;在数据集中对N个子树进行资源数据的第一匹配处理,第一匹配处理用于通过N个子树与M个历史子树之间的相似性为N个子树筛选相匹配的资源数据;基于第一匹配处理得到的第一匹配结果,确定N个子树的参考资源数据;采用N个子树的参考资源数据,预估候选计划树对应的执行代价。采用本申请,可提升对候选计划树所预估的执行代价的准确性。

【技术实现步骤摘要】

本申请涉及数据处理的,尤其涉及一种数据处理方法、装置、产品和设备


技术介绍

1、sql语句(结构化语句)是用于对数据库中的数据进行查询和操作的语句,在实际应用中,会将sql语句转化为多个候选计划树,再通过该多个候选计划树各自对应的执行代价,从该多个候选计划树中确定最终用于执行该sql语句的候选计划树。可见,sql语句的候选计划树对应的执行代价在sql语句的执行过程中有着极其重要的作用,因此,如何更为准确地获取sql语句的候选计划树对应的执行代价是一个热点问题。


技术实现思路

1、本申请提供了一种数据处理方法、装置、产品和设备,可提升对候选计划树所预估的执行代价的准确性。

2、本申请一方面提供了一种数据处理方法,该方法包括:

3、获取操作语句的候选计划树及候选计划树的n个子树,n为正整数,候选计划树用于执行操作语句;

4、获取数据集,数据集中包括m个历史子树在历史执行过程中各自消耗的资源数据,历史子树是历史执行过的历史计划树的子树,m为正整数;

5、在数据集中对n个子树进行资源数据的第一匹配处理,第一匹配处理用于通过n个子树与m个历史子树之间的相似性为n个子树筛选相匹配的资源数据;

6、基于第一匹配处理得到的第一匹配结果,确定n个子树的参考资源数据;

7、采用n个子树的参考资源数据,预估候选计划树对应的执行代价。

8、本申请一方面提供了一种数据处理装置,该装置包括:

9、第一获取模块,用于获取操作语句的候选计划树及候选计划树的n个子树,n为正整数,候选计划树用于执行操作语句;

10、第二获取模块,用于获取数据集,数据集中包括m个历史子树在历史执行过程中各自消耗的资源数据,历史子树是历史执行过的历史计划树的子树,m为正整数;

11、匹配模块,用于在数据集中对n个子树进行资源数据的第一匹配处理,第一匹配处理用于通过n个子树与m个历史子树之间的相似性为n个子树筛选相匹配的资源数据;

12、确定模块,用于基于第一匹配处理得到的第一匹配结果,确定n个子树的参考资源数据;

13、预估模块,用于采用n个子树的参考资源数据,预估候选计划树对应的执行代价。

14、在一种实施方式中,匹配模块在数据集中对n个子树进行资源数据的第一匹配处理的方式,包括:

15、对n个子树中的每个子树分别进行标准化表示处理,生成每个子树的标准表示信息;

16、基于n个子树的标准表示信息,在数据集中对n个子树进行资源数据的第一匹配处理;

17、其中,数据集中每个历史子树消耗的资源数据分别与每个历史子树各自的标准表示信息具有映射关系;n个子树的标准表示信息与m个历史子树的标准表示信息之间的相似性,用于反映n个子树与m个历史子树之间的相似性。

18、在一种实施方式中,n个子树中的任一个为第一子树,数据集中包括m个历史子树的m个标准表示信息;

19、匹配模块基于n个子树的标准表示信息,在数据集中对n个子树进行资源数据的第一匹配处理的方式,包括:

20、获取第一子树的标准表示信息分别与m个标准表示信息之间的信息相似度;

21、将m个标准表示信息中与第一子树的标准表示信息之间的信息相似度最大的标准表示信息,确定为待定表示信息;

22、若第一子树的标准表示信息与待定表示信息之间的信息相似度大于或等于设定的相似度阈值,则将数据集中与待定表示信息具有映射关系的资源数据,作为筛选出的与第一子树相匹配的资源数据;

23、其中,第一匹配结果包括筛选出的与第一子树相匹配的资源数据。

24、在一种实施方式中,匹配模块还用于:

25、若第一子树的标准表示信息与待定表示信息之间的信息相似度小于相似度阈值,则确定在数据集中未筛选出与第一子树相匹配的资源数据;

26、其中,第一匹配结果包括未在数据集中筛选出与第一子树相匹配的资源数据。

27、在一种实施方式中,n个子树均是由候选计划树的一个或多个算子节点构成的;确定模块基于第一匹配处理得到的第一匹配结果,确定n个子树的参考资源数据的方式,包括:

28、若第一匹配结果包括筛选出的与第一子树相匹配的资源数据,则将所筛选的与第一子树相匹配的资源数据,作为第一子树的参考资源数据;

29、若第一匹配结果包括未筛选出与第一子树相匹配的资源数据,则基于第一子树包含的算子节点的数量,确定第一子树的参考资源数据。

30、在一种实施方式中,确定模块基于第一子树包含的算子节点的数量,确定第一子树的参考资源数据的方式,包括:

31、当第一子树包含候选计划树的一个算子节点时,将第一子树调用的表数据所消耗的资源数据作为第一子树的参考资源数据;

32、当第一子树包含候选计划树的多个算子节点时,在数据集中对第一子树进行资源数据的第二匹配处理,并基于第二匹配处理得到的第二匹配结果,确定第一子树中的每个算子节点的参考资源数据;其中,第一子树的参考资源数据包括第一子树中的每个算子节点的参考资源数据,第二匹配处理用于通过第一子树中的每个算子节点与m个历史子树之间的相似性,为第一子树中的每个算子节点筛选相匹配的资源数据。

33、在一种实施方式中,第一子树中的任一算子节点为目标算子节点;确定模块基于第二匹配处理得到的第二匹配结果,确定第一子树中的每个算子节点的参考资源数据的方式,包括:

34、若第二匹配结果包括筛选出的与目标算子节点相匹配的资源数据,则将所筛选的与目标算子节点相匹配的资源数据,作为目标算子节点的参考资源数据;

35、若第二匹配结果包括未筛选出与目标算子节点相匹配的资源数据,则将目标算子节点调用的表数据所消耗的资源数据,作为目标算子节点的参考资源数据。

36、在一种实施方式中,n个子树中的任一个为第一子树;匹配模块对n个子树中的每个子树分别进行标准化表示处理,生成每个子树的标准表示信息的方式,包括:

37、从k个数据域对第一子树进行数据解析处理,得到第一子树在k个数据域下的表示数据;k为正整数;

38、按照设定的标准格式对第一子树在k个数据域下的表示数据进行表示处理,生成第一子树的标准表示信息;

39、其中,k个数据域包括如下至少一个:子树调用的算子对应的算子域,子树调用的表数据中的数据对象对应的对象域,子树调用的算子所包含的条件对应的条件域。

40、在一种实施方式中,第一获取模块获取候选计划树的n个子树的流程,包括:

41、识别候选计划树中的分支节点,并将分支节点下的每个分支分别划分为候选计划树的第一类型子树;

42、通过候选计划树中除第一类型子树之外的每个算子节点,分别构建候选计划树的第二类型子树,候选计划树中除第一类型子树之外的一个算子节点用于构建得到一个第二类型子树;

本文档来自技高网...

【技术保护点】

1.一种数据处理方法,其特征在于,所述方法包括:

2.如权利要求1所述的方法,其特征在于,所述在所述数据集中对所述N个子树进行资源数据的第一匹配处理,包括:

3.如权利要求2所述的方法,其特征在于,所述N个子树中的任一个为第一子树,所述数据集中包括所述M个历史子树的M个标准表示信息;

4.如权利要求3所述的方法,其特征在于,所述方法还包括:

5.如权利要求4所述的方法,其特征在于,所述N个子树均是由所述候选计划树的一个或多个算子节点构成的;所述基于所述第一匹配处理得到的第一匹配结果,确定所述N个子树的参考资源数据,包括:

6.如权利要求5所述的方法,其特征在于,所述基于所述第一子树包含的算子节点的数量,确定所述第一子树的参考资源数据,包括:

7.如权利要求6所述的方法,其特征在于,所述第一子树中的任一算子节点为目标算子节点;所述基于所述第二匹配处理得到的第二匹配结果,确定所述第一子树中的每个算子节点的参考资源数据,包括:

8.如权利要求2所述的方法,其特征在于,所述N个子树中的任一个为第一子树;所述对所述N个子树中的每个子树分别进行标准化表示处理,生成所述每个子树的标准表示信息,包括:

9.如权利要求1所述的方法,其特征在于,获取所述候选计划树的N个子树的流程,包括:

10.如权利要求1所述的方法,其特征在于,所述操作语句的候选计划树有多个,所述方法还包括:

11.如权利要求10所述的方法,其特征在于,所述数据集中每个历史子树消耗的资源数据分别与所述每个历史子树各自的标准表示信息具有映射关系,所述目标计划树的任一子树为第二子树;

12.如权利要求11所述的方法,其特征在于,所述获取所述第二子树在执行过程中所消耗的资源数据,包括:

13.如权利要求1所述的方法,其特征在于,获取所述操作语句的候选计划树的流程,包括:

14.如权利要求1所述的方法,其特征在于,所述采用所述N个子树的参考资源数据,预估所述候选计划树对应的执行代价,包括:

15.一种数据处理装置,其特征在于,所述装置包括:

16.一种计算机程序产品,其特征在于,包括计算机程序,该计算机程序被处理器执行时实现权利要求1-14中任一项所述方法的步骤。

17.一种计算机设备,其特征在于,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行权利要求1-14中任一项所述方法的步骤。

18.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序适用于由处理器加载并执行权利要求1-14中任一项所述方法的步骤。

...

【技术特征摘要】

1.一种数据处理方法,其特征在于,所述方法包括:

2.如权利要求1所述的方法,其特征在于,所述在所述数据集中对所述n个子树进行资源数据的第一匹配处理,包括:

3.如权利要求2所述的方法,其特征在于,所述n个子树中的任一个为第一子树,所述数据集中包括所述m个历史子树的m个标准表示信息;

4.如权利要求3所述的方法,其特征在于,所述方法还包括:

5.如权利要求4所述的方法,其特征在于,所述n个子树均是由所述候选计划树的一个或多个算子节点构成的;所述基于所述第一匹配处理得到的第一匹配结果,确定所述n个子树的参考资源数据,包括:

6.如权利要求5所述的方法,其特征在于,所述基于所述第一子树包含的算子节点的数量,确定所述第一子树的参考资源数据,包括:

7.如权利要求6所述的方法,其特征在于,所述第一子树中的任一算子节点为目标算子节点;所述基于所述第二匹配处理得到的第二匹配结果,确定所述第一子树中的每个算子节点的参考资源数据,包括:

8.如权利要求2所述的方法,其特征在于,所述n个子树中的任一个为第一子树;所述对所述n个子树中的每个子树分别进行标准化表示处理,生成所述每个子树的标准表示信息,包括:

9.如权利要求1所述的方法,其特征在于,获取所述候选计划树的n个子树的流程,包括:

<...

【专利技术属性】
技术研发人员:张功贯钱雁嫦马琪坤吴怡雯杨晓峰陈鹏蒋杰
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1