【技术实现步骤摘要】
数据处理方法、装置、计算机、存储介质及程序产品
[0001]本申请涉及计算机
,尤其涉及一种数据处理方法、装置、计算机、存储介质及程序产品。
技术介绍
[0002]计算引擎(Apache Spark,简称Spark)是一种用于大数据工作负载处理的分布式开源系统,Spark数据处理任务的执行效率及成本开销等,依赖于Spark参数配置的选择,因此,Spark参数配置就极为重要。目前,一般是利用机器学习算法
‑
随机森林对配置和执行结果之间的关系进行建模,通过建立的模型进行Spark参数配置的选取,而在这一方式下,建模过程依赖大量配置的离线验证结果,会引入不小的额外调优开销,提高了数据处理的资源损耗,降低了数据处理的效率。而且,对于不同的调优目的,需要建立不同的模型,进一步提高了数据处理的资源损耗,且由于模型的针对性,降低了数据处理的通用性。
技术实现思路
[0003]本申请实施例提供了一种数据处理方法、装置、计算机、存储介质及程序产品,可以提高数据处理的效率及精确性,进而提高针对业务的执行性能。
[0004]本申请实施例一方面提供了一种数据处理方法,该方法包括:响应针对第一业务的执行请求,从配置管理集群中获取第一配置信息,对第一配置信息进行配置调整,生成第二配置信息;采用第二配置信息执行第一业务,获取第一业务在执行过程中所产生的第一业务指标;第一业务指标用于表示执行第一业务所耗费的资源;将第二配置信息与第一业务指标关联存储至配置管理集群中。
[0005]本申请实施例一 ...
【技术保护点】
【技术特征摘要】
1.一种数据处理方法,其特征在于,所述方法包括:响应针对第一业务的执行请求,从配置管理集群中获取第一配置信息,对所述第一配置信息进行配置调整,生成第二配置信息;采用所述第二配置信息执行所述第一业务,获取所述第一业务在执行过程中所产生的第一业务指标;所述第一业务指标用于表示执行所述第一业务所耗费的资源;将所述第二配置信息与所述第一业务指标关联存储至所述配置管理集群中。2.如权利要求1所述的方法,其特征在于,所述响应针对第一业务的执行请求,从配置管理集群中获取第一配置信息,包括:响应针对第一业务的执行请求,生成用于获取配置信息的随机参数;若所述随机参数小于配置选取阈值,则从配置管理集群中随机获取配置信息作为第一配置信息;若所述随机参数大于或等于所述配置选取阈值,则获取所述配置管理集群所包括的配置信息及所述配置信息对应的业务指标,将业务指标最小的配置信息确定为第一配置信息。3.如权利要求1所述的方法,其特征在于,所述响应针对第一业务的执行请求,从配置管理集群中获取第一配置信息,包括:响应针对第一业务的执行请求,查找配置管理集群;若未查找到所述配置管理集群,则生成M个初始配置信息,基于所述M个初始配置信息初始化所述配置管理集群,基于初始化后的配置管理集群,获取第一配置信息;所述M个初始配置信息包括所述第一配置信息;M为正整数;若查找到所述配置管理集群,则从所述配置管理集群中获取第一配置信息。4.如权利要求3所述的方法,其特征在于,所述方法还包括:将所述M个初始配置信息添加至配置队列中;所述基于初始化后的配置管理集群,获取第一配置信息,包括:若所述配置队列不为空,则对所述配置队列中的初始配置信息进行出队处理,将出队的初始配置信息确定为第一配置信息;若所述配置队列为空,则从初始化后的配置管理集群中获取第一配置信息。5.如权利要求1所述的方法,其特征在于,所述方法还包括:查找配置队列,若所述配置队列为空或不存在所述配置队列,则执行所述从配置管理集群中获取第一配置信息的过程;若所述配置队列不为空,则对所述配置队列中的初始配置信息进行出队处理,将出队的初始配置信息确定为第三配置信息,采用所述第三配置信息执行所述第一业务,获取所述第一业务在执行过程中所产生的第二业务指标,将所述第二业务指标与所述配置管理集群中的所述第三配置信息进行关联存储。6.如权利要求1所述的方法,其特征在于,所述获取所述第一业务在执行过程中所产生的第一业务指标,包括:获取所述第一业务在执行过程中所产生的A个业务指标,获取配置约束条件;A为正整数;基于所述配置约束条件确定所述A个业务指标分别对应的指标系数,采用所述A个业务
指标分别对应的指标系数,对所述A个业务指标进行加权整合,得到第一业务指标。7.如权利要求6所述的方法,其特征在于,所述A个业务指标包括资源损耗指标及执行时长指标;所述获取所述第一业务在执行过程中所产生的A个业务指标,包括:将采用所述第二配置信息执行所述第一业务所耗费的时长,确定为所述执行时长指标;获取所述第一业务在执行过程中所耗费的内存数量及处理使用量,获取资源调整系数,采用所述资源调整系数对所述内存数量及所述处理使用量进行整合,得到所述资源损耗指标。8.如权利要求1所述的方法,其特征在于,所述第一业务指标由资源损耗指标及执行时长指标组成;所述方法还包括:获取资源损耗阈值及执行时长阈值,若所述资源损耗指标小于或等于所述资源损耗阈值,且所述执行时长指标小于或等于所述执行时长阈值,则执行所述将所述第二配置信息与所述第一业务指标关联存储至所述配置管理集群中的过程;若所述资源损耗指标大于所述资源损耗阈值,或所述执行时长指标大于所述执行时长阈值,则删除所述第二配置信息。9.如权利要求1所述的方法,其特征在于,所述方法还包括:获取所述配...
【专利技术属性】
技术研发人员:黎洋,方懿德,杨晓峰,陈鹏,蒋杰,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。