【技术实现步骤摘要】
基于yarn调度的flink参数优化方法、系统、设备和存储介质
[0001]本申请涉及流计算
,特别是涉及一种基于yarn调度的flink参数优化方法、系统、设备和存储介质。
技术介绍
[0002]Flink是一种分布式处理引擎,它以数据并行和流水线方式执行任意流数据程序,用于对无界和有界数据流进行有状态的计算,因此在实时统计、分析或推荐领域有许多应用。同时,在实际应用时为了充分利用应用资源,通常还需要对flink应用的参数配置进行优化。
[0003]现有技术中,通常是根据固定的配置策略,人为设置flink应用的参数,实现静态资源配置,那么在flink应用运行过程中,就无法根据实际运行情况再调整参数进行优化。
[0004]针对相关技术中存在无法根据运行情况进行参数动态优化的问题,目前还没有提出有效的解决方案。
技术实现思路
[0005]在本实施例中提供了一种基于yarn调度的flink参数优化方法、系统、设备和存储介质,以解决相关技术中的问题。
[0006]第一个方面,在本实施例中提供了一种基于yarn调度的flink参数优化方法,其特征在于,包括:
[0007]获取任务请求,根据所述任务请求通过yarn集群启动flink应用;
[0008]实时获取所述flink应用运行过程中的指标参数;
[0009]基于所述指标参数能否满足规格要求的情况,根据相应的预设调整策略对所述flink应用的初始参数进行动态优化。
[0010]在其中的一些实施例中 ...
【技术保护点】
【技术特征摘要】
1.一种基于yarn调度的flink参数优化方法,其特征在于,包括:获取任务请求,根据所述任务请求通过yarn集群启动flink应用;实时获取所述flink应用运行过程中的指标参数;基于所述指标参数能否满足规格要求的情况,根据相应的预设调整策略对所述flink应用的初始参数进行动态优化。2.根据权利要求1所述的基于yarn调度的flink参数优化方法,其特征在于,所述初始参数,包括TaskManager数量、每个TaskManager上slot数量、每个TaskManager使用cpu核的数量以及每个TaskManager使用的内存。3.根据权利要求1所述的基于yarn调度的flink参数优化方法,其特征在于,所述基于所述指标参数能否满足规格要求的情况,根据相应的预设调整策略对所述flink应用的初始参数进行动态优化,包括:当所述指标参数不满足所述规格要求时,根据相应的预设调整策略对所述初始参数进行调整,得到第一优化参数;若所述第一优化参数满足所述规格要求,则进一步对所述第一优化参数进行优化,得到第二优化参数;若所述第一优化参数不满足所述规格要求,则报警异常。4.根据权利要求3所述的基于yarn调度的flink参数优化方法,其特征在于,所述对所述初始参数进行调整,得到第一优化参数,包括:将所述初始参数中TaskManager数量翻倍,同时保持所述初始参数中每个TaskManager上slot数量和每个TaskManager使用cpu核的数量不变;当所述指标参数中吞吐量达到所述规格要求时,得到所述第一优化参数;当所述指标参数中吞吐量未达到所述规格要求,且所述TaskManager数量达到上限时,再将所述每个TaskManager上slot数量和所述每个TaskManager使用cpu核的数量翻倍,直到所述吞吐量达到所述规格要求,得到所述第一优化参数。5.根据权利要求3所述的基于yarn调度的flink参数优化方法,其特征在于,所述进一步对所述第一优化参数进行优化,得到第二优化参数,包括:通过二分法将所述第一优化参数中TaskManager数量减半,同时将所述第一优化参数中每个TaskManager上slot数量和每个TaskManager使用cpu核的数量翻倍,直到所述cpu核数量超过上限;当所述cpu核数量超过上限且所述指标参数中吞吐量达到所述规格要求时,所述yarn集群无法提供更多应用资源,将超过上限前一次的所述第一优化参数作为所述第二优化参数。6.根据权利要求3所述的基于yarn调度的flink参数优化方法,其特征在于,还包括:在能够达到业务要求的情况下,通过二分法将所述第二优化参数中每个TaskManager使用cpu核的数量减半,再将所述第二优化参数中每个TaskManager使用的内存作适应性调整,以达到使用最少内存满足业务要求,得到第三优化参数。7.根据权利...
【专利技术属性】
技术研发人员:薛楚,周明伟,
申请(专利权)人:浙江大华技术股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。