【技术实现步骤摘要】
一种Hadoop慢节点自动发现与规避方法及装置
[0001]本专利技术涉及数据源领域,尤其是一种Hadoop慢节点自动发现与规避方法及装置。
技术介绍
[0002]Hadoop一个由Apache基金会所开发的分布式系统基础架构,是一个大数据通用存储和分析平台,一个Hadoop大数据集群由多台服务器组成,在大规模的集群,服务器节点可达到成千上万台。Hadoop集群中慢节点主要表现为网络传输慢、磁盘读写慢。当数据存储在慢节点或者数据处理任务调度至慢节点,数据处理任务的延迟将非常大,性能下降至少十倍以上,同时,由于任务被分隔成大量的子任务在多个节点分布式运行,整个任务的运行效率取决于最后一个子任务运行结果,由于任务一直在运行,导致CPU、内存资源不能释放,影响其他任务的正常运行。严重的还会导致任务执行失败。
[0003]在大规模集群,慢节点难以定位,由于分配在慢节点上的任务在正常运行,在应用程序的日志里面没有任何异常的日志信息,慢节点机器负荷正常,常规的监控手段(例如,监控内存的利用率,CPU的利用率等)也难以发现并进行告警。
[0004]在任务运行非常慢时,需要手工分析大量的Task(任务)的日志,从日志中分析数据处理任务在哪些节点慢,然后再分析节点,对节点的网络的带宽或磁盘的性能执行手工的测试,比如测试磁盘读写IO的性能、验证通过网络进行数据传输的速率、网卡带宽等,才能定位慢节点。整个过程非常耗时,需要消耗大量的人工,同时,即使分析出来了慢节点,也无法阻止新的任务再次调度至这台慢节点,除非手工将这个慢节 ...
【技术保护点】
【技术特征摘要】
1.一种Hadoop慢节点自动发现与规避方法,其特征在于,该方法包括:S01、发现慢节点,将慢节点探测发现的功能打包进大数据应用程序,一起发布提交;S02、在计算方面,规避应用程序执行器调度至慢节点;S03、规避从慢节点拉取数据;S04、停止慢点节上正在执行的任务并重新调度至正常节点。2.根据权利要求1所述的Hadoop慢节点自动发现与规避方法,其特征在于,所述S01包括:S011、用户通过自定义的YARN API提交应用程序,准备启动应用程序的主服务ApplicationMaster;S012、启动ApplicationMaster,申请资源;S013、启动应用程序的执行器,ApplicationMaster接收到分配的资源情况,直接与每个分配的NodeManager通信,启动应用程序的执行器;S014、发现待启动慢节点监测的执行器的节点;S015、启动慢节点监测执行器,ApplicationMaster在慢节点监测的执行器的主机,启动慢节点监测的执行器,在分配的每台服务器上,从HDFS获取相应的jar包,启动慢节点监测的执行器。3.根据权利要求2所述的Hadoop慢节点自动发现与规避方法,其特征在于,所述S011包括:S0111、使用YarnClient的API,提交大数据处理的;S0112、ResourceManager接收到应用程序提交的请求,在大数据集群中选择一台合适的NodeManager节点,准备启动应用程序的主服务ApplicationMaster。4.根据权利要求3所述的Hadoop慢节点自动发现与规避方法,其特征在于,所述应用程序包括:Spark应用程序、MapReduce应用程序。5.根据权利要求2所述的Hadoop慢节点自动发现与规避方法,其特征在于,所述S012包括:S0121、在选中的NodeManager节点,启动ApplicationMaster;S0122、通过YarnClient的API提交任务时,与启动的ApplicationMaster通信,告知需要申请慢节点监测的资源;S0123、ApplicationMaster与ResourceManager建立双向的通信,ApplicationMaster告知ResourceManager需要申请两类资源:运行任务的资源、执行慢节点检测所需要的资源,资源指的是内存大小和CPU的数量;S0124、ResourceManager根据ApplicationMaster提交的资源申请请求,分配1至多个NodeManager节点的主机,用于在这些节点的主机上启动执行器进程。6.根据权利要求5所述的Hadoop慢节点自动发现与规避方法,其特征在于,所述S0124中的执行器包括:应用程序的执行器、慢节点检测的执行器。7.根据权利要求2所述的Hadoop慢节点自动发现与规避方法,其特征在于,所述S014包括:S0141、ApplicationMaster将应用程序拆分为多个子任务,子任务在应用程序的执行
器上运行,每个应用程序执行器的子任务会从各个节点拉取文件数据,进行计算;S0142、每个应用程序执行器将拉取数据的节点信息发送至ApplicationMaster;S0143、Appl...
【专利技术属性】
技术研发人员:张强,
申请(专利权)人:中盈优创资讯科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。