The invention discloses a distributed service health inspection method and system, including the following steps: registering the work task health parameters of the work unit to the service management platform; starting the health inspection service and subscribing the health parameters of the work task level registered by each work unit to the service management platform; the health inspection service periodically subscribes to each work in the distributed service The work unit initiates health inspection; starts load balancing service and subscribes the health degree of the work unit in processing a work task dimension to the health inspection service, and adjusts the task amount of the work unit according to the health degree; the invention can perform health inspection on the work task processed by the work unit, so as to accurately determine the health degree of the work unit in processing the work task.
【技术实现步骤摘要】
一种分布式服务健康检查的方法及其系统
本专利技术涉及的云计算
,尤其涉及一种分布式服务健康检查的方法及其系统。
技术介绍
在基于分布式服务部署的云计算平台中通常会部署负载均衡服务,该服务将负载(工作任务)进行平衡并分摊到多个操作单元上进行运行,例如FTP服务器、Web服务器、企业核心应用服务器和其它主要任务服务器等,从而协同完成工作任务。负载均衡服务进行任务分派的策略之一是判断工作单元的健康度是否达标,如果工作单元的健康度异常,负载均衡在该工作单元健康恢复之前停止分派任务给该工作单元,当负载均衡服务判断工作单元恢复健康后继续将工作单元纳入工作任务的调度集合中;然而目前,负载均衡服务判断工作单元健康的方法有两种:一种是心跳检查,负载均衡服务发送一个心跳报文(例如采用TCP/UDP协议)给工作单元,工作单元在配置的时间范围内回复心跳,表示工作单元健康;第二种是API调用检查,负载均衡服务和工作单元约定一个API接口(例如采用HTTP协议),负载均衡服务调用API接口,工作单元返回预期的响应,表示工作单元健康;其工作单元一般是一台服务器,服务器执行实际工作任务的子单元(进程或线程)和用于执行健康检查的心跳任务或是响应负载均衡API调用请求的任务(进程或线程)是独立的;如果工作单元在执行处理健康检查任务的子单元出现问题,不代表工作单元处理工作任务的子单元也出现问题,因此,当前方法在判断工作单元是否健康的粒度过于粗大,无法精确判断工作单元在处理工作任务维度的健康度。
技术实现思路
本部分的目的 ...
【技术保护点】
1.一种分布式服务健康检查的方法,其特征在于:包括如下步骤:/n注册工作单元(201)的工作任务健康参数到服务管理平台(100);/n启动健康检查服务(300)并向服务管理平台(100)订阅各个工作单元(201)注册的工作任务的健康参数;/n健康检查服务(300)周期性的向分布式服务(200)中的各个工作单元(201)发起健康检查;/n启动负载均衡服务(400)并向健康检查服务(300)订阅工作单元(201)在处理某个工作任务维度上的健康度,并根据健康度调整该工作单元的任务量。/n
【技术特征摘要】 【专利技术属性】
1.一种分布式服务健康检查的方法,其特征在于:包括如下步骤:
注册工作单元(201)的工作任务健康参数到服务管理平台(100);
启动健康检查服务(300)并向服务管理平台(100)订阅各个工作单元(201)注册的工作任务的健康参数;
健康检查服务(300)周期性的向分布式服务(200)中的各个工作单元(201)发起健康检查;
启动负载均衡服务(400)并向健康检查服务(300)订阅工作单元(201)在处理某个工作任务维度上的健康度,并根据健康度调整该工作单元的任务量。
2.如权利要求1所述的分布式服务健康检查的方法,其特征在于:所述注册工作单元(201)的工作任务健康参数到服务管理平台(100)包括步骤:
新建的工作单元(201)在启动时通过接口调用将工作任务健康参数注册到服务管理平台(100);
对于已有的工作单元(201)采用手动将工作任务健康参数注册到服务管理平台(100);
其中,所述接口通过HTTP协议实现。
3.如权利要求1或2所述的分布式服务健康检查的方法,其特征在于:所述服务管理平台(100)采用关系型数据库保存工作任务健康参数。
4.如权利要求3所述的分布式服务健康检查的方法,其特征在于:所述健康参数区分为工作单元的访问信息和工作任务健康参数;
其中,所述工作单元(201)的访问信息包括IP地址和端口号;
其中,所述工作任务健康参数包括工作单元地址、工作任务标识和工作任务内容。
5.如权利要求1、2和4任一所述的分布式服务健康检查的方法,其特征在于:所述启动健康检查服务(300)并向服务管理平台(100)订阅各个工作单元(201)注册的工作任务级别的健康参数的步骤还包括:当新的工作单元(201)向服务管理平台(100)注册健康参数,服务管理平台(100)返回参数给健康检查服务(300)。
技术研发人员:白天,
申请(专利权)人:西藏宁算科技集团有限公司,的卢技术有限公司,西藏宁算信息科技有限公司,北京宁算科技有限公司,
类型:发明
国别省市:西藏;54
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。