【技术实现步骤摘要】
一种保证分布式多机通信监控的方法
本专利技术属于通信领域,特别涉及一种保证分布式多机通信监控的方法。
技术介绍
当用户提交分布式任务的申请时,任务会调度到不同的服务器上面。分布式任务对服务器间的通信要求比较高,至少要保证服务器之间能够TCP(TransmissionControlProtocol:传输控制协议)通信。然而,有的服务器之间通信存在问题,当存在这种现象时,分布式任务将会出错,从而影响用户的服务体验。现有的解决方法是对分布式任务系统里每个服务器进行通信测试,记录在相关的文件里,但是这种方案的维护成本高,管理起来不方便。此外,Prometheus(普罗米修斯):是一套使用Go语言开发的开源监控系统,其中,主要包括PrometheusServer(监控服务器)、ClientLibrary(客户端库)、Exporters(数据采集程序)、PushGateway(推送网关)、Alertmanager(警报管理)、图形界面等,Prometheus大致工作流程是:(1)PrometheusServer定期从配置好的Exporters或ClientLibrary中拉取metrics(指标),或者接收PushGateway发过来的metrics,或者从其它途径拉取metrics。(2)PrometheusServer在本地存储收集到metrics之后,运行已设定好的alert.rules(告警规则),向Alertmanager推送警报。(3)Alertmanager根据自身的配置文件,对接收 ...
【技术保护点】
1.一种保证分布式多机通信监控的方法,其特征在于,所述方法包括,/n在分布式任务系统中的各个服务器上部署通信检测代码;/n在所述通信检测代码中嵌入Prometheus的Exporters的软件包,通过Exporters读取各个服务器中通信检测代码计算得出的通信变量;/nExporters将获取的通信变量发送给Prometheus Server;/n基于所述通信变量,Prometheus Server判断各个服务器之间的通信是否正常。/n
【技术特征摘要】
1.一种保证分布式多机通信监控的方法,其特征在于,所述方法包括,
在分布式任务系统中的各个服务器上部署通信检测代码;
在所述通信检测代码中嵌入Prometheus的Exporters的软件包,通过Exporters读取各个服务器中通信检测代码计算得出的通信变量;
Exporters将获取的通信变量发送给PrometheusServer;
基于所述通信变量,PrometheusServer判断各个服务器之间的通信是否正常。
2.根据权利要求1所述的保证分布式多机通信监控的方法,其特征在于,所述方法还包括,
各个服务器通过TCP通信,在进行通信的过程中,各个服务器中的任一均能够向其他服务器发送或反馈带有自身IP地址命名的txt文件,以及接收其他服务器反馈或发送的带有自身IP地址命名的txt文件。
3.根据权利要求1或2所述的保证分布式多机通信监控的方法,其特征在于,所述方法还包括设置第一通信变量,以判断两个服务器之间的通信是否异常,其中,
若当前服务器接收到另一个服务器反馈的带有自身IP地址命名的txt文件时,则两个服务器之间TCP通信正常,第一通信变量取值为0;
若当前服务器未接收到另一个服务器反馈的带有自身IP地址命名的txt文件时,则两个服务器之间TCP通信异常,第一通信变量取值为1。
4.根据权利要求3所述的保证分布式多机通信监控的方法,其特征在于,所述方法还包括设置metric变量,以在所述两个服务器之间TCP通信异常时,判断当前服务器是否异常,其中,
若当前服务器未接收到其他服务器中所有服务器反馈的带有自身IP地址命名的txt文件时,则当前服务器异常,metric变量取值为1,否则metric变量取值为0。
5.根据权利要求4所述的保证分布式多机通信监控的方法,其特征在于,所述通过Exporters读取各个服务器中通信检测代码计算得出的通信变量之前还包括各个服务器中的通信检测代码实时监测与其他各个服务器之间的TCP通信;其中,
当前服务器向其他服务器发送带有自身IP地址命名的txt文件;
如果当前服务器能够收到其他服务器中的一个服务器反馈的带有自身IP地址命名的txt文件,则表示当前服务器与所述反馈带有自身IP地址命名的txt文件的服务器的TCP通信检验成功,
则当前服务器中的通信...
【专利技术属性】
技术研发人员:朱之凯,刘海峰,
申请(专利权)人:合肥中科类脑智能技术有限公司,
类型:发明
国别省市:安徽;34
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。