本发明专利技术涉及一种基于环境参数的服务器集群自动保护系统,属于服务器安全技术领域。系统包括下位机和上位机,其中,下位机包括数据采集与控制系统、温度传感器、电网电压传感器和继电器组,温度传感器、电网电压传感器连接在数据采集与控制系统上,数据采集与控制系统与继电器组相连,继电器组采用UPS电源供电。上位机由服务器集群运行环境监测与控制系统组成,下位机由一台IBM?server组成,上、下位机之间通过RS-232总线相连,与服务器集群之间通过以太网相连。本发明专利技术可以达到保护服务器数据及设备安全的目的,同时大大减轻技术管理人员的工作负担。
【技术实现步骤摘要】
【专利摘要】本专利技术涉及一种基于环境参数的服务器集群自动保护系统,属于服务器安全
。系统包括下位机和上位机,其中,下位机包括数据采集与控制系统、温度传感器、电网电压传感器和继电器组,温度传感器、电网电压传感器连接在数据采集与控制系统上,数据采集与控制系统与继电器组相连,继电器组采用UPS电源供电。上位机由服务器集群运行环境监测与控制系统组成,下位机由一台IBM?server组成,上、下位机之间通过RS-232总线相连,与服务器集群之间通过以太网相连。本专利技术可以达到保护服务器数据及设备安全的目的,同时大大减轻技术管理人员的工作负担。【专利说明】基于环境参数的服务器集群自动保护系统
本专利技术涉及一种基于环境参数的服务器集群自动保护系统,属于服务器安全
。
技术介绍
在高校的计算机实验教学中心,网络教学资源共享、网络应用服务和网络管理是由服务器集群来实现的。由于教学和科研的需要,要求这种网络服务是全天候的,即全年365天每天24小时不间断服务。为此,服务器集群也必须全天候工作,而且要保障设备无故障、连续可靠运行。如何保障服务器集群连续、可靠运行除设备本身的因素外,运行环境至关重要。运行环境中最重要的两个因素是电网供电和环境温度,因为异常停电会造成服务器数据丢失,而高温会使服务器设备瘫痪或损坏。因此,几乎在所有的服务器集群的运行环境中,大功率UPS电源和精密制冷空调是必须的配套设备。但在实际应用中,一些突发因素仍然会导致服务器数据丢失甚至造成设备损坏。根据对西北农林科技大学计算机实验教学中心服务器集群10多年的运行统计,概率最高的两个因素是电网异常停电和空调故障。这里要特别强调一个技术细节,因为空调是感性负载,UPS电源不能给感性负责提供电力,也就是当电网停电时,空调也会停止工作。因此,当电网停电时,虽然服务器集群有UPS供电仍能正常工作,但由于空调停止工作,服务器集群自身工作所产生的热量使运行环境的温度会越来越高,高温最终会导致服务器瘫痪,并引起数据丢失甚至造成设备损坏。因此,当出现电网异常停电、空调故障时,如何保护服务器设备,需要重点予以关注。目前市场上成熟的技术和产品是基于GSM的短信报警系统,即当温度超过设定的上限值时,将环境温度以手机短信形式发给技术管理者,以便管理人员能及时地处置问题。但在长期的应用中,也发现了其存在一些弊端,主要表现在以下几个方面:①在晚上一些时段,即使报警短信发给技术管理人员,但由于大家都在熟睡,短信可能被忽略。②遇到双休日、节假日,技术管理人员可能远离设备所在地,当收到报警短信时,问题很难及时处置。特别是在高校的寒、暑假期间,这种问题表现得最为突出。③短信报警方式实质上是“无线报警技术+人力保障”的技术管理模式,这种管理方式本身就存在漏洞。因为对高校计算机实验教学中心而言,服务器集群的规模相对较小(几十台服务器),因此往往不安排技术管理人员24小时值班,所以“人力保障”本身就存在不确定性和响应效率低下的现实问题。④可能造成较大的经济损失。一般情况下,计算机服务器与交换机、路由器等网络设备都集中安装在中心机房,而且这些设备价值比较高,一旦出现以上异常情况,如果处置不及时而造成设备损坏,其损失往往较大。我们自己就曾因此造成了一台价值12万元的防火墙设备损坏,其原因是雷雨天导致半夜突然停电,而高温报警的短信未被及时发现。以上问题是基于GSM的短信报警技术本身无法解决的。
技术实现思路
本专利技术的目的在于针对上述问题,提供一种基于环境参数的服务器集群自动保护系统,通过实时监测服务器集群的运行环境参数(电网电压、环境温度),当环境参数异常并达到设定的上限值时,在保证服务器数据安全的情况下,自动停止服务器集群的运行,防止高温损坏设备;当环境参数恢复正常时,设计系统会自动开启服务器集群,恢复服务器集群的服务功能。为了实现上述目的,本专利技术的技术方案如下。一种基于环境参数的服务器集群自动保护系统,包括下位机和上位机,其中,下位机包括数据采集与控制系统、温度传感器、电网电压传感器和继电器组,温度传感器、电网电压传感器连接在数据采集与控制系统上,数据采集与控制系统与继电器组相连。上位机由服务器集群运行环境监测与控制系统组成,上位机由一台IBM server组成,与下位机之间通过RS-232总线相连,与服务器集群之间通过以太网相连。上、下位机采用UPS电源供电。下位机的功能可以使用单片机技术结合传感器技术来实现。其各部分功能电路如下:①数据采集与控制电路:选择美国Silicon Laboratories公司的C8051F340来实现数据的采集和控制。C8051F340使用Silicon Labs的专利CIP-51微控制器内核,具有片内上电复位、电压调整器、看门狗定时器和时钟振荡器等功能电路,是真正能独立工作的片上系统。CIP-51采用流水线结构,与标准的8051结构相比指令执行速度有很大的提高。FLASH存储器具有在系统重新编程能力,用户软件能对所有外设进行完全控制。②电网电压采集电路:使用直流稳压电源作为电网电压传感器,即可对电网电压进行实时监测,系统设计使用DC+5V稳压电源。通过对电网电压检测端的测试,即可判断电网供电是否正常。③温度检测电路:通过对环境温度的检测来判断空调是否正常工作,环境温度可通过温度传感器进行监测。系统设计选择美国Dallas公司生产的DS18B20作为温度传感器。④继电器组控制电路:继电器组的主要功能是接受C8051F340单片机发出的命令,实现对服务器供电的控制。该专利技术中,上位机通过运行设计的服务器自动保护系统软件,实现对下位机发送数据的分析,并当环境参数异常并达到设定的阀值时,通过以太网发送控制命令,关闭服务器集群,当服务器集群关闭后,再通过控制下位机切断服务器的供电电源;当环境参数恢复正常时,开启服务器并恢复其正常的网络服务功能。从而达到自动保护服务器集群及自动管理的目的。该专利技术的有益效果在于:在服务器集群的管理中,由于空调故障、电网停电等突发因素不可避免,而这些因素可能造成服务器及网络系统瘫痪甚至设备损坏,严重影响服务器的安全可靠运行。再者,由于服务器及网络设备处于网络应用的核心位置,且设备价值较高,一旦出现问题,不但损失大、而且造成影响也很大。因此,对服务器集群进行自动保护具有重要意义。本专利技术正是针对现实需要,以解决服务器集群在日常运行和管理中存在的问题为出发点,通过对服务器集群的运行环境因素进行实时监测,并当环境因素异常时,实现对保护服务器集群及网络设备保护;同时,当环境因素恢复正常时,恢复服务器集群原有的功能。即达到保护服务器数据及设备安全的目的,同时大大减轻技术管理人员的工作负担。【专利附图】【附图说明】图1是本专利技术实施例中系统结构组成框图。图2是本专利技术实施例中系统电路组成框图。图3是本专利技术实施例中数据采集与控制电路图。图4是本专利技术实施例中电网电压采集电路图。图5是本专利技术实施例中温度采集电路图。图6是本专利技术实施例中继电器控制电路图。图7是本专利技术实施例中上位机连接框图。图8是本专利技术实施例中上位机系统设计流程图。【具体实施方式】下面结合附图和实施例对本专利技术的【具体实施方式】进行描述,以便更好的理解本专利技术。如图1所示,基于环本文档来自技高网...
【技术保护点】
【技术特征摘要】
【专利技术属性】
技术研发人员:张晓峰,牛亚斌,张荷,仵亚伟,
申请(专利权)人:西北农林科技大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。