服务器reboot测试方法、服务器、控制器和系统技术方案

技术编号:13621012 阅读:151 留言:0更新日期:2016-08-31 14:02
本发明专利技术提供了服务器reboot测试方法、服务器、控制器和系统,该方法包括:通过交换机,建立服务器和控制器相互通信;服务器接收控制器发送的开机请求,进行开机启动;判断是否存在Ispci‑tmp文件,如果是,则读取设备信息,将设备信息写入Ispci‑$count文件,并比较Ispci‑tmp文件和Ispci‑$count文件是否一致,否则,为服务器的设备信息,生成Ispci‑tmp文件;当Ispci‑tmp文件和Ispci‑$count文件一致时,发送启动完成信息;创建gpu.txt文件和server.txt文件;接收控制器发送的关机请求,进行关机操作,实现了服务器稳定性测试的自动化。

【技术实现步骤摘要】

本专利技术涉及服务器应用
,特别涉及服务器reboot测试方法、服务器、控制器和系统
技术介绍
随着云计算服务的不断发展,对服务器的稳定性要求越来越高。目前服务器稳定性测试的一种重要方法为reboot测试。现有服务器的reboot测试方式主要是,在各个服务器节点安装reboot脚本,通过人工的方式为各个服务器节点连通电源,手动开启各个服务器节点,reboot脚本运行,并检测开机过程是否正常,然后对服务器节点执行关机操作,并需要人工依次对各个服务器节点进行断开电源的操作,即现有的reboot测试方法只能通过人工参与的方式完成,而无法使服务器稳定性测试自动进行。
技术实现思路
本专利技术实施例提供了服务器reboot测试方法、服务器、控制器和系统,实现服务器稳定性测试的自动化。服务器reboot测试方法,通过交换机,建立服务器和控制器之间相互通信;还包括:当服务器接收到控制器发送的开机请求时,进行开机启动;服务器判断本身是否存在Ispci-tmp文件,如果是,则读取服务器中的设备信息,将该设备信息写入Ispci-$count文件,并比较Ispci-tmp文件和
Ispci-$count文件是否一致,否则,为服务器中的设备信息,生成Ispci-tmp文件;当所述Ispci-tmp文件和所述Ispci-$count文件一致时,发送启动完成信息给控制器;创建gpu.txt文件和server.txt文件;接收控制器发送的关机请求,进行关机操作。优选地,所述通过交换机,建立服务器和控制器之间相互通信,包括:服务器通过OS网络和BMC网络连接到交换机;控制器通过OS网络连接到交换机。优选地,上述方法进一步包括:在服务器中设置第一计数器count;在所述开机启动之后,进一步包括:服务器判断本身是否存在count文件,如果是,则将所述第一计数器count+1,存储到所述count文件;否则,启动所述第一计数器count,将所述第一计数器count+1,生成count文件,并将所述第一计数器count写入服务器开机启动项。优选地,所述服务器为Pcie-Switch服务器,该Pcie-Switch服务器包括:资源服务器和server端,其中,所述server端插有一张retimer卡,通过该retimer卡及MiniSASHD线缆与所述资源服务器连接;进一步包括:设置启动时序;所述开机启动,包括:根据设置的启动时序,顺序启动所述资源服务器和server端。服务器reboot测试方法,应用于控制器,在控制器中设置第二计数器count,并设置检测阈值;还包括:M1、控制器初始化所述第二计数器count;M2、接收服务器发送的启动完成信息,判断所述第二计数器count的计数是否小于检测阈值,如果是,则检测服务器中是否存在gpu.txt文件和server.txt文件,如果是,则调用服务器的关机函数,控制服务器关机;M3、向服务器发送开机请求,调用服务器的开机函数,控制服务器开机
启动,并将第二计数器count+1,执行M2。优选地,上述方法进一步包括:清除所述服务器中的操作系统日志。优选地,所述服务器为Pcie-Switch服务器,该Pcie-Switch服务器包括:资源服务器和server端,其中,所述server端插有一张retimer卡,通过该retimer卡及MiniSASHD线缆与所述资源服务器连接;所述控制服务器关机,包括:顺序控制所述server端关机和所述资源服务器关机;所述控制服务器开机启动,包括:顺序控制所述资源服务器开机启动和所述server端开机启动。应用于上述任一所述的服务器reboot测试方法的服务器,通过外设的交换机,与外设的控制器之间相互通信,包括:开关单元、第一判断单元、读取写入单元和生成单元,其中,所述开关单元,用于当接收到外设的控制器发送的开机请求时,进行开机启动,并触发所述第一判断单元,当接收到外设的控制器发送的关机请求,进行关机操作;所述第一判断单元,用于接收到所述开机单元的触发时,判断是否存在Ispci-tmp文件,如果是,则触发所述读取写入单元;并比较Ispci-tmp文件和Ispci-$count文件是否一致,否则,触发所述生成单元;所述读取写入单元,用于读取服务器中的设备信息,将该设备信息写入Ispci-$count文件,并当所述Ispci-tmp文件和所述Ispci-$count文件一致时,发送启动完成信息给外设的控制器,并创建gpu.txt文件和server.txt文件;所述生成单元,用于为各个设备信息,生成Ispci-tmp文件。优选地,上述服务器,通过OS网络和BMC网络连接到外设的交换机。优选地,上述服务器,进一步包括:第二判断单元和第一计数器,其中,所述第二判断单元,用于判断是否存在count文件,如果是,则触发所述第一计数器;否则,启动所述第一计数器,生成count文件,并将所述第一计数器写入服务器开机启动项;所述第一计数器,用于统计所述开关单元的开机启动次数,当所述开关单元进行开机启动时,进行count+1,并将开机启动次数存储到所述count文件。优选地,上述服务器,为Pcie-Switch服务器,该Pcie-Switch服务器包括:资源服务器和server端,其中,所述server端插有一张retimer卡,通过该retimer卡及MiniSASHD线缆与所述资源服务器连接。应用于上述任一所述的服务器reboot测试方法的控制器,包括:设置单元、第二计数器、检测单元和调用控制单元,其中,所述设置单元,用于设置检测阈值;所述检测单元,用于判断所述第二计数器的计数是否小于所述设置单元设置的检测阈值,如果是,则检测外设的服务器中是否存在gpu.txt文件和server.txt文件,如果是,则触发所述调用控制单元;所述调用控制单元,用于在接收到所述检测单元的触发时,调用外设的服务器的关机函数,控制外设的服务器关机,向外设的服务器发送开机请求,调用外设的服务器的开机函数,控制外设的服务器开机启动,并将所述第二计数器的计数加1。服务器reboot测试系统,包括:至少一个上述任意一种服务器、交换机和上述任意一种控制器,其中,所述至少一个服务器和所述控制器分别与所述交换机连接。本专利技术实施例提供了服务器reboot测试方法、服务器、控制器和系统,该方法,通过交换机,建立服务器和控制器之间相互通信;当服务器接收到控制器发送的开机请求时,进行开机启动;服务器判断本身是否存在Ispci-tmp文件,如果是,则读取服务器中的设备信息,将该设备信息写入Ispci-$count文件,并比较Ispci-tmp文件和Ispci-$count文件是否一致,否则,为服务器中的设备信息,生成Ispci-tmp文件;当所述Ispci-tmp文件和所述Ispci-$count文件一致时,发送启动完成信息给控制器;创建gpu.txt文件和server.txt文件;接收控制器发送的关机请求,进行关机操作,通过该方法,通过服务器
判断文件是否存在,并对比文件间的一致性,即可判断出服务器启动是否正常,另外,服务器的启动和关机均可在控制器的控制下,自动进行,而无需人工参与进来本文档来自技高网
...

【技术保护点】
服务器reboot测试方法,其特征在于,通过交换机,建立服务器和控制器之间相互通信;还包括:当服务器接收到控制器发送的开机请求时,进行开机启动;服务器判断本身是否存在Ispci‑tmp文件,如果是,则读取服务器中的设备信息,将该设备信息写入Ispci‑$count文件,并比较Ispci‑tmp文件和Ispci‑$count文件是否一致,否则,为服务器中的设备信息,生成Ispci‑tmp文件;当所述Ispci‑tmp文件和所述Ispci‑$count文件一致时,发送启动完成信息给控制器;创建gpu.txt文件和server.txt文件;接收控制器发送的关机请求,进行关机操作。

【技术特征摘要】
1.服务器reboot测试方法,其特征在于,通过交换机,建立服务器和控制器之间相互通信;还包括:当服务器接收到控制器发送的开机请求时,进行开机启动;服务器判断本身是否存在Ispci-tmp文件,如果是,则读取服务器中的设备信息,将该设备信息写入Ispci-$count文件,并比较Ispci-tmp文件和Ispci-$count文件是否一致,否则,为服务器中的设备信息,生成Ispci-tmp文件;当所述Ispci-tmp文件和所述Ispci-$count文件一致时,发送启动完成信息给控制器;创建gpu.txt文件和server.txt文件;接收控制器发送的关机请求,进行关机操作。2.根据权利要求1所述的方法,其特征在于,所述通过交换机,建立服务器和控制器之间相互通信,包括:服务器通过OS网络和BMC网络连接到交换机;控制器通过OS网络连接到交换机;和/或,进一步包括:在服务器中设置第一计数器count;在所述开机启动之后,进一步包括:服务器判断本身是否存在count文件,如果是,则将所述第一计数器count+1,存储到所述count文件;否则,启动所述第一计数器count,将所述第一计数器count+1,生成count文件,并将所述第一计数器count写入服务器开机启动项。3.根据权利要求1或2所述的方法,其特征在于,所述服务器为Pcie-Switch服务器,该Pcie-Switch服务器包括:资源服务器和server端,其中,所述server端插有一张retimer卡,通过该retimer卡及MiniSASHD线缆与所述资源服务器连接;进一步包括:设置启动时序;所述开机启动,包括:根据设置的启动时序,顺序启动所述资源服务器和server端。4.服务器reboot测试方法,其特征在于,应用于控制器,在控制器中设置第二计数器count,并设置检测阈值;还包括:M1、控制器初始化所述第二计数器count;M2、接收服务器发送的启动完成信息,判断所述第二计数器count的计数是否小于检测阈值,如果是,则检测服务器中是否存在gpu.txt文件和server.txt文件,如果是,则调用服务器的关机函数,控制服务器关机;M3、向服务器发送开机请求,调用服务器的开机函数,控制服务器开机启动,并将第二计数器count+1,执行M2。5.根据权利要求4所述的方法,其特征在于,进一步包括:清除所述服务器中的操作系统日志。6.根据权利要求4或5所述的方法,其特征在于,所述服务器为Pcie-Switch服务器,该Pcie-Switch服务器包括:资源服务器和server端,其中,所述server端插有一张retimer卡,通过该retimer卡及MiniSASHD线缆与所述资源服务器连接;所述控制服务器关机,包括:顺序控制所述server端关机和所述资源服务器关机;所述控...

【专利技术属性】
技术研发人员:肖欢巩祥文
申请(专利权)人:浪潮电子信息产业股份有限公司
类型:发明
国别省市:山东;37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1