本实用新型专利技术实施例提供了一种硬件集群装置,包括至少两个主机,其中,主机中包括算力卡,相邻两个主机中的算力卡之间通过线缆连接,至少两个主机的算力卡通过线缆按照预定连接方式连接。通过本实用新型专利技术,解决了相关技术中存在的集群设备中算力卡利用率低的问题,提高了集群设备中算力卡利用率。高了集群设备中算力卡利用率。高了集群设备中算力卡利用率。
【技术实现步骤摘要】
硬件集群装置
[0001]本技术实施例涉及存储
,具体而言,涉及一种硬件集群装置。
技术介绍
[0002]在相关技术中,算力池概念局限于服务器主板上,或在某台服务器上,设备通过网络实现算力池化的概念,即多个设备通过网络连接,实现算力池化,然而,当多个设备中的某个设备的主控故障时,会导致该设备的算力卡无法继续使用。
[0003]由此可知,相关技术中存在集群设备中算力卡利用率低的问题。
[0004]针对相关技术中存在的上述问题,目前尚未提出有效的解决方案。
技术实现思路
[0005]本技术实施例提供了一种硬件集群装置,以至少解决相关技术中存在的集群设备中算力卡利用率低的问题。
[0006]根据本技术的一个实施例,提供了一种硬件集群装置,包括至少两个主机,其中,所述主机中包括算力卡,相邻两个所述主机中的所述算力卡之间通过线缆连接,至少两个所述主机的所述算力卡通过线缆按照预定连接方式连接。
[0007]通过本技术,在硬件集群装置中,包括至少两个主机,每个主机中均包括算力卡,相邻两个主机中的算力卡通过线缆连接,至少两个主机的算力卡通过线缆按照预定连接方式连接。由于各个主机中的算力卡可以通过线缆连接,当硬件集群装置中的某个主机的主控出现故障时,其他主机可以通过线缆接管出现故障的主机的算力卡,因此,可以解决相关技术中存在的集群设备中算力卡利用率低的问题,提高了集群设备中算力卡利用率。
附图说明
[0008]图1是根据本技术实施例的环形连接示意图;
[0009]图2是根据本技术实施例的两两连接示意图;
[0010]图3是根据本技术实施例的线型连接示意图;
[0011]图4是根据本技术具体实施例的硬件集群装置示意图。
具体实施方式
[0012]下文中将参考附图并结合实施例来详细说明本技术的实施例。
[0013]需要说明的是,本技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。
[0014]在本实施例中提供了一种硬件集群装置,该装置包括:
[0015]至少两个主机,其中,所述主机中包括算力卡,相邻两个所述主机中的所述算力卡之间通过线缆连接,至少两个所述主机的所述算力卡通过线缆按照预定连接方式连接。
[0016]在上述实施例中,主机可以为服务器,硬件集群装置可以是包括多个服务器的设
备,每个主机中可以包括多个算力卡,算力卡用于执行各类运算。每两个主机的算力卡可以通过线缆连接,线缆可以包括双绞线、光缆等,本技术对此不做限制。
[0017]在上述实施例中,各个主机的算力卡可以通过预定连接方式连接,预定连接方式可以是预先确定的连接方式。
[0018]在上述实施例中,当各个主机的算力卡通过线缆连接后,当某个主机的主控出现故障时,其他主机可以通过线缆控制该主机的算力卡继续工作,以提高算力卡的利用率。其中,其他主机可以是与故障主机相邻的主机。当故障主机存在多个相邻主机时,可以从多个相邻主机中随机指定一个主机作为接管主机。
[0019]通过本技术,在硬件集群装置中,包括至少两个主机,每个主机中均包括算力卡,相邻两个主机中的算力卡通过线缆连接,至少两个主机的算力卡通过线缆按照预定连接方式连接。由于各个主机中的算力卡可以通过线缆连接,当硬件集群装置中的某个主机的主控出现故障时,其他主机可以通过线缆接管出现故障的主机的算力卡,因此,可以解决相关技术中存在的集群设备中算力卡利用率低的问题,提高了集群设备中算力卡利用率。
[0020]在一个示例性实施例中,至少两个所述主机的所述算力卡环形连接。在本实施例中,预定连接方式可以是是至少两个主机的算力卡环形连接,其中,环形连接示意图可参见附图1,如图1所示,硬件集群装置中可以包括4个主机(该取值仅是一种示例性说明,主机的个数还是为3个,5个,10个等,本技术对此不做限制),4个主机通过线缆连接成环形。
[0021]在一个示例性实施例中,至少两个所述主机的所述算力卡中包括任意两个算力卡均通过所述线缆两两连接。在本实施例中,预定连接方式还可以是两两连接,两两连接示意图可参见附图2,如图2所示,至少两个主机中包括的每个主机均与至少两个主机中包括的其他主机连接。实现了每个主机都可以接管其他主机的算力卡的功能。
[0022]在一个示例性实施例中,至少两个所述主机的所述算力卡依次连接。在本实施例中,预定连接方式还可以是线型连接,线型连接示意图可参见附图3,如图3所示,每个主机的算力卡依次连接,连接成线型。
[0023]在一个示例性实施例中,所述主机还包括处理器,所述处理器位于所述背板中,所述处理器用于接收位于主控模块发送的控制指令,并基于所述控制指令调用所述主机中的算力卡。在本实施例中,主机中还可以包括处理器,处理器可以安装在背板中,处理器可以接收安装在主板中的主控模块发送的控制指令,并根据控制指令调用主机中的算力卡。即,在调用算力卡时,可以是主控模块通过处理器调用算力卡。
[0024]在一个示例性实施例中,至少两个所述主机中的任意两个主机之间通过网络连接。在本实施例中,多个主机中包括的任意两个主机之间可以通过网络连接,主机之间可以通过网络发送心跳指令,互相检测是否出现故障。在通过网络检测到至少两个主机中包括的目标主机出现故障的情况下,控制至少两个主机中包括的与目标主机的算力卡连接的算力卡所在的主机接管目标主机的算力卡,即当检测到目标主机出现故障的情况下,可以控制与目标主力的算力卡连接的算力卡所在的主机接收目标主机的算力卡。
[0025]在一个示例性实施例中,所述主机还包括主控模块,至少两个所述主机中所分别包括的所述主控模块之间通过网络连接。在本实施例中,主机还包括主控模块,主机之间可以通过主控模块进行网络连接。
[0026]在一个示例性实施例中,所述主机还包括主板,所述主控模块位于所述主板中。在
本实施例中,主控模块可以安装在主板上。
[0027]在一个示例性实施例中,所述线缆包括以下至少之一:光缆、电缆。在本实施例中,连接算力卡的线缆可以是光缆,也可以是电缆,也可以选择部分算力卡之间通过光缆连接,部分算力卡之间通过电缆连接。
[0028]在一个示例性实施例中,在通过网络检测到至少两个所述主机中包括的目标主机的目标主控模块出现故障的情况下,控制所述相邻主机的主控模块接管所述目标主机的算力卡。在本实施例中,当目标主控模块出现故障的情况下,可以控制接管主机的主控模块接管目标主机的算力卡。
[0029]在一个示例性实施例中,所述主控模块还用于在确定所述主机中包括的算力卡的占用量小于预定阈值的情况下,向至少两个所述主机中包括的与所述主机的算力卡连接的算力卡所在的其他主机发送目标指令,其中,所述目标指令用于指示所述主机允许承接所述其他主机的算力任务。在本实施例中,当主控模块确定主机的算力卡本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种硬件集群装置,其特征在于,包括至少两个主机,其中,所述主机中包括算力卡,相邻两个所述主机中的所述算力卡之间通过线缆连接,至少两个所述主机的所述算力卡通过线缆按照预定连接方式连接。2.根据权利要求1所述的硬件集群装置,其特征在于,至少两个所述主机的所述算力卡环形连接。3.根据权利要求1所述的硬件集群装置,其特征在于,至少两个所述主机的所述算力卡中包括任意两个算力卡均通过所述线缆两两连接。4.根据权利要求1所述的硬件集群装置,其特征在于,至少两个所述主机的所述算力卡依次连接。5.根据权利要求1所述的硬件集群装置,其特征在于,所述主机包括背板,所述算力卡位于在所述背板中。6.根据权利要求5...
【专利技术属性】
技术研发人员:张弛,安义凡,王新华,郑磊,蔡剑峰,
申请(专利权)人:浙江大华技术股份有限公司,
类型:新型
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。