自动配置GPU扩展箱的方法、系统及可自动配置的GPU扩展箱技术方案

技术编号:19778270 阅读:61 留言:0更新日期:2018-12-15 11:18
本申请公开了一种自动配置GPU扩展箱的方法、系统及可自动配置的GPU扩展箱,该方法包括:建立GPU扩展箱的连接拓扑与GPU扩展箱内PCIE switch芯片配置之间的映射关系;主机的BMC或GPU扩展箱的BMC利用I2C信号检测当前GPU扩展箱的连接拓扑;根据当前GPU扩展箱的连接拓扑以及所述映射关系,对当前GPU扩展箱内PCIE switch芯片进行配置。该系统包括映射关系建立模块、检测模块和配置模块。该可自动配置的GPU扩展箱中设置有GPU扩展箱的BMC,且主机与GPU扩展箱之间通过连接线通信连接,且主机和GPU扩展箱之间,以及多级GPU扩展箱之间的连接线上设置有I2C总线。本申请能够避免用户手动对GPU扩展箱进行配置,大大提高配置的准确性和配置效率,有利于提高计算机的性能。

【技术实现步骤摘要】
自动配置GPU扩展箱的方法、系统及可自动配置的GPU扩展箱1.1
本申请涉及服务器系统设计
,特别是涉及一种自动配置GPU扩展箱的方法、系统及可自动配置的GPU扩展箱。1.2
技术介绍
随着大数据、云计算和人工智能的技术的快速发展,系统对服务器计算性能的要求越来越高,GPU(GraphicsProcessingUnit,图形处理器)因其在数据计算上的优势,使其在服务器上的应用越来越广泛。为了扩展更多的GPU,通常将多个GPU集成到一个扩展箱内,形成GPU扩展箱,从而实现GPU资源的池化,便于GPU资源的调度。通常GPU扩展箱是使用PCIEswitch芯片将CPU上有限的PCIE(peripheralcomponentinterconnectexpress,高速串行计算机扩展总线标准)接口扩展成多个PCIE接口,从而连接更多的GPU,完成GPU的扩展和GPU资源的池化。GPU和CPU之间通过PCIE接口连接的方式就是GPU扩展箱的连接拓扑。实际应用中,由于运行的业务不同,需要针对不同的业务更换不同的连接拓扑。目前的GPU扩展箱中采用固定的连接拓扑,当业务不同需要改变连接拓扑时,用户首先需要根据需求改变机箱的物理连接关系,然后手动对GPU扩展箱进行配置,从而实现不同的拓扑连接。然而,目前的GPU扩展中,由于连接拓扑改变时,需要手动对GPU扩展箱进行配置,操作较为繁琐,容易出现配置误差,配置的准确性和配置效率不够高,从而影响计算机的性能。1.3
技术实现思路
本申请提供了一种自动配置GPU扩展箱的方法、系统及可自动配置的GPU扩展箱,以解决现有技术中GPU扩展箱的配置准确性和配置效率低的问题。为了解决上述技术问题,本申请实施例公开了如下技术方案:一种自动配置GPU扩展箱的方法,所述GPU扩展箱中设置有一PCIEswitch芯片,所述PCIEswitch芯片上设置有多个端口,其中,第一端口用于连接主机或上一级GPU扩展箱,第二端口用于备用、连接下一级GPU扩展箱或连接另一主机,其余端口用于连接当前GPU扩展箱内的GPU,其特征在于,所述方法包括:建立GPU扩展箱的连接拓扑与GPU扩展箱内PCIEswitch芯片配置之间的映射关系,所述GPU扩展箱的连接拓扑包括:直联模式、级联模式和上行模式;主机的BMC(BaseboardManagementController,基板管理控制器)或GPU扩展箱的BMC利用I2C信号检测当前GPU扩展箱的连接拓扑;根据当前GPU扩展箱的连接拓扑以及所述映射关系,对当前GPU扩展箱内PCIEswitch芯片进行配置。可选地,主机的BMC或GPU扩展箱的BMC利用I2C信号检测当前GPU扩展箱的连接拓扑之前,所述方法还包括:通过在主机和GPU扩展箱之间的连接线上增加I2C信号,建立主机BMC与GPU扩展箱BMC之间的通信连接;通过在上一级GPU扩展箱和下一级GPU扩展箱之间的连接线上增加I2C信号,建立上一级GPU扩展箱的BMC与下一级GPU扩展箱的BMC之间的通信连接。可选地,所述映射关系为:GPU扩展箱的第一连接拓扑与第一配置相匹配,其中,第一连接拓扑为直联模式,第一配置为:PCIEswitch芯片上第一端口连接一主机,且第二端口不连接任何主机或GPU扩展箱;GPU扩展箱的第二连接拓扑与第二配置相匹配,其中,第二连接拓扑为级联模式的第一级,第二配置为:PCIEswitch芯片上第一端口连接一主机,且第二端口连接下一级GPU扩展箱;GPU扩展箱的第三连接拓扑与第三配置相匹配,其中,第三连接拓扑为级联模式的第N级,第三配置为:PCIEswitch芯片上第一端口连接上一级GPU扩展箱,N≥2且N为自然数;GPU扩展箱的第四连接拓扑与第四配置相匹配,其中,第四连接拓扑为上行模式,第四配置为:PCIEswitch芯片上第一端口连接一主机,第二端口连接另一主机。可选地,当GPU扩展箱的连接拓扑为:直联模式或上行模式时,所述主机的BMC或GPU扩展箱的BMC利用I2C信号检测当前GPU扩展箱的连接拓扑,包括:主机的BMC利用I2C信号扫描GPU扩展箱中PCIEswitch芯片的第一端口和第二端口,判断是否检测到主机的BMC或GPU扩展箱的BMC;或者,GPU扩展箱的BMC利用I2C信号扫描所述GPU扩展箱中PCIEswitch芯片的第一端口和第二端口,判断是否检测到主机的BMC或GPU扩展箱的BMC。可选地,当GPU扩展箱的连接拓扑为级联模式时,所述主机的BMC利用I2C信号检测当前GPU扩展箱的连接拓扑,包括:主机的BMC利用I2C信号扫描第一级GPU扩展箱中PCIEswitch芯片的第一端口和第二端口,判断是否检测到主机的BMC或第一级GPU扩展箱的BMC;上一级GPU扩展箱的BMC利用I2C信号扫描下一级GPU扩展箱中PCIEswitch芯片的第一端口和第二端口,判断是否检测到下一级GPU扩展箱的BMC。可选地,当GPU扩展箱的连接拓扑为级联模式时,所述GPU扩展箱的BMC利用I2C信号检测当前GPU扩展箱的连接拓扑,包括:第一级GPU扩展箱的BMC利用I2C信号扫描所述第一级GPU扩展箱中PCIEswitch芯片的第一端口和第二端口,判断是否检测到主机的BMC或第一级GPU扩展箱的BMC;上一级GPU扩展箱的BMC利用I2C信号扫描下一级GPU扩展箱中PCIEswitch芯片的第一端口和第二端口,判断是否检测到下一级GPU扩展箱的BMC。可选地,所述根据当前GPU扩展箱的连接拓扑以及所述映射关系,对GPU扩展箱内PCIEswitch芯片进行配置,包括:如果当前GPU扩展箱的PCIEswitch芯片上仅有第一端口检测到主机的BMC,第二端口不连接任何主机或GPU扩展箱,将当前GPU扩展箱的PCIEswitch芯片设置为第一配置;如果当前GPU扩展箱的PCIEswitch芯片上第一端口检测到主机的BMC,第二端口连接下一级GPU扩展箱,将当前GPU扩展箱的PCIEswitch芯片设置为第二配置;如果当前GPU扩展箱的PCIEswitch芯片上仅有第一端口检测到上一级GPU扩展箱的BMC,将当前GPU扩展箱的PCIEswitch芯片设置为第三配置;如果当前GPU扩展箱的PCIEswitch芯片上第一端口检测到一主机的BMC,第二端口检测到另一主机的BMC,将当前GPU扩展箱的PCIEswitch芯片设置为第四配置。一种自动配置GPU扩展箱的系统,所述GPU扩展箱中设置有一PCIEswitch芯片,所述PCIEswitch芯片上设置有多个端口,其中,第一端口用于连接主机或上一级GPU扩展箱,第二端口用于备用、连接下一级GPU扩展箱或连接另一主机,其余端口用于连接当前GPU扩展箱内的GPU,所述系统包括:映射关系建立模块,用于建立GPU扩展箱的连接拓扑与GPU扩展箱内PCIEswitch芯片配置之间的映射关系;检测模块,用于利用I2C信号检测当前GPU扩展箱的连接拓扑;配置模块,用于根据当前GPU扩展箱的连接拓扑以及所述映射关系,对GPU扩展箱内PCIEswitch芯片进行配置。可选地,所述映射关系为:GPU扩展箱的第一连接拓扑与第一配置相匹配,其中,第一连接拓扑为直联模式,第本文档来自技高网...

【技术保护点】
1.一种自动配置GPU扩展箱的方法,所述GPU扩展箱中设置有一PCIE switch芯片,所述PCIE switch芯片上设置有多个端口,其中,第一端口用于连接主机或上一级GPU扩展箱,第二端口用于备用、连接下一级GPU扩展箱或连接另一主机,其余端口用于连接当前GPU扩展箱内的GPU,其特征在于,所述方法包括:建立GPU扩展箱的连接拓扑与GPU扩展箱内PCIE switch芯片配置之间的映射关系,所述GPU扩展箱的连接拓扑包括:直联模式、级联模式和上行模式;主机的BMC或GPU扩展箱的BMC利用I2C信号检测当前GPU扩展箱的连接拓扑;根据当前GPU扩展箱的连接拓扑以及所述映射关系,对当前GPU扩展箱内PCIE switch芯片进行配置。

【技术特征摘要】
1.一种自动配置GPU扩展箱的方法,所述GPU扩展箱中设置有一PCIEswitch芯片,所述PCIEswitch芯片上设置有多个端口,其中,第一端口用于连接主机或上一级GPU扩展箱,第二端口用于备用、连接下一级GPU扩展箱或连接另一主机,其余端口用于连接当前GPU扩展箱内的GPU,其特征在于,所述方法包括:建立GPU扩展箱的连接拓扑与GPU扩展箱内PCIEswitch芯片配置之间的映射关系,所述GPU扩展箱的连接拓扑包括:直联模式、级联模式和上行模式;主机的BMC或GPU扩展箱的BMC利用I2C信号检测当前GPU扩展箱的连接拓扑;根据当前GPU扩展箱的连接拓扑以及所述映射关系,对当前GPU扩展箱内PCIEswitch芯片进行配置。2.根据权利要求1所述的一种自动配置GPU扩展箱的方法,其特征在于,主机的BMC或GPU扩展箱的BMC利用I2C信号检测当前GPU扩展箱的连接拓扑之前,所述方法还包括:通过在主机和GPU扩展箱之间的连接线上增加I2C信号,建立主机BMC与GPU扩展箱BMC之间的通信连接;通过在上一级GPU扩展箱和下一级GPU扩展箱之间的连接线上增加I2C信号,建立上一级GPU扩展箱的BMC与下一级GPU扩展箱的BMC之间的通信连接。3.根据权利要求1所述的一种自动配置GPU扩展箱的方法,其特征在于,所述映射关系为:GPU扩展箱的第一连接拓扑与第一配置相匹配,其中,第一连接拓扑为直联模式,第一配置为:PCIEswitch芯片上第一端口连接一主机,且第二端口不连接任何主机或GPU扩展箱;GPU扩展箱的第二连接拓扑与第二配置相匹配,其中,第二连接拓扑为级联模式的第一级,第二配置为:PCIEswitch芯片上第一端口连接一主机,且第二端口连接下一级GPU扩展箱;GPU扩展箱的第三连接拓扑与第三配置相匹配,其中,第三连接拓扑为级联模式的第N级,第三配置为:PCIEswitch芯片上第一端口连接上一级GPU扩展箱,N≥2且N为自然数;GPU扩展箱的第四连接拓扑与第四配置相匹配,其中,第四连接拓扑为上行模式,第四配置为:PCIEswitch芯片上第一端口连接一主机,第二端口连接另一主机。4.根据权利要求1所述的一种自动配置GPU扩展箱的方法,其特征在于,当GPU扩展箱的连接拓扑为:直联模式或上行模式时,所述主机的BMC或GPU扩展箱的BMC利用I2C信号检测当前GPU扩展箱的连接拓扑,包括:主机的BMC利用I2C信号扫描GPU扩展箱中PCIEswitch芯片的第一端口和第二端口,判断是否检测到主机的BMC或GPU扩展箱的BMC;或者,GPU扩展箱的BMC利用I2C信号扫描所述GPU扩展箱中PCIEswitch芯片的第一端口和第二端口,判断是否检测到主机的BMC或GPU扩展箱的BMC。5.根据权利要求1所述的一种自动配置GPU扩展箱的方法,其特征在于,当GPU扩展箱的连接拓扑为级联模式时,所述主机的BMC利用I2C信号检测当前GPU扩展箱的连接拓扑,包括:主机的BMC利用I2C信号扫描第一级GPU扩展箱中PCIEswitch芯片的第一端口和第二端口,判断是否检测到主机的BMC或第一级GPU扩展箱的BMC;上一级GPU扩展箱的BMC利用I2C信号扫描下一级GPU扩展箱中PCIEswitch芯片的第一端口和第二端口,判断是否检测到下一级GPU扩展箱的BMC。6.根据权利要求1所述的一种自动配置GPU扩展箱的方法,其特征在于,当GPU扩展箱的连接拓扑为级联模式时,所述GPU扩展箱的BMC利用I2C信号检测当前GPU扩展箱的连接拓扑,包括:第一级GPU扩展箱的BMC利用I2C信号扫描所述第一级GPU扩展箱中PCIEswitch芯片的第一端口和第二端口,判断是否检测到主机的BMC或第一级GPU扩展箱的BMC;上一级GPU扩展箱的BMC利用I2C信号扫描下一级GPU扩展箱中PCIEswitch...

【专利技术属性】
技术研发人员:董超荣世立
申请(专利权)人:郑州云海信息技术有限公司
类型:发明
国别省市:河南,41

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1