本发明专利技术提供一种异构加速刀片式计算机系统架构,涉及高密度刀片式服务器领域,本发明专利技术在一套体系架构中实现轻量计算和重量计算资源的紧耦合式互联,实现混合式计算。同时也可通过高速互联平面对异构重量级加速处理资源进行按需划分和配置。整个架构由计算处理单元、系统中背板、网络交换单元、高速I/O单元、供电单元、散热单元和集中管理单元组成;该体系架构可以充分根据业务负载和业务类型,对异构加速处理资源进行划分和配置,从而达到系统资源的最优化配置。
【技术实现步骤摘要】
【专利摘要】本专利技术提供一种异构加速刀片式计算机系统架构,涉及高密度刀片式服务器领域,本专利技术在一套体系架构中实现轻量计算和重量计算资源的紧耦合式互联,实现混合式计算。同时也可通过高速互联平面对异构重量级加速处理资源进行按需划分和配置。整个架构由计算处理单元、系统中背板、网络交换单元、高速I/O单元、供电单元、散热单元和集中管理单元组成;该体系架构可以充分根据业务负载和业务类型,对异构加速处理资源进行划分和配置,从而达到系统资源的最优化配置。【专利说明】一种异构加速刀片式计算机系统架构
本专利技术涉及高密度刀片式服务器领域,具体地说是一种异构加速刀片式计算机系统架构。
技术介绍
随着网络数据量的爆炸式增长,对设备的处理能力也提出了很大的需求,以往传统X86架构处理器在处理器核心数量及对并行计算架构的支持方面都不如异构加速处理器,并且通常的X86架构服务器在密度和扩展灵活性方面都存在一定的局限和不足。而随着GPU这种异构加速处理及应用的广泛,以及刀片这种具备高密度、高模块化及高集成度形态成品越来越受到数据中心等客户的青睐,因此给具备高可扩展性和高浮点运算能力的高密度刀片式服务器产品带来的广泛的市场需求。
技术实现思路
本专利技术公开一种异构加速刀片式计算机系统架构,通过紧耦合式高速互联将不同计算资源有效的融合,同时也可实现计算密度的提升和计算资源灵活的扩展。该体系架构的创新在于通过高速的互联平面,在一套体系架构中实现轻量计算和重量计算资源的紧耦合式互联,实现混合式计算。同时也可通过高速互联平面对异构重量级加速处理资源进行按需划分和配置。整个架构由计算处理单元、系统中背板、网络交换单元、高速I/O单元、供电单元、散热单元和集中管理单元组成, 计算处理单元是整个系统的处理核心,负责数据的运算与处理。计算处理单元内部由轻量处理单元、高速通讯单元、高速互连单元和重载处理单元组成。每个计算处理单元由2个轻量处里单元和4个重载处理单元组成,轻量处理单元采用通用的X86架构处理器设计,重载处理单元采用具备高浮点运算处理能力的GPU组成,重载处理单元通过高速互连单元与轻量处理单元之间进行数据的交互,高速互连单元支持四通道高速并发通讯。计算单元处理的数据通过高速通讯单元将数据与外部进行交互,高速通讯单元的数据传输带宽可以达到 100Gb/s ο系统中背板主要承载计算处理单元与网络交换单元、高速I/O单元、供电散热单元、供电单元与集中管理单元之间的通讯。计算处理单元与网络交换单元之间通过IOGb/s以太网链路进行互连,计算处理任务通过网络交换模块被分配到计算处理单元,多个计算处理单元通过高速I/O单元实现多计算单元间数据的高速交互和并行计算。供电单元基于冗余的设计架构,为整个系统提供9000W?15000W的供电保障,并支持N+1和N+N的冗余模式,同时支持交流供电和直流供电两种模式。散热单元主要为整个系统提供散热保证,散热单元分成两个独立散热区域,区域I主要满足所有计算处理单元的散热,区域2主要满足网络交换单元、高速I/O单元和集中管理单元的散热,分区独立散热的设计有助于降低系统的单点散热故障风险,提高系统的冗余性。集中管理单元是整个系统的管理中枢,通过I2C和以太网的管理链路与其余所有模块连接,负责监控所有模块的运行状态,包括功耗状态、散热情况及信息配置,同时还提供给远程管理功能。本专利技术的有益效果是: 该体系架构通过紧耦合式高速互联将不同计算资源有效的融合,在支持通用X86处理器的基础上,还可以支持具备高浮点计算能力的异构加速处理器,并支持轻量级和重量级两种模式的混合式计算。同时整个架构具备灵活的扩展性,该体系架构可以充分根据业务负载和业务类型,对异构加速处理资源进行划分和配置,从而达到系统资源的最优化配置。通过高速的互联平面,在一套体系架构中实现轻量计算和重量计算资源的紧耦合式互联,实现混合式计算。同时也可通过高速互联平面对异构重量级加速处理资源进行按需划分和配置。突破通用X86计算设备计算和扩展的限制,满足互联网及数据中心等对数据大量处理应用的迫切需求,具备良好的市场应用及推广前景。【专利附图】【附图说明】图1为本专利技术的系统架构图; 图2为轻量计算处理模块示意图; 图3为重载计算处理模块示意图。【具体实施方式】具备可扩展性和高浮点计算能力的异构加速刀片式计算机系统架构,该体系架构的创新在于通过高速的互联平面,在一套体系架构中实现轻量计算和重量计算资源的紧耦合式互联,实现混合式计算。同时也可通过高速互联平面对异构重量级加速处理资源进行按需划分和配置。整个架构由计算处理单元、系统中背板、网络交换单元、高速I/o单元、供电单元、散热单元和集中管理单元组成,如图1所示,其中: 计算处理单元是整个系统的处理核心,负责数据的运算与处理。计算处理单元内部由轻量处理单元、高速通讯单元、高速互连单元和重载处理单元组成。每个计算处理单元由2个轻量处里单元和4个重载处理单元组成,轻量处理单元采用通用的X86架构处理器设计,重载处理单元采用具备高浮点运算处理能力的GPU组成,重载处理单元通过高速互连单元与轻量处理单元之间进行数据的交互,高速互连单元支持四通道高速并发通讯。计算单元处理的数据通过高速通讯单元将数据与外部进行交互,高速通讯单元的数据传输带宽可以达到 100Gb/s。系统中背板主要承载计算处理单元与网络交换单元、高速I/O单元、供电散热单元、供电单元与集中管理单元之间的通讯。计算处理单元与网络交换单元之间通过IOGb/s以太网链路进行互连,计算处理任务通过网络交换模块被分配到计算处理单元,多个计算处理单元通过高速I/O单元实现多计算单元间数据的高速交互和并行计算。供电单元基于冗余的设计架构,为整个系统提供9000W?15000W的供电保障,并支持N+1和N+N的冗余模式,同时支持交流供电和直流供电两种模式。散热单元主要为整个系统提供散热保证,散热单元分成两个独立散热区域,区域I主要满足所有计算处理单元的散热,区域2主要满足网络交换单元、高速I/O单元和集中管理单元的散热,分区独立散热的设计有助于降低系统的单点散热故障风险,提高系统的冗余性。集中管理单元是整个系统的管理中枢,通过I2C和以太网的管理链路与其余所有模块连接,负责监控所有模块的运行状态,包括功耗状态、散热情况及信息配置,同时还提供给远程管理功能。图2是轻量计算处理模块的原理图,两个轻量处理单元之间通过两条9.2GT/s的OPI总线进行互连,实现两个轻量处理之间的数据通讯。每个轻量处理单元通过2条PCIe3.0 xl6的高速扩展链路连接高速互连单元,通过高速互连单元与重载计算处理模块上的重载计算单元进行数据通讯。同时每个轻量处理单元还通过I条PCIe3.0 x8的高速扩展链路用于连接高速通讯单元,将运算的数据通过100Gb/S的高速传输通道传递到系统的高速I/o单元上。轻量处理单元I通过DMI链路连接控制单元,控制单元主要负责模块中存储、网络、低速基础I/O和管理间的数据控制,其中:控制单元通过PCIe3.0 x4的链路连接网络单元,网络单元支持2条lOGb/s的数据链路,用于连接系统中的网络交换单元,可以将通过网络交换单元传输的计算任务传递到处理单本文档来自技高网...
【技术保护点】
一种异构加速刀片式计算机系统架构,其特征在于通过高速的互联平面,在一套体系架构中实现轻量计算和重量计算资源的紧耦合式互联,实现混合式计算;同时也可通过高速互联平面对异构重量级加速处理资源进行按需划分和配置;整个架构由计算处理单元、系统中背板、网络交换单元、高速I/O单元、供电单元、散热单元和集中管理单元组成, 计算处理单元是整个系统的处理核心,负责数据的运算与处理; 系统中背板主要承载计算处理单元与网络交换单元、高速I/O单元、供电散热单元、供电单元与集中管理单元之间的通讯; 散热单元主要为整个系统提供散热保证; 集中管理单元是整个系统的管理中枢,通过I2C和以太网的管理链路与其余所有模块连接,负责监控所有模块的运行状态,包括功耗状态、散热情况及信息配置,同时还提供给远程管理功能。
【技术特征摘要】
【专利技术属性】
技术研发人员:王磊,
申请(专利权)人:浪潮电子信息产业股份有限公司,
类型:发明
国别省市:山东;37
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。