System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种面向异构多域处理器的MLBM-DEM流水线调度优化方法技术_技高网
当前位置: 首页 > 专利查询>天津大学专利>正文

一种面向异构多域处理器的MLBM-DEM流水线调度优化方法技术

技术编号:44343251 阅读:5 留言:0更新日期:2025-02-18 20:56
本申请提出了一种面向异构多域处理器的MLBM‑DEM流水线调度优化方法。该方法包括:S1、执行基于应用感知和异构多域处理器的数据划分,分别计算MLBM和DEM的计算量以及MLBM和DEM的计算能力比例;S2、根据所述MLBM和DEM的计算能力比例分配CPU端和加速域簇的计算资源,构建面向异构多域处理器的流水线设计模块;S3、获取除CPU端和加速域簇外的剩余计算资源,执行Manager‑Worker实时调度机制。本申请在保证计算精度的情况下,实现MLBM‑DEM流水线调度优化计算,进一步提高了整体计算性能。

【技术实现步骤摘要】

【】本专利技术涉及流体力学和高性能计算领域,尤其涉及一种面向异构多域处理器的mlbm-dem流水线调度优化方法。


技术介绍

0、
技术介绍

1、在当今科技快速发展的时代,高性能计算在众多领域中发挥着重要作用。流体力学模拟作为科学研究和工程设计的基础,需要大规模的计算资源来实现精确模拟。离散元多层格子boltzmann方法(mlbm-dem)是结合离散元方法(discrete element method,dem)和多层格子boltzmann方法(muti-level lattice boltzmann method,mlbm)的数值模拟技术,旨在模拟和分析由流体和颗粒材料组成的复杂系统。该方法综合了dem和mlbm各自的优势,用于研究颗粒-流体相互作用的动态行为,具有广泛的应用前景。mlbm-dem由于其复杂的场景,导致其计算量更加庞大,因此利用国产e级超算系统的异构多域处理器加速,可以有效减少计算量并提升计算性能与模拟精度。然而由于mlbm-dem的核心计算在于mlbm中的碰撞迁移计算和dem中的粒子间的相互作用力,因此将这两部分的计算放在异构多域处理器中进行并行计算,其余的边界处理等工作放在cpu端,这样会产生一个具有强数据依赖关系的流水线,导致在数据划分和负载均衡上面临挑战,尤其是在应用于国产e级超算系统上。

2、如今,计算流体力学研究的规模和复杂程度不断增加,单个计算节点已无法满足计算需求,必须依赖高性能计算机。我国的超级计算机正在从p级向e级发展,异构多处理器和加速器成为发展趋势。随着dennard扩展后单核性能提升的瓶颈,构建多核高性能处理器已成必要。

3、如何在异构多域处理器上实现mlbm-dem的流水线调度优化方法,以充分利用异构多域处理器的性能,提升mlbm-dem的计算效率,以及如何设计优化强数据依赖的流水线调度算法,成为亟待解决的问题。


技术实现思路

0、
技术实现思路

1、针对现有技术存在的不足之处,本申请提供一种面向异构多域处理器的mlbm-dem流水线调度优化方法,实现基于应用感知和异构多域处理器的数据划分,构建面向异构多域处理器的流水线设计模块,并设计manager-worker实时调度机制优化流水线调度,进一步提高了整体计算性能。

2、本申请一种面向异构多域处理器的mlbm-dem流水线调度优化方法,包括以下步骤:

3、s1、执行基于应用感知和异构多域处理器的数据划分,分别计算mlbm和dem的计算量以及mlbm和dem的计算能力比例;

4、s2、根据所述mlbm和dem的计算能力比例分配cpu端和加速域簇的计算资源,构建面向异构多域处理器的流水线设计模块;

5、s3、获取除cpu端和加速域簇外的剩余计算资源,执行manager-worker实时调度机制。

6、优选的,所述异构多域处理器包含通用区域和加速区域,包括以下特征:

7、异构多域处理器包含16个cpu、96个控制核(ctrl)和1536个加速核(acc),在1.2ghz运行时实现11.6tflops的双精度性能和45.4gfops/w的功耗效率。异构多域处理器有以下几个特点:

8、(1)异构多域微架构,其中16个cpu组成一个通用区域,96个控制核(ctrl)和1536个加速核(acc)分组成一个加速区域,加速区域平均分为四个加速域簇;

9、(2)结合超长指令字(vliw)和加速阵列微架构,其中每个加速核工作在vliw模式下,每16个加速核(acc)和1个控制核(ctrl)组织成一个加速阵列;

10、(3)超高带宽和高可靠的阵列存储器,它是一种矢量存储器,最多支持两个向量加载/存储,阵列存储器加载/存储的数据类型包括半字(32位)、字(64位)和双字(128位),因此阵列存储器可以同时向16个加速器内核提供最多512字节(16×2×128位)。

11、其中,每个加速域簇有24个控制核(ctrl),384个加速核(acc),以及片上共享内存(gsm)、高宽带共享内存(hbsm)和片外ddr内存。每个加速域簇彼此独立执行。通用区域的cpu可以访问不同加速域簇的所有hbsm和ddr空间,而控制核和加速器核只能访问各自加速域簇内的gsm、hbsm和ddr。

12、不同加速域簇之间的数据共享是通过cpu端实现。通用区域的16个cpu有自己的l1和l2缓存,并通过支持缓存一致性的mesh noc连接。通用区域能够进行总体任务控制、操作系统启动和通用处理,加速区域设计用于计算密集型任务。在每个加速域簇中,1个控制核(ctrl)和16个加速核(acc)组成一个加速阵列,将24个控制核(ctrl)和384个加速核(acc)组成24个加速阵列。

13、优选的,所述基于应用感知和异构多域处理器的数据划分,包括如下步骤:

14、在异构计算中,任务大小与计算能力的关系至关重要,合理的任务划分可以显著提高计算效率并实现负载均衡。基于此,提出了一种基于应用感知的动态数据划分方法。该方法根据计算任务的特性和数据量大小,动态地划分和分配计算网格。这种方法能够根据不同计算任务的需求,动态适配和优化计算资源的使用,从而提高计算效率并减少资源浪费,包括如下步骤:

15、s11、计算调整后的并行处理能力

16、

17、其中,padj为调整后的并行处理能力,ci为第i种核的计算能力,fi为该种核在总计算中的占比,n为该核类型的数量;对于异构多域处理器,包括cpu和加速域簇;

18、s12、获得计算量与数据量的需求比例

19、

20、其中,r为计算量与数据量的需求比例,c和d分别为完成一个网格块所需的计算量和数据量;

21、s13、计算异构多域处理器上流水线网格块的理想大小

22、

23、其中,b为内存带宽,l为数据传输延迟;

24、s14、计算异构多域处理器上流水线网格块的大小

25、

26、其中,α为自适应调整因子;

27、s15、计算mlbm和dem的计算量以及两者之间的计算能力比例

28、假设mlbm的计算量为cmlbm,表示执行mlbm操作所需的计算量,包括碰撞和迁移步骤;dem的计算量为cdem,表示执行dem操作所需的计算量,包括颗粒之间的相互作用计算;mlbm的初始数据量为dmlbm,表示用户输入数据规模中mlbm的初始数据量;dem的初始数据量为ddem,表示用户输入数据规模中dem的初始数据量;假设mlbm与dem之间的计算能力比例为rcomp,则:

29、mlbm的计算量cmlbm与网格点的数量和每个网格点上执行的操作数量相关,假设每个点上平均执行omlbm个操作,则:

30、

31、dem的计算量cdem取决于颗粒的数量和每对颗粒之间交互的计算本文档来自技高网...

【技术保护点】

1.一种面向异构多域处理器的MLBM-DEM流水线调度优化方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的方法,其特征在于,所述异构多域处理器包含通用区域和加速区域,所述通用区域包括16个CPU核;所述加速区域平均分成四个加速域簇,所述加速域簇包括24个控制核Ctrl、384个加速核Acc、片上共享内存GSM、高宽带共享内存HBSM和片外内存DDR。

3.根据权利要求1所述的方法,其特征在于,所述基于应用感知和异构多域处理器的数据划分,得到MLBM和DEM的计算能力比例,包括如下步骤:

4.根据权利要求3所述的方法,其特征在于,所述面向异构多域处理器的流水线设计模块,依次包括:

5.根据权利要求4所述的方法,其特征在于,在各流水线设计模块之间设置缓冲区,用于存储临时计算结果。

6.根据权利要求1所述的方法,其特征在于,所述Manager-Worker实时调度机制,包括如下步骤:

【技术特征摘要】

1.一种面向异构多域处理器的mlbm-dem流水线调度优化方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的方法,其特征在于,所述异构多域处理器包含通用区域和加速区域,所述通用区域包括16个cpu核;所述加速区域平均分成四个加速域簇,所述加速域簇包括24个控制核ctrl、384个加速核acc、片上共享内存gsm、高宽带共享内存hbsm和片外内存ddr。

3.根据权利要求1所述的方法,其特征在于,...

【专利技术属性】
技术研发人员:汤善江廖松于策续晟羽孙超肖健
申请(专利权)人:天津大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1