The present invention relates to an optimal method, large eddy simulation under CPU+MIC platform firstly, core analysis and improvement, according to each function call to get the optimized proportion, modifications to the core code in the program; the CPU side, for nested loop optimization, dynamic array in the circulation of the privatization process, and the core of circular parallel processing; MIC end of nested loop optimization, exploiting instruction level parallelism in the program; and heterogeneous collaborative, through data transmission and load balancing, CPU+MIC collaborative optimization. The invention realizes the transplantation of the 3D linear large eddy simulation program on the heterogeneous platform, and effectively improves the running efficiency and the execution performance of the program. Compared with the original code, the optimized program obtains the 24X and the fast response on the heterogeneous platform.
【技术实现步骤摘要】
本专利技术属于高性能计算
,特别涉及一种CPU+MIC异构平台下的大涡模拟算法优化处理方法。
技术介绍
无论是在自然界还是在工程中,流体的流动很多都是湍流流动。湍流是一种非常复杂的流动,表现有旋性、随机性等方面。研究湍流的主要方法是数值模拟。但是由于有些实验难以实现,例如机翼附近的空气流动,故数值模型的方法得到了研究人员的青睐。现有的湍流数值模拟方法包括直接数值模拟,雷诺平均模拟和大涡数值模拟。直接数值模拟不需要对湍流建立模型,采用数值计算直接求解流动的控制方程。工程中广泛应用的湍流数值模拟方法采用雷诺平均模型,这种方法将流动的质量、动量和能量输运方程进行统计平均后建立模型。目前计算机的计算能力仍对数值模拟紊流时所采用的网格尺度提出了严格的限制条件。人们可以获得尺度大于网格尺度的紊流结构,但却无法模拟小于该网格尺度的紊动结构。大涡模拟的思路是直接数值模拟大尺度紊流运动,而利用次网格尺度模型模拟小尺度紊流运动对大尺度紊流运动的影响。大涡模拟较直接数值模拟占计算机的内存小,模拟需要的时间也短,并且能够得到较雷诺平均模型更多的信息。所以随着超级计算机的发展,大涡模拟越来越受到国内外研究者的关注,并且认为大涡模拟将是最有前景的湍流模型。
技术实现思路
针对现有技术中的不足,本专利技术提供一种CPU+MIC异构平台下的大涡模拟算法优化处理方法,解决大涡模拟算法在异构众核架构运行时性能低,且受限于模拟范围模拟时长问题,针对异构平台下的大涡模拟程序,依次进行核心分析改进、CPU端优化、MIC端优化,以及异构协同优化,有效提升程序的运行效率和执行性能。按照本专利技术所 ...
【技术保护点】
一种CPU+MIC异构平台下的大涡模拟算法优化处理方法,其特征在于:包含如下步骤:步骤1、利用性能分析器对大涡模拟程序中的调用函数进行剖析,获取各个调用函数的比重,根据比重对程序中的核心代码进行优化修改;步骤2、针对CPU端程序代码,进行循环嵌套优化,对循环中的动态数组进行私有化处理,并通过ICC编译器对程序中的核心循环自动进行并行化处理;步骤3、针对MIC端程序代码,进行循环嵌套优化,通过循环剥离和多版本生成来获取若干对齐指令,同时进行尾循环展开,挖掘程序中的指令级并行;步骤4、通过数据传输和负载均衡处理,保持MIC端变量空间不释放,回传CPU端需要数据,通过分配CPU端和MIC端计算量,缩短两端计算时间的时间差,完成CPU+MIC协同优化处理。
【技术特征摘要】
1.一种CPU+MIC异构平台下的大涡模拟算法优化处理方法,其特征在于:包含如下步骤:步骤1、利用性能分析器对大涡模拟程序中的调用函数进行剖析,获取各个调用函数的比重,根据比重对程序中的核心代码进行优化修改;步骤2、针对CPU端程序代码,进行循环嵌套优化,对循环中的动态数组进行私有化处理,并通过ICC编译器对程序中的核心循环自动进行并行化处理;步骤3、针对MIC端程序代码,进行循环嵌套优化,通过循环剥离和多版本生成来获取若干对齐指令,同时进行尾循环展开,挖掘程序中的指令级并行;步骤4、通过数据传输和负载均衡处理,保持MIC端变量空间不释放,回传CPU端需要数据,通过分配CPU端和MIC端计算量,缩短两端计算时间的时间差,完成CPU+MIC协同优化处理。2.根据权利要求1所述的CPU+MIC异构平台下的大涡模拟算法优化处理方法,其特征在于:...
【专利技术属性】
技术研发人员:戴涛,张乾坤,丁伟,蒙家晓,黄建理,洪超,方萌,王志明,单征,韩林,郭绍忠,孟虹松,
申请(专利权)人:中国南方电网有限责任公司电网技术研究中心,南方电网科学研究院有限责任公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。