【技术实现步骤摘要】
本专利技术涉及SOR迭代方法并行化中的通信和同步开销问题。该专利技术主要包括:多层对称SOR迭代方法的提出、通过交错条块法实现串行程序在高性能网络计算环境下的并行化等方面的研究。
技术介绍
许多物理应用问题都归结为求微分方程数值解,其核心是高效地求解线性方程组,SOR迭代方法以其高效性和实现简单的特性而成为大型线性方程组求解的重要方法,并且常用作非定常迭代方法的高效预条件子,是许多应用软件的核心方法之一。在并行处理系统中,通信和同步开销是许多并行方法程序设计必须优先考虑的问题。通信和同步开销越大,程序的并行效率就越低。SOR方法由于本质上的串行特性,其并行方法的实现一直是数值计算的重要研究对象。关SOR迭代方法的并行化设计与实现,前人已经作了很多工作,Zhang通过使用基于区域分解的多色排序方法实现了面向集群的并行SOR方法,但是由于多色排序的缺点,导致其通信和同步开销很大。Xie通过改进区域分解方法,在保证相容序矩阵的情况下实现了SOR的并行化,但对优化同步开销缺乏考虑。Rohallah等人改进了区域分解方法,通过改变每一块数据的执行顺序,实现SOR的并行化方法。但是,当数据量很大时,该方法同样没有考虑通信优化的问题。Michelle提出一种空间条块划分方法,通过改变条块的执行顺序,得到了SOR的并行化方法,虽然提高了原有方法的数据局部性及并行度,但是该并行化方法只能应用于共享内存机器。
技术实现思路
本专利技术的目的是提出一种解决SOR迭代方法并行化中的通信和同步开销问题的方法。该专利技术提出了多层对称SOR迭代方法,通过交错条块方法实现串行方法在高性能 ...
【技术保护点】
SOR的并行通信优化方法,其特征在于:优化方法分为两个阶段顺序进行,包括串行执行阶段和并行执行阶段;将1维空间网格点和1维时间点组成1+1维的迭代空间网格系统S↓[node_space](Z,T),Z为一维的网格空间,T表示时间空间;其中网格点Pnode定义为:Pnode(x,t)={u↓[x](t)|(x∈Z,t∈T)},x表示一维网格点,t表示时间维,u↓[x](t)表示1+1维迭代空间内的网格点; 第一阶段:串行执行阶段 步骤1.网格块划分 用区域分解 方法将网格区域S↓[node_space](Z,T)在T=0处进行等份划分,划分后使得每块网格Sub_Snode_space(m,t=0)中的网格点数为R,1≤m≤L,m表示t=0时的第m个网格块,L为t=0时的总块数,R满足R>2K,K为单向迭代次数,K的值为cache大小的一半; 步骤2.在网格块的基础上,沿时间轴对网格区域进行划分 划分方法采用时滞技术,对每层网格子区域修正其边界,修正方法描述如下: a)对于奇数K层循环中的第一个网格块: Sub ...
【技术特征摘要】
1、SOR的并行通信优化方法,其特征在于:优化方法分为两个阶段顺序进行,包括串行执行阶段和并行执行阶段;将1维空间网格点和1维时间点组成1+1维的迭代空间网...
【专利技术属性】
技术研发人员:胡长军,李建江,赵冲冲,张继林,
申请(专利权)人:北京科技大学,
类型:发明
国别省市:11[中国|北京]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。