SOR的并行通信优化方法技术

技术编号:2914461 阅读:418 留言:0更新日期:2012-04-11 18:40
SOR的并行通信优化方法,本发明专利技术针对传统的SOR迭代方法并行化中的通信和同步开销问题,提出了多层对称SOR迭代方法,并通过交错条块方法实现串行执行在高性能网络计算环境下的并行化。交错条块方法包括:引入了时滞技术改进区域分解方法,实现空间网格的划分;并通过网格条块重排序,改变网格条块间的数据依赖关系,提高条块执行的并行度,较大幅度地减少了通信启动和同步次数。因此,本发明专利技术比传统的区域分解方法和红黑排序方法具有更好的并行效率和可扩展性。

【技术实现步骤摘要】

本专利技术涉及SOR迭代方法并行化中的通信和同步开销问题。该专利技术主要包括:多层对称SOR迭代方法的提出、通过交错条块法实现串行程序在高性能网络计算环境下的并行化等方面的研究。
技术介绍
许多物理应用问题都归结为求微分方程数值解,其核心是高效地求解线性方程组,SOR迭代方法以其高效性和实现简单的特性而成为大型线性方程组求解的重要方法,并且常用作非定常迭代方法的高效预条件子,是许多应用软件的核心方法之一。在并行处理系统中,通信和同步开销是许多并行方法程序设计必须优先考虑的问题。通信和同步开销越大,程序的并行效率就越低。SOR方法由于本质上的串行特性,其并行方法的实现一直是数值计算的重要研究对象。关SOR迭代方法的并行化设计与实现,前人已经作了很多工作,Zhang通过使用基于区域分解的多色排序方法实现了面向集群的并行SOR方法,但是由于多色排序的缺点,导致其通信和同步开销很大。Xie通过改进区域分解方法,在保证相容序矩阵的情况下实现了SOR的并行化,但对优化同步开销缺乏考虑。Rohallah等人改进了区域分解方法,通过改变每一块数据的执行顺序,实现SOR的并行化方法。但是,当数据量很大时,该方法同样没有考虑通信优化的问题。Michelle提出一种空间条块划分方法,通过改变条块的执行顺序,得到了SOR的并行化方法,虽然提高了原有方法的数据局部性及并行度,但是该并行化方法只能应用于共享内存机器。
技术实现思路
本专利技术的目的是提出一种解决SOR迭代方法并行化中的通信和同步开销问题的方法。该专利技术提出了多层对称SOR迭代方法,通过交错条块方法实现串行方法在高性能网络计算环境下的并行化,从而达到减少通信启动和同步次数的目的。为实现上述目的,本专利技术包括:提出多层对称SOR迭代方法,对其描述如下:设一维椭圆偏微分方程为:uxx=0,x∈Ω=[0,1]                 (1)其中,Dirichlet边界条件为:u(x)=x,x∈∂Ω---(2)]]>-->对求解区域[0,1]使用网格划分,用空间间隔为h=1/(n+1)的长度把求解区域网格化,其中,n为正整数,网格点为xi{xi=ih,i=0,…,n+1本文档来自技高网...

【技术保护点】
SOR的并行通信优化方法,其特征在于:优化方法分为两个阶段顺序进行,包括串行执行阶段和并行执行阶段;将1维空间网格点和1维时间点组成1+1维的迭代空间网格系统S↓[node_space](Z,T),Z为一维的网格空间,T表示时间空间;其中网格点Pnode定义为:Pnode(x,t)={u↓[x](t)|(x∈Z,t∈T)},x表示一维网格点,t表示时间维,u↓[x](t)表示1+1维迭代空间内的网格点; 第一阶段:串行执行阶段 步骤1.网格块划分 用区域分解 方法将网格区域S↓[node_space](Z,T)在T=0处进行等份划分,划分后使得每块网格Sub_Snode_space(m,t=0)中的网格点数为R,1≤m≤L,m表示t=0时的第m个网格块,L为t=0时的总块数,R满足R>2K,K为单向迭代次数,K的值为cache大小的一半; 步骤2.在网格块的基础上,沿时间轴对网格区域进行划分 划分方法采用时滞技术,对每层网格子区域修正其边界,修正方法描述如下: a)对于奇数K层循环中的第一个网格块: Sub _Snode_space(m=1,t=k)=Sub_Snode_space(m=1,t=k-1)-Pynode(m,k-1),其中,Pynode(m,k-1)为第m个网格块在第k-1次迭代时间步的右边界点; b)对于奇数K层循环中的最 后一个网格块,即第L个网格块:Sub_Snode_space(m=L,t=k)=Sub_Snode_space(m=L,t=k-1)+Pynode(m-1,k-1),其中,Pynode(m-1,k-1)为第m-1个网格块在第k-1次迭代时间步的右边界点; c)对于奇数K层循环中的除第一个和最后一个网格块外的其他网格块:Sub_Snode_space(m,t=k)=Sub_Snode_space(m,t=k-1)+Pynode(m-1,k-1)-Pynode(m,k-1) ; d)对于偶数K层循环中的最后一个,即第L个网格块: Sub_Snode_space(m=L,t=k)=Sub_Snode_space(m=L,t=k-1)-Pznode(m,k-1),其中,Pznode(m,k-1)为第m个 网格块在第k-1次迭代时间步的左边界点; e)对于偶数K层循环中的第一个网格块:Sub_Snode_space(m=1,t=k...

【技术特征摘要】
1、SOR的并行通信优化方法,其特征在于:优化方法分为两个阶段顺序进行,包括串行执行阶段和并行执行阶段;将1维空间网格点和1维时间点组成1+1维的迭代空间网...

【专利技术属性】
技术研发人员:胡长军李建江赵冲冲张继林
申请(专利权)人:北京科技大学
类型:发明
国别省市:11[中国|北京]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利