当前位置: 首页 > 专利查询>方成玲专利>正文

针对带状线性系统上高斯消去的指数加速方法技术方案

技术编号:38383166 阅读:11 留言:0更新日期:2023-08-05 17:40
本发明专利技术公开了对带状线性系统上高斯消去的指数加速方法,属于数值求解领域.本方法包括以下步骤:S1;按照带宽的大小将矩阵分割为不相交的分块矩阵;S2:计算对角块中指定位置的分块矩阵对应的逆矩阵块;S3:利用逆矩阵块和高斯消去法消去指定位置非对角线上的非零分块处分块矩阵,并保存相应的消去矩阵变换;S4:重复步骤S1到S3,直到成为是一个对角型分块矩阵;SS:计算分块对角矩阵的逆矩阵;S6:根据步骤S3中的矩阵变换求得带状矩阵的消去变换;S7:求解带状线性系统。本发明专利技术实现对数次迭代求解带状线性系统,对现有的线性系统高斯求解方法与共轭梯度方法都有指数加速效果,且求解非常的高效和高精度。解非常的高效和高精度。解非常的高效和高精度。

【技术实现步骤摘要】
针对带状线性系统上高斯消去的指数加速方法


[0001]本专利技术涉及针对带状线性系统上高斯消去的指数加速方法,属于计算机矩阵求解领域,尤其适用于带状线性系统上高斯消去的指数加速方法。

技术介绍

[0002]仿真模拟领域(如计算流体力学)的问题通常被规约为求解线性方程组Ax=b,A是尺寸为n
×
n的大型稀疏线性矩阵,x是n
×
1的由未知变元构成的列向量,b为n
×
1的偏置向量.此外,由实际问题规约而成的系数矩阵A通常具有特殊的属性与非零结构,如在计算流体力学领域,应用有限元方法离散化偏微分方程而得来的矩阵往往是正定厄米特矩阵(Positive Hermitiian Definite,SPD);带状矩阵(Banded matrix)通常出现在计算力学、计量经济学、人工智能、与纳米电子学领域,其带宽d通常远小于矩阵维度n,即d<<n.直接解法,比如高斯消去、QR方法,LU方法、Cholesky方法通常应用于低维或稠密系数矩阵线性系统。在高维稀疏线性系统中,由于直接法难以并行求解同时舍入误差导致累计误差不可忽略,且在实际问题中往往不追求方程的精确解,所以通常用迭代解法以求解上述由实际问题引出的方程Ax=b的近似解.共轭梯度迭代法(Conjugate Gradient,CG)通常用于迭代求解对称正定系数矩阵的方程组,双共轭梯度(BiCG)方法通常用于一般系数线性方程组的迭代求解,在精确计算下这两个方法都最终在第n步收敛.由于数值计算的精度会影响共轭方法中空间基的正交性,这通常导致CG与BiCG方法在大规模问题求解时失效。为此,研究者提出了一系列的预处理方法来逼近所求系统的解.通常,预处理过程中蕴含求解一个带状系统解的问题。目前带状系统求解方法要么是串行求解,比如,带状系统高斯消去,迭代次数为O(n),要么是一般的迭代方法,精确计算下从非特殊初值开始迭代到得到精确解的次数至少为n.本专利基于带状系统结构提出一种专用于带状线性系统的并行加速求解方法:一种基于分块矩阵的带状系统指数加速并行高斯消去方法。该方法既可以直接求解带状系统,也可以作为带状系统的预解算子,其并行迭代次数为O(log2n),相对串行方法与传统迭代方法该方法具有指数加速效果.另外,我们也可以使用该方法以同样计算复杂度并行求解带状矩阵的逆矩阵。
[0003]综上所述,快速的带状线性系统的求解方法可以广泛应用于科学计算与过程计算的各个领域,比如可计算流体力学、博弈论、计量经济学、人工智能、计算生物学、分子动力计算、仿真模拟等等领域,加速计算过程、降低计算能耗,为低碳绿色计算提供新的技术支撑.

技术实现思路

[0004]有鉴于此,本专利技术提供及针对带状线性系统上高斯消去的指数加速方法,通过对矩阵进行分块,然后迭代地并行消去矩阵中的非零块,最终得到一个对角型分块矩阵,对最后矩阵并行求逆,根据这些矩阵直接的递归关系可得到原带状矩阵的逆矩阵为O(log2n)个稀疏矩阵的乘积,再使用矩阵向量乘积的并行计算求解带状线性系统.
[0005]为达到上述目的,本专利技术提供如下技术方案:
[0006]针对带状线性系统上高斯消去的指数加速方法,其特征在于,针对带宽为d的带状线性系统Ax=b,其中,A为n
×
n的正定带状厄米特矩阵,当所给带状矩阵不是正定厄米特矩阵时,可通过求解A
H
Ax=A
H
b来求解Ax=b,此处A
H
表示A的共轭转置矩阵;x为n
×
1的未知数向量;b为n
×
1的偏置向量;d≥1是带状矩阵非零半区域的对角线条数,结合图1,该方法包含以下步骤:
[0007]S1:从A0=A开始进行矩阵分块,按照d
×
d的大小将矩阵A
i
分割为不相交的分块矩阵;其中,i=0,1,2,

为迭代次数;
[0008]S2:计算对角块中指定位置的分块矩阵对应的逆矩阵块,其中,对角块为包含了A
i
对角线元素的分块矩阵;
[0009]S3:利用逆矩阵块和高斯消去法消去A
i
中第行与列中非对角线上的非零分块处分块矩阵,得到矩阵A
i+1
,并保存相应的消去矩阵变换P
i

[0010]S4:如果步骤S3所得A
i+1
不是一个对角型分块矩阵,则重复步骤S1到S3,直到A
i+1
是一个对角型分块矩阵;
[0011]S5:令D=A
i+1
,并行地计算分块对角矩阵D的逆矩阵D
‑1;
[0012]S6:根据步骤S3中的矩阵变换P
l
,0≤l≤i,得到带状矩阵的消去变换P=П
0≤l≤i
P
l
满足关系PAP
H
=D,其中P
H
是P的共轭转置矩阵;
[0013]S7:按照x=P
H
D
‑1Pb,求解Ax=b;
[0014]所述的是集合Ind0={1,2,

,n}的子集,其元素按从小到大排列,用来表示第i次迭代时A
i
需要消去的行与列,满足其具体的递归计算步骤为:从i=0开始,将Ind
i
中所有处于奇数位置的元素提取出来,按从小到大排列构成新的集合将中所有处于偶数位置的元素提取出来,按从小到大排列构成新的集合Ind
i+1

[0015]所述的高斯消去法是矩阵A
i
的某个分块通过矩阵行变换或者列变换把指定分块变换为0分块矩阵.
[0016]进一步,步骤S1所述矩阵分块具体为:按照d
×
d的大小将矩阵A
i
分割为不相交的个分块矩阵;其中,A
i
的每一行和每一列至多有三个分块非零;当n/d不是整数时,无需对不足分块进行补充,最后的对角块D
k,k
大小为d
’×
d

,最后一行除D
k,k
以外的分块大小为d
’×
d,最后一列除D
k,k
以外的分块大小为d
×
d

,其中,为向上取整函数,d

=n mod d,mod为取模函数。
[0017]可优选地,所述的步骤S2所述的逆矩阵块的计算可以采用并行计算,根据计算机的处理器个数p和第i次迭代时的元素个数决定的,进行轮的并行计算.具体地,如果的元素个数小于等于p则任意选择个处理器,每个处理器计算一个A
i
的对角分块D
j,j
的逆矩阵即可,如果的元素个数大于p则我们需要进行如下的轮并行计算,第m(1≤m<p)个处理器计算中的第至个元素对应的分块的逆矩阵,第p个处理器计算中剩下元素对应的分块的逆矩阵。<本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.针对带状线性系统上高斯消去的指数加速方法,其特征在于,针对带宽为d的带状线性系统Ax=b,其中,A为n
×
n的正定带状厄米特矩阵,当所给带状矩阵不是正定厄米特矩阵时,可通过求解A
H
Ax=A
H
b来求解Ax=b,此处A
H
表示A的共轭转置矩阵;x为n
×
1的未知数向量;b为n
×
1的偏置向量;d≥1是带状矩阵非零半区域的对角线条数,该方法包含以下步骤:S1:从A0=A开始进行矩阵分块,按照d
×
d的大小将矩阵A
i
分割为不相交的分块矩阵;其中,i=0,1,2,

为迭代次数;S2:计算对角块中指定位置的分块矩阵对应的逆矩阵块,其中,对角块为包含了A
i
对角线元素的分块矩阵;S3:利用逆矩阵块和高斯消去法消去A
i
中第行与列中非对角线上的非零分块处分块矩阵,得到矩阵A
i+1
,并保存相应的消去矩阵变换P
i
;S4:如果步骤S3所得A
i+1
不是一个对角型分块矩阵,则重复步骤S1到S3,直到A
i+1
是一个对角型分块矩阵;S5:令D=A
i+1
,计算分块对角矩阵D的逆矩阵D
‑1;S6:根据步骤S3中的矩阵变换P
l
,0≤l≤i,得到带状矩阵的消去变换P=∏
0≤l≤i
P
l
满足关系PAP
H
=D,其中P
H
是P的共轭转置矩阵;S7:按照x=P
H
D
‑1Pb,求解Ax=b;所述的是集合Ind0={1,2,

,n}的子集,其元素按从小到大排列,用来表示第i次迭代时A
i
需要消去的行与列,满足其具体的递归计算步骤为:从i=0开始,将Ind
i
中所有处于奇数位置的元素提取出来,按从小到大排列构成新的集合将中所有处于偶数位置的元素提取出来,按从小到大排列构成新的集合Ind
i+1
;所述的高斯消去法是矩阵A
i
的某个分块通过矩阵行变换或者列变换把指定分块变换为...

【专利技术属性】
技术研发人员:刘江方成玲
申请(专利权)人:方成玲
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1