当前位置: 首页 > 专利查询>湘潭大学专利>正文

薄板无网格Galerkin结构模态分析的GPU加速方法技术

技术编号:21478256 阅读:57 留言:0更新日期:2019-06-29 04:57
本发明专利技术公开了一种薄板无网格Galerkin结构模态分析的GPU加速方法。本发明专利技术通过CPU读入薄板数据到主机内存,求取薄板内部和位移边界上积分点数据、节点影响域内积分点数据、积分点定义域内节点数据、交叉节点对数据,并复制至GPU全局存储器中;设定不同GPU线程块与线程数量,在GPU上并行计算节点形函数值、形函数一阶导数值及形函数二阶导数值和并行组装薄板总体刚度矩阵与质量矩阵;在GPU上根据边界条件对总体刚度矩阵进行修正,然后将修正后的刚度矩阵进行三角分解;在GPU中采用子空间迭代法进行模态分析,通过检查薄板结构频率残差来判断子空间迭代法是否结束及结果是否输出。本发明专利技术极大地缩短了薄板模态分析的计算耗时。

【技术实现步骤摘要】
薄板无网格Galerkin结构模态分析的GPU加速方法
本专利技术属于计算机辅助工程中薄板的结构动力仿真分析
,具体涉及一种薄板无网格Galerkin(伽辽金)结构模态分析的GPU(GraphicProcessingUnit,图形处理器)加速方法。
技术介绍
薄板具有二维结构的特性,且厚度薄、刚性好、重量轻、运输方便、加工简单等优点,被大量应用在众多工程领域,如汽车、轮船、家用电器等。然而,薄板容易振动这一特性,不仅会影响结构整体的强度,而且还会产生噪音,严重影响设备的性能及使用体验。因此,薄板振动已成为影响设备性能的一个重要因素,深入开展典型工程薄板结构的振动特性研究,对改善结构强度、减振降噪具有重要意义。薄板模态分析可确定薄板的固有频率及振动特性,是薄板结构动力设计的基础。当前,薄板模态分析主要采用有限元法,但有限元法的前、后处理工作量大,且网格容易畸变、自适应性能差。无网格方法是目前计算力学领域研究的热点之一,而无网格Galerkin法是目前影响最大、应用最广的无网格计算方法。无网格Galerkin法采用移动最小二乘法构造形函数,从能量泛函的弱变分形式中得到控制方程,并用拉格朗日法、罚函数法等处理本质边界条件,从而得到偏微分方程的数值解,并具有计算精度高、前后处理简单、自适应性好等优点,现已在结构模态分析问题中得到应用。然而结构模态分析中,刚度矩阵、质量矩阵的组装和总体离散系统方程求解的过程复杂,计算量大、计算耗时长,严重限制了无网格Galerkin法在大规模复杂结构薄板模态分析问题中的应用。近年来,随着计算技术和计算机技术的迅猛发展,并行计算已在多个领域内得到广泛应用,成为提高计算效率、节约计算成本的有效方法。然而由于并行机的规模大、维护成本高以及编程复杂等原因,导致其难以普及。相对于并行机,利用GPU进行大规模科学与工程计算的优点在于运算速度快、成本低廉。自从诞生之日起,GPU则以超越摩尔定律的速度快速发展,目前GPU已经随着技术发展演化成了高并行度、多线程和高存储器带宽的多核处理器,其运算能力和访存带宽都得到了不断的提升。因此研究薄板无网格Galerkin法结构模态分析的GPU加速方法,对于提高薄板无网格Galerkin法结构模态分析的计算效率具有重要意义。
技术实现思路
本专利技术的目的在于针对薄板无网格Galerkin法结构模态分析中存在的计算量大、耗时长等问题,提供一种薄板无网格Galerkin结构模态分析的GPU加速方法。本专利技术方法包括如下顺序的步骤:(1)将薄板的节点坐标、背景积分网格数据、边界条件数据、模态阶数、材料物理参数读取到主机内存中;(2)通过CPU调用薄板的节点坐标、背景积分网格数据、边界条件数据,并在薄板的背景积分网格和边界上布置积分点,求得薄板内部和位移边界上的积分点数据;通过对节点、积分点循环搜索,确定每个节点影响域内的积分点数据,以及每个积分点定义域内的节点数据,再根据节点影响域半径,确定交叉节点对信息;然后将上述所求数据由主机内存复制到GPU全局存储器中;(3)读取GPU全局存储器中薄板的节点坐标、积分点数据、积分点定义域内的节点数据,设置GPU中的线程块与线程的数量,并行加速计算节点的形函数值、形函数一阶导数值及形函数二阶导数值,然后建立GPU线程和组成交叉节点对的两个节点公共影响域内的积分点一一映射模式,并行加速组装总体刚度矩阵K、总体惩罚刚度矩阵Ka和总体质量矩阵M,并以按行压缩存储CSR格式存储于GPU全局存储器中;(4)在GPU中读取GPU全局存储器中存储的总体刚度矩阵K和总体惩罚刚度矩阵Kα数据,对施加边界条件的刚度矩阵进行修正其中,为修正后的刚度矩阵;(5)在GPU中对修正后的刚度矩阵进行三角分解,即其中,L为三角分解后的下三角矩阵,LT为三角分解后的上三角矩阵;(6)在CPU中给定初始向量矩阵X0,对于X0并不是单一向量组成,而是r个初始向量组成的矩阵,即X0=[(x1)0(x2)0…(xr)0],若需要求得系统的前p阶模态,则初始向量的个数r可取2*p和p+8中较小的数;初始向量(xi)0(i=1,2,…,r)可以任意选取,只要它们是相互独立的向量,且不和系统的前p个特征向量中的任一个正交;再把初始向量矩阵X0复制到GPU全局存储器中;(7)求解第k(k=0,1,2,…)次迭代的薄板频率与振型;(8)在CPU中赋值:ΦI=Xk+1Φ*,输出数据ΩI,ΦI,写入到输出文件中;其中,ΩI为薄板前r阶频率,ΦI为薄板前r阶频率所对应的振型,Xk+1为初始向量矩阵经过k+1次迭代的结果,为等效刚度矩阵与等效质量矩阵组成的广义特征值问题中前r阶特征值,Φ*为等效刚度矩阵与等效质量矩阵组成的广义特征值问题中前r阶特征值所对应的特征向量。具体的,步骤(7)包括如下过程:(a)在GPU中读取总体质量矩阵M与向量矩阵Xk数据,计算求解并赋值:Y=MXk;其中,Xk为初始向量矩阵经过k次迭代的结果;(b)在GPU中读取向量矩阵Y数据,解方程组LLTXk+1=Y,计算得到Xk+1;其中,Xk+1为初始向量矩阵经过k+1次迭代的结果;(c)在GPU中读取向量矩阵Xk+1数据,计算等效刚度矩阵等效质量矩阵然后将所求的等效刚度矩阵与等效质量矩阵的数据复制到主机内存中;其中,为Xk+1矩阵的转置;(d)在CPU中读取等效刚度矩阵与等效质量矩阵数据,求解子空间上广义特征值问题其中,为与组成的广义特征值问题中前r阶特征值,Φ*为与组成的广义特征值问题中前r阶特征值所对应的特征向量;(e)检查是否满足精度要求,满足精度则转至步骤(8),否则赋值向量矩阵Xk=Xk+1Φ*,并把向量矩阵Xk复制到GPU的全局存储器中,返回步骤(a);其中,为k次迭代后第i个特征值,er为收敛精度,为k+1次迭代后第i个特征值。本专利技术与现有技术相比,具有如下有益效果:(1)本专利技术采用无网格Galerkin法,不需要网格,对薄板模态分析结果具有较高的精度,而且本专利技术方法可广泛适用于二维任意几何形状的薄板模态分析问题。(2)本专利技术对薄板的总体质量矩阵和总体刚度矩阵同时并行组装,以及刚度矩阵的修正、修正后刚度矩阵的三角分解和子空间迭代法模态分析等全部都在GPU上实现,极大地提高了计算效率。附图说明图1为本专利技术方法的主流程框图。图2为本专利技术实施例的薄板示意图。图3为图2所示实施例的薄板节点示意图。具体实施方式下面结合附图和实施例对本专利技术作进一步详细的描述。参见图1,本专利技术薄板无网格Galerkin结构模态分析的GPU加速方法,包括如下顺序的步骤:(1)将薄板的节点坐标、背景积分网格数据、边界条件数据、模态阶数、材料物理参数读取到主机内存中;(2)通过CPU调用薄板的节点坐标、背景积分网格数据、边界条件数据,并在薄板的背景积分网格和边界上布置积分点,求得薄板内部和位移边界上的积分点数据;通过对节点、积分点循环搜索,确定每个节点影响域内的积分点数据,以及每个积分点定义域内的节点数据,再根据节点影响域半径,确定交叉节点对信息;然后将上述所求数据由主机内存复制到GPU全局存储器中;(3)读取GPU全局存储器中薄板的节点坐标、积分点数据、积分点定义域内的节点数据,设置GPU中的线程块与线程的数量,并行加速计本文档来自技高网
...

【技术保护点】
1.一种薄板无网格Galerkin结构模态分析的GPU加速方法,其特征在于包括如下顺序的步骤:(1)将薄板的节点坐标、背景积分网格数据、边界条件数据、模态阶数、材料物理参数读取到主机内存中;(2)通过CPU调用薄板的节点坐标、背景积分网格数据、边界条件数据,并在薄板的背景积分网格和边界上布置积分点,求得薄板内部和位移边界上的积分点数据;通过对节点、积分点循环搜索,确定每个节点影响域内的积分点数据,以及每个积分点定义域内的节点数据,再根据节点影响域半径,确定交叉节点对信息;然后将上述所求数据由主机内存复制到GPU全局存储器中;(3)读取GPU全局存储器中薄板的节点坐标、积分点数据、积分点定义域内的节点数据,设置GPU中的线程块与线程的数量,并行加速计算节点的形函数值、形函数一阶导数值及形函数二阶导数值,然后建立GPU线程和组成交叉节点对的两个节点公共影响域内的积分点一一映射模式,并行加速组装总体刚度矩阵K、总体惩罚刚度矩阵K

【技术特征摘要】
1.一种薄板无网格Galerkin结构模态分析的GPU加速方法,其特征在于包括如下顺序的步骤:(1)将薄板的节点坐标、背景积分网格数据、边界条件数据、模态阶数、材料物理参数读取到主机内存中;(2)通过CPU调用薄板的节点坐标、背景积分网格数据、边界条件数据,并在薄板的背景积分网格和边界上布置积分点,求得薄板内部和位移边界上的积分点数据;通过对节点、积分点循环搜索,确定每个节点影响域内的积分点数据,以及每个积分点定义域内的节点数据,再根据节点影响域半径,确定交叉节点对信息;然后将上述所求数据由主机内存复制到GPU全局存储器中;(3)读取GPU全局存储器中薄板的节点坐标、积分点数据、积分点定义域内的节点数据,设置GPU中的线程块与线程的数量,并行加速计算节点的形函数值、形函数一阶导数值及形函数二阶导数值,然后建立GPU线程和组成交叉节点对的两个节点公共影响域内的积分点一一映射模式,并行加速组装总体刚度矩阵K、总体惩罚刚度矩阵Ka和总体质量矩阵M,并以按行压缩存储CSR格式存储于GPU全局存储器中;(4)在GPU中读取GPU全局存储器中存储的总体刚度矩阵K和总体惩罚刚度矩阵Kα数据,对施加边界条件的刚度矩阵进行修正其中,为修正后的刚度矩阵;(5)在GPU中对修正后的刚度矩阵进行三角分解,即其中,L为三角分解后的下三角矩阵,LT为三角分解后的上三角矩阵;(6)在CPU中给定初始向量矩阵X0,对于X0并不是单一向量组成,而是r个初始向量组成的矩阵,即X0=[(x1)0(x2)0…(xr)0],若需要求得系统的前p阶模态,则初始向量的个数r可取2*p和p+8中较小的数;初始向量(xi)0(i=1,2,…,r)可以任意选取,只要它们是...

【专利技术属性】
技术研发人员:龚曙光许延坡卢海山谢桂兰张建平
申请(专利权)人:湘潭大学
类型:发明
国别省市:湖南,43

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1