首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 341 毫秒
1.
针对迭代法求解无网格Galerkin法中线性方程组收敛速度慢的问题,提出了一种耦合GPU和预处理共轭梯度法的无网格Galerkin法并行算法,在对其总体刚度矩阵、总体惩罚刚度矩阵进行并行联合组装的同时即可得到对角预处理共轭矩阵,有效地节省了GPU的存储空间和计算时间;通过采用四面体积分背景网格,提高了所提算法对三维复杂几何形状问题的适应性。通过2个三维算例验证了所提算法的可行性,且预处理共轭梯度法与共轭梯度法相比,其迭代次数最大可减少1686倍,最大的迭代时间可节省1003倍;同时探讨了加速比与线程数和节点个数之间的关系,当线程数为64时其加速比可达到最大,且预处理共轭梯度法的加速比与共轭梯度法相比可增大4.5倍,预处理共轭梯度法的加速比最大达到了88.5倍。  相似文献   

2.
研究了GPU(Graphics Processing Units)计算应用于有限元方法中的总刚计算和组装、稀疏矩阵与向量乘积运算、线性方程组求解问题,并基于CUDA(Compute Unified Device Architecture)平台利用GTX295GPU进行程序实现和测试。系统总刚采用CSR(Compressed Sparse Row)压缩格式存放于GPU显存中,用单元染色方法实现总刚并行计算组装,用共轭梯度迭代法求解大规模线性方程组。对300万自由度以内的空间桁架和平面问题算例,GPU有限元计算分别获得最高9.5倍和6.5倍的计算加速比,并且加速比随系统自由度的增加而近似线性增加,GFLOP/s峰值也有近10倍的增加。  相似文献   

3.
一维抛物型偏微分方程可以用精细积分方法精确求解。当精细积分中的矩阵指数函数用Pad 逼近来代替时 ,可以得到一系列由简到繁、精度由低到高的差分格式 ,因而便于根据实际需要进行选取。常见的求解抛物型方程的差分格式如古典显式格式、隐式格式及六点差分格式为其中的特例。Pad 逼近格式主要包括矩阵运算和线性方程组求解。本文利用 Pad 逼近格式对应的方程组系数矩阵为带状矩阵的特点 ,把原来在整个区域上求解的问题转化为分区域求解 ,在 TRANSPUTER并行机上实现了该问题的并行算法 ,并对该并行算法的时间复杂度进行了分析。算例结果表明 Pad 逼近并行算法有很好的计算效果和并行效率。  相似文献   

4.
一维抛物型偏微分方程可以用精细积分方法精确求解。当精细积分中的矩阵指数函数用Pade逼近来代替时,可以得到一系列由简到繁、精度由低到高的差分格式,因而便于根据实际需要进行选取。常见的求解抛物型方程的差分格式如古典显式格式、隐式格式及六点差分格式为其中的特例。Pade逼近格式主要包括矩阵运算和线性方程组求解。本文利用Pade逼近格式对应的方程组系数矩阵为带状矩阵的特点,把原来在整个区域上求解的问题转化为分区域求解,在TRANSPUTER并行机上实现了该问题的并行算法,并对该并行算法的时间复杂度进行了分析。算例结果表明Pade逼近并行算法有很好的计算效果和并行效率。  相似文献   

5.
一维抛物型偏微分方程可以用精细积分方法精确求解.当精细积分中的矩阵指数函数用Padé逼近来代替时,可以得到一系列由简到繁、精度由低到高的差分格式,因而便于根据实际需要进行选取.常见的求解抛物型方程的差分格式如古典显式格式、隐式格式及六点差分格式为其中的特例.Padé逼近格式主要包括矩阵运算和线性方程组求解.本文利用Padé逼近格式对应的方程组系数矩阵为带状矩阵的特点,把原来在整个区域上求解的问题转化为分区域求解,在TRANSPUTER并行机上实现了该问题的并行算法,并对该并行算法的时间复杂度进行了分析.算例结果表明Padé逼近并行算法有很好的计算效果和并行效率.  相似文献   

6.
于要杰  刘锋  高超  冯毅 《力学学报》2021,53(6):1586-1598
最近, 基于非结构网格的高阶通量重构格式(flux reconstruction, FR)因其构造简单且通用性强而受到越来越多人的关注. 但将FR格式应用于大规模复杂流动的模拟时仍面临计算开销大、求解时间长等问题. 因此, 亟需发展与之相适应的高效隐式求解方法和并行计算技术. 本文提出了一种基于块Jacobi迭代的高阶FR格式求解定常二维欧拉方程的单GPU隐式时间推进方法. 由于直接求解FR格式空间和隐式时间离散后的全局线性方程组效率低下并且内存占用很大. 而通过块雅可比迭代的方式, 能够改变全局线性方程组左端矩阵的特征, 克服影响求解并行性的相邻单元依赖问题, 使得只需要存储和计算对角块矩阵. 最终将求解全局线性方程组转化为求解一系列局部单元线性方程组, 进而又可利用LU分解法在GPU上并行求解这些小型局部线性方程组. 通过二维无黏Bump流动和NACA0012无黏绕流两个数值实验表明, 该隐式方法计算收敛所用的迭代步数和计算时间均远小于使用多重网格加速的显式Runge-Kutta格式, 且在计算效率方面至少有一个量级的提升.   相似文献   

7.
构建航天飞行器的结构有限元模型是准确模拟飞行仿真、完成飞行器在轨飞行阶段结构故障监测和诊断的基础。采用细长体飞行器简化梁模型,提出新的基于CUDA(Compute Unified Device Architecture)的有限元单元刚度矩阵生成和总刚度矩阵组装算法。依据梁单元矩阵的对称性,结合GPU硬件架构提出并行生成算法并进行改进。为有效减少装配时间,在装配过程中采用着色算法,提出了基于GPU(Graphics Processing Unit)共享内存的非零项组装策略,通过在不同计算平台下算例对比,验证了新算法的快速性。数值算例表明,本文算法的求解效率较高,针对一定计算规模内的模型可满足快速计算与诊断的实时性要求。  相似文献   

8.
构建航天飞行器的结构有限元模型是准确模拟飞行仿真、完成飞行器在轨飞行阶段结构故障监测和诊断的基础。采用细长体飞行器简化梁模型,提出新的基于CUDA(Compute Unified Device Architecture)的有限元单元刚度矩阵生成和总刚度矩阵组装算法。依据梁单元矩阵的对称性,结合GPU硬件架构提出并行生成算法并进行改进。为有效减少装配时间,在装配过程中采用着色算法,提出了基于GPU(Graphics Processing Unit)共享内存的非零项组装策略,通过在不同计算平台下算例对比,验证了新算法的快速性。数值算例表明,本文算法的求解效率较高,针对一定计算规模内的模型可满足快速计算与诊断的实时性要求。  相似文献   

9.
为了提高基于高阶格式的结构动力响应微分求积分析方法的计算效率,发展了一种求解动力方程的快速算法.利用微分求积原理将结构动力方程转化为标准Sylvester方程的形式,通过对系数矩阵进行矩阵分解,进而将动力响应Sylvester方程化为一系列标准线性方程组,采用相关成熟算法求解这些线性方程组后即可获得结构动力时程响应的全部解答.结构动力响应微分求积分析方法为高阶数值方法,一步计算可以获得多个时点处的动力响应.基于本文快速算法,不必直接对矩阵方程进行求解.数值算例表明,本文快速算法能够准确地计算出结构动力响应,具有数值精度高、收敛性好的优点.  相似文献   

10.
弹性接触问题的常刚度迭代方法及其加速   总被引:1,自引:0,他引:1  
通过引入接触间隙荷载,在荷载项中反映接触状态变化的影响,避免了重新形成接触刚度矩阵,构造了弹性接触问题的常刚度迭代格式。然后借助于不动点迭代的Steffensen加速技术给出了一种求解弹性接触问题的常刚度迭代加速算法。文中最后给出两个算例表明了本文方法的有效性。  相似文献   

11.
One of major difficulties in the implementation of meshfree methods using the moving least square (MLS) approximation, such as element-free Galerkin method (EFG), is the imposition of essential boundary conditions as the approximations do not pass through the nodal parameter values. Another class of meshfree methods based on the radial basis point interpolation can satisfy the essential boundary conditions exactly since its approximation function passes through each node in an influence domain and thus its shape functions possess the properties of delta function. In this paper, a coupled element-free Galerkin(EFG)-radial point interpolation method (RPIM) is proposed to enhance their advantages and avoid their disadvantages. Discretized equations of equilibrium are obtained in the RPIM region and the EFG region, respectively. Then a collocation approach is introduced to couple the RPIM and the EFG method. This method satisfies the linear consistency exactly and can maintain the stiffness matrix symmetric. Numerical tests show that this method gives reasonably accurate results consistent with the theory.  相似文献   

12.
提出一种可以直接施加本质边界条件的有限元与无网格Galerkin(FE/EFG)耦合算法。将问题域分成FE和EFG两种类型的子域,采用转换矩阵耦舍两子域的交界面;通过另一转换矩阵将无网格区域本质边界上的名义位移转换成真实位移,从而可在其上直接施加本质边界条件;采用二次转换实现两种转换矩阵之间的协调。提出全域统一采用单元...  相似文献   

13.
在无单元伽辽金法(EFG)里,由于其滑动最小二乘近似位移函数不满足Kronecker条件,使得它不能准确地施加本质边界条件和材料不连续条件,从而极大地限制了EFG法的发展和进一步应用。本文在位移边界和不同材料交界面的离散结点上采用实际的结点位移值,提出了一种准确施加位移边界和材料不连续条件的方法,该方法实施简单、稳定、求解精度高,而且其推导得出的整体刚度矩阵具有正定、对称和带状分布的特点,可以和有限单元法一样,直接利用各种成熟、高效的线性方程组解法求解系统平衡方程。数值算例结果表明了文中理论和方法的正确性和可靠性。  相似文献   

14.
无单元伽辽金法的并行计算   总被引:2,自引:2,他引:0  
对无单元伽辽金法的并行计算进行了详细研究,并将其应用于弹性动力学问题。使用并行桶搜索算法进行节点搜索,使用并行几何搜索算法进行样点搜索,讨论了移动最小二乘MLS(Moving Least Squares)形函数及其导数的并行计算和方程组的并行求解,并利用多层图形划分实现负载平衡。最后给出了并行无单元伽辽金法应用于弹性动力学的计算流程和实例。计算结果表明无单元伽辽金法具有很高的并行性和很好的并行效率,对其进行并行计算具有非常重要的意义。  相似文献   

15.
根据页岩气流动特点建立了考虑混合气体高压物性参数、渗透率与孔隙度随压力变化的页岩气流动方程,通过定义拟压力函数将页岩气流动的偏微分方程线性化。针对页岩气开发采用水平井多段压裂技术,采用Newman乘积原理得到地层拟压力流动方程的解析解表达式。依据解析解的特征将解析解分解成适合并行计算的无限求和及积分形式,提出了一套基于CUDA的页岩气地层压力算法,将地层拟压力函数解析解划分为多个并行度较高的步骤,利用GPU的并行计算能力,设计每个步骤的CUDA核函数,在英特尔i3 540CPU(3.07GHz主频,4GB内存)和NVIDIA的GTX 550显卡上,计算了页岩气的井底压力,分析了井底压力特征。实验结果表明,页岩吸附影响曲线变化剧烈程度,而扩散主要影响曲线发生变化的时间,在GPU上的页岩气压力计算可达近40倍的加速比。  相似文献   

16.
A comparison of a new parallel block-implicit method and the parallel pressure correction procedure for the solution of the incompressible Navier–Stokes equations is presented. The block-implicit algorithm is based on a pressure equation. The system of non-linear equation s is solved by Newton's method. For the solution of the linear algebraic systems the Bi-CGSTAB algorithm with incomplete lower–upper (ILU) decomposition of the matrix is applied. Domain decomposition serves as a strategy for the parallelization of the algorithms. Different algorithms for the parallel solution of the linear system of algebraic equations in conjunction with the pressure correction procedure are proposed. Three different flows are predicted with the parallel algorithms. Results and efficiency data of the block-implicit method are compared with the parallel version of the pressure correction algorithm. The block-implicit method is characterized by stable convergence behaviour, high numerical efficiency, insensitivity to relaxation parameters and high spatial accuracy. © 1997 John Wiley & Sons, Ltd.  相似文献   

17.
在数值流形方法中,对于材料的固定边界,一般采用罚函数的方法进行处理,即在固定边界上设置刚性弹簧约束其位移来实现固定约束条件的近似满足。罚函数法在理论上不是严格的固定约束处理方法,罚弹簧的布置与弹簧刚度的大小对模拟的效果都会产生影响。基于流形单元上位移函数的组成提出了流形方法固定边界约束处理的新方法,在组成流形单元的物理覆盖上,通过取消相应的覆盖函数在流形单元位移函数中的组成来实现双向固定的约束条件,通过使用只包含单方向位移的覆盖函数使x向固定约束条件和y向固定约束条件得到实现,推导了相应固定约束条件下的流形单元刚度矩阵的数值计算格式。该方法严格满足固定约束的物理意义,简化了固定边界的处理,并经算例证明是有效和准确的,有利于数值流形方法的程序实现和工程应用。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号