期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

张健飞姜弘道《应用力学学报》2003,20(4):129-132

针对大型边界元方程组和网络微机机群环境提出了一种并行直接分块求解算法，算法基于分块高斯-若当消去法的原理，采用内外存交互技术，并行分块消去方法，节点超行的卷帘存储方案和并行环状循环逐次修正策略，增大了解题规模，提高了计算速度。算例计算结果表明该算法具有较高的并行加速比和并行效率，适用于大型问题的边界元法求解。相似文献

2.

实现有限元并行分布计算的一种新策略

王人鹏叶天麒帅朝林《计算力学学报》1994,11(4)

在几种典型的计算网络上，给出了实现有限元并行分布计算的一种全新策略。它对子结构的划分方式没有任何限制，使结构划分方式对通讯不产生任何影响，并利用所谓的Σ通讯完成有关迭代计算。这种策略广泛适用于多项式加速法的并行分布迭代计算，使有限元并行分布计算的算法及程序与具体的计算网络有很好的分离性，同时也很大程度地保留了已有串行有限元算法及程序的优点。以预处理的共轭斜量法为例，在ＩｎｍｏｓＴ８００Ｔｒａｎｓｐｕｔｅｒ系统上实现了有限元并行分布计算。通过数值算例，验证了本文方法的可行性与有效性。相似文献

3.

实现有限元并行分布计算的一种新策略 总被引：1，自引：0，他引：1

王人鹏叶天麒《计算结构力学及其应用》1994,11(4):392-400

在几种典型的计算网络上，给出了实现有限元并行分布计算的一种全新策略。它对子结构的划分方式没有任何限制，使结构划分方式对通讯不产生任何影响，并利用所谓的∑通讯完成有关迭代计算。这种策略广泛适用于多项式加速法的并行分布迭代计算，使有限元并行分布计算的算法及程序与具体的计算网络有很好的分离性，同时也很大程度地保留了已有串行有限元算法及程序的优点。以预处理的共轭斜量法为例，在ＩｎｍｏｓＴ８００Ｔｒａｎ相似文献

4.

一种粗粒度并行遗传算法及其应用 总被引：11，自引：3，他引：11

武金瑛王希诚《计算力学学报》2002,19(2):148-153

提出一种粗粒度并行遗传算法 ,采用多种群遗传策略 ,在逐渐收缩的空间上搜索 ,并且用准精确惩罚函数处理约束 ,保证了算法稳定而迅速地收敛于全局最优解。本文还讨论了算法的分布式计算策略 ,并行计算是在天潮 1 0 0 0 (A)超级并行计算机上完成的 ,利用 PVM系统处理各个处理器间的通讯。算例显示了本算法的计算效率和加速比。相似文献

5.

一种易于并行求解Euler方程组的分区技术

胡宗民张德良张嘉华《计算力学学报》2004,21(1):33-37

在具有复杂边界的计算区域内，求解偏微分方程组时，经常需要分区和并行计算，分区方法直接关系到数值计算的并行化程度，本文在应用时间算子分裂方法求解Euler方程组的过程中，提出了一种非常容易实现并行化计算的分区技术。相似文献

6.

地下水流并行有限层方法及同伦反演研究

王少伟徐进杨伟涛《计算力学学报》2020,37(6):756-762

根据有限层求解格式存在的解耦性，实现了地下水三维流问题的高效并行化计算。在此基础上，结合非线性同伦方法，提出了地下水参数反演分析的并行同伦算法，利用MATLAB编译了相应的正反演计算程序。与已有解析解和有限差分解的对比以及数值算例，验证了并行化正反演方法及程序的正确性，探讨了并行算法的计算效率。研究表明，并行方法可以有效提高计算速度，较串行方法具有明显优势，同时同伦反演方法具有大范围收敛的特点，不依赖于参数值的初始选取。相似文献

7.

岩石流/热固耦合下损伤演化并行分析系统及初步应用

李根李连崇唐春安唐世斌《计算力学学报》2012,29(3):381-386

实现了可用于计算岩体在渗流场(H)、温度场(T)及应力场(M)等多场耦合作用下损伤(D)演化并行分析系统。详细论述了整体实现方案、线性方程组求解器、并行通信优化策略及针对不同场问题的高效处理方法。对测试模型HM和TM计算表明,在启动合理数目处理器时程序具有最佳性能,近线性加速比,效率在82%以上,默认精度下一次耦合计算千万自由度模型稳定在200s。对三维水压致裂过程和温度载荷引起的材料表面裂纹现象进行了数值计算,结果很好地反映客观规律,展示出该系统的广阔应用前景。相似文献

8.

二维自适应非结构网格DSMC并行算法研究

王学德伍贻兆夏健林晓宏《计算力学学报》2009,26(2):276-281

研究了二维自适应非结构网格DSMC并行算法实现的过程.首先提出了一类非结构网格自适应策略,有效降低了网格尺度对计算结果的影响,提高了流场的分辨率;然后基于PC-CLUSTER群机并行体系结构与消息传递库MPI并行环境,利用分区并行思想,设计了非结构网格DSMC并行算法,节约了计算时间.利用For-tran90的动态分配内存技术编制了通用计算程序;最后对过渡流域高超声绕流进行了数值模拟,计算结果初步验证了算法的可行性与有效性. 相似文献

9.

基于集群的并行有限元分析研究

李海江《计算力学学报》2007,24(1):117-123

利用面向对象的方法实现了基于集群的并行有限元分析.首先介绍构建高性能计算集群的系统分析新方法,并针对建成集群系统的特点,对并行消息传递库MPI进行了并行语义分析,进而对其主要的实现函数进行面向对象的重构而建立起OO消息传递库,以此为基础分别利用两种不同的策略实现了面向对象的并行有限元分析(OOParaFEA: Object-Oriented Parallel FEA),一种是通过对传统的基于域分解方法的并行PCG算法进行改造而在集群平台实现,另一种是对已有的基于子结构方法的串行有限元分析程序加以扩展,加入系统方程组并行求解器而达到有限元分析并行化的目的.多个分析算例表明,基于集群进行面向对象的并行有限元分析可以有效提高计算效率,为进一步的网络化CAD/CAE研究奠定良好基础. 相似文献

10.

基于射线穿透法的GPU并行阶梯型有限差分网格生成算法

李平麻铁昌许香照马天宝《爆炸与冲击》2020,40(2)

三维大规模有限差分网格生成技术是三维有限差分计算的基础，网格生成效率是三维有限差分网格生成的研究热点。传统的阶梯型有限差分网格生成方法主要有射线穿透法和切片法。本文在传统串行射线穿透法的基础上，提出了基于GPU （graphic processing unit）并行计算技术的并行阶梯型有限差分网格生成算法。并行算法应用基于分批次的数据传输策略，使得算法能够处理的数据规模不依赖于GPU内存大小，平衡了数据传输效率和网格生成规模之间的关系。为了减少数据传输量，本文提出的并行算法可以在GPU线程内部相互独立的生成射线起点坐标，进一步提高了并行算法的执行效率和并行化程度。通过数值试验的对比可以看出，并行算法的执行效率远远高于传统射线穿透法。最后，通过有限差分计算实例可以证实并行算法能够满足复杂模型大规模数值模拟的需求。相似文献

11.

A comparison of coarse and fine grain parallelization strategies for the simple pressure correction algorithm

A. J. Lewis A. D. Brent 《国际流体数值方法杂志》1993,16(10):891-914

The primary aim of this work was to determine the simplest and most effective parallelization strategy for control-volume-based codes solving industrial problems. It has been found that for certain classes of problems, the coarse-grain functional decomposition strategy, largely ignored due to its limited scaling capability, offers the potential for significant execution speed-ups while maintaining the inherent structure of traditional serial algorithms. Functional decomposition requires only minor modification of the existing serial code to implement and, hence, code portability across both concurrent and serial computers is maintained. Fine-grain parallelization strategies at the ‘DO loop’ level are also easy to implement and largely preserve code portability. Both coarse-grain functional decomposition and fine-grain loop-level parallelization strategies for the SIMPLE pressure correction algorithm are demonstrated on a Silicon Graphics 4D280S eight CPU shared memory computer system for a highly coupled, transient two-dimensional simulation involving melting of a metal in the presence of thermal-buoyancy-driven laminar convection. Problems requiring the solution of a larger number of transport equations were simulated by including further scalar variables in the calculation. While resulting in slight degradation of the convergence rate, the functional decomposition strategy exhibited higher parallel efficiencies and yielded greater speed-ups relative to the original serial code. Initially, this strategy showed a significant degradation in convergence rate due to an inconsistency in the parallel solution of the pressure correction equation. After correcting for this inconsistency, the maximum speed-up for 16 dependent variables was a factor of 5·28 with eight processors, representing a parallel efficiency of 67%. Peak efficiency of 76% was achieved using five processors to solve for 10 dependent variables. 相似文献

12.

结构静力有限元分层并行计算方法

苗新强金先龙丁峻宏《力学学报》2014,46(4):611-618

根据分布式存储并行计算机的体系结构特点,提出了一种结构静力有限元分层并行计算方法. 该方法在两级分区两次缩聚策略的基础上不仅实现了大量数据的分布式存储,提高了数据的内存访问速率;而且实现了计算过程的三层并行,有效提高了通信效率;此外,它还进一步降低了界面方程的规模,大幅度减少了界面方程的求解时间. 因此,它能够充分利用分布式存储并行计算机的体系结构特点提升大规模并行计算效率. 最后通过典型数值算例验证了该方法的正确性和有效性. 相似文献

13.

A HIERARCHICAL PARALLEL COMPUTING APPROACH FOR STRUCTURAL STATIC FINITE ELEMENT ANALYSIS

Miao Xinqiang Jin Xianlong Ding Junhong 《力学学报》2014,46(4):611

根据分布式存储并行计算机的体系结构特点,提出了一种结构静力有限元分层并行计算方法. 该方法在两级分区两次缩聚策略的基础上不仅实现了大量数据的分布式存储,提高了数据的内存访问速率;而且实现了计算过程的三层并行,有效提高了通信效率;此外,它还进一步降低了界面方程的规模,大幅度减少了界面方程的求解时间. 因此,它能够充分利用分布式存储并行计算机的体系结构特点提升大规模并行计算效率. 最后通过典型数值算例验证了该方法的正确性和有效性. 相似文献

14.

Vectorized Directional Sweep Based Parallelization Method for Factored Alternating Direction Implicit (ADI) Schemes

Y. D. JUN A. HAMED 《International Journal of Computational Fluid Dynamics》2013,27(4):291-299

A new parallelization method is proposed for factored alternating direction implicit (ADI) schemes based on the vectorized global domain directional sweep. This approach, when combined with multi-partitioning domain decomposition, significantly reduces the frequency of necessary communication calls and minimizes processor idling during the sweeping processes. The present parallelization approach is applied to a number of vectorized two-dimensional compressible Navier-Stokes solvers. The codes vary in complexity from laminar to algebraic turbulence closure model and finally the strongly coupled Navier-Stokes and K-e equations. Implementation is conducted using PVM (Parallel Virtual Machine) message passing tool on the Cray T3D massively parallel processing (MPP) machine. The implemented parallel codes are assessed in terms of accuracy and parallel performance. 相似文献

15.

大型结构特征值问题的混合粒度并行算法 总被引：3，自引：0，他引：3

李红云沈为平《力学季刊》2000,21(1):52-58

本文提出一种求解大形结构特征值问题的粗细粒度混合并行算法：在子结构模态综合粗粒度并行算基础上,综合系统的特性值问题采用细粒度并行方式求解。细粒度并行包括子空间迭代法的子结构并行算法、雅可比分块并行计算的方法和一种Ｎｅｗｔｏｎ－Ｒａｐｈｏｎ迭代法在多处理器上任力均衡分配的有效策略。子空间迭代法的子结构并行计算的实施是利用子结构的刚度阵和质量阵而不必完全组集系统刚度阵和国求综合系统的特征值问题。利用雅相似文献

16.

一类多线程并行四面体网格优化算法

尚萌萌郑耀陈建军朱朝艳《计算力学学报》2016,33(4):613-620

提出了一类多线程并行、组合了光滑化与局部重连操作的四面体网格优化算法。采用传统的基于拓扑的数据分解策略实现了并行光滑化算法,利用图染色算法将待光滑化的点分解成多个独立点集。同时提出将一类基于几何的数据分解策略应用于局部重连操作的并行化,在每个局部重连操作涉及的几何区域中定义一个特征点,然后沿希尔伯特(Hilbert)曲线对特征点进行排序,曲线的均匀分解对应局部重连操作在各线程的分配。这一分配策略的优点是使并行执行局部重连操作时重连区域相互干涉的情形极少出现。因此,当干涉情形出现时,可选择放弃产生干涉的操作,并行优化效率和效果并无明显的负面影响。最后,数值实验验证了本文算法的效率和有效性。相似文献

17.

基于GPU并行计算的浅水波运动数值模拟

许栋徐彬 David PAyet 白玉川及春宁《计算力学学报》2016,33(1):113-120

利用有限体积法求解描述水流运动的二维浅水方程组,模拟洪水波运动传播过程,并通过GPU并行计算技术对程序进行加速,建立了浅水运动高效模拟方法。数值模拟结果表明,基于本文提出的GPU并行策略以及通用并行计算架构(CUDA)支持,能够实现相比CPU单核心最高112倍的加速比,为利用单机实现快速洪水预测以及防灾减灾决策提供有效支撑。此外,对基于GPU并行计算的浅水模拟计算精度进行了论证,并对并行性能优化进行了分析。利用所建模型模拟了溃坝洪水在三维障碍物间的传播过程。相似文献

18.

无网格局部Petrov-Galerkin方法的并行计算研究

曾清红《计算力学学报》2012,29(2):205-209,216

研究了无网格局部Petrov-Galerkin方法MLPG(Meshless Local Petrov-Galerkin Method)的并行算法与并行实现过程。将MLPG方法推广到弹性动力学问题,研究了MLPG方法中节点搜索、积分点搜索、数值积分及方程组求解等过程的并行算法,并给出了MLPG方法并行计算的具体实现过程。两个数值算例验证了MLPG并行算法的有效性;计算结果表明,MLPG方法的并行计算具有很好的并行性能和可扩展性。相似文献

19.

Efficiency Analysis of the Parallel Implementation of the SIMPLE Algorithm on Multiprocessor Computers

S. V. Lashkin A. S. Kozelkov A. V. Yalozo V. Yu. Gerasimov D. K. Zelensky 《Journal of Applied Mechanics and Technical Physics》2017,58(7):1242-1259

相似文献

20.

Upper bound limit analysis with a parallel mixed finite element formulation

M. Vicente da Silva A.N. Antão 《International Journal of Solids and Structures》2008,45(22-23):5788-5804

This paper addresses an implementation of the upper bound limit analysis theorem using a parallel mixed finite element formulation. The intrinsic characteristics of the adopted upper bound formulation proved to be suitable to adapt it to an efficient parallelization scheme. In order to illustrate the computational power provided by the new parallel processing method, accurate upper bound collapse load estimates, for 3D problems, are produced using a cluster of common PC machines. 相似文献