共查询到20条相似文献,搜索用时 15 毫秒
1.
利用有限体积法求解描述水流运动的二维浅水方程组,模拟洪水波运动传播过程,并通过GPU并行计算技术对程序进行加速,建立了浅水运动高效模拟方法。数值模拟结果表明,基于本文提出的GPU并行策略以及通用并行计算架构(CUDA)支持,能够实现相比CPU单核心最高112倍的加速比,为利用单机实现快速洪水预测以及防灾减灾决策提供有效支撑。此外,对基于GPU并行计算的浅水模拟计算精度进行了论证,并对并行性能优化进行了分析。利用所建模型模拟了溃坝洪水在三维障碍物间的传播过程。 相似文献
2.
三维Euler方程的分区和并行计算 总被引:1,自引:0,他引:1
三维全机绕流区域分解成多块子区域,多块区域之间采用迎风型通量守恒内边界耦合条件,分区计算总体区域,形成总体耦合流场的分区数值解。利用PVM并行环境,采用纯结点并行计算编程方式和“先进先出”的同步控制等待机制,对三维复杂流动跨音速流场相应分区实现了多区域并行计算。分析了影响并行效率的主要因素,将并行计算结果与串行计算结果和实验结果作了比较,讨论了多种区域分解数目的并行计算效率。在负载平衡程度较好时,可得到较高的并行效率。 相似文献
3.
采用主从式编程模型实现了自编离散客体照相模拟程序的MPI并行化,采用分段法把伪随机数的生成大致平均分给各个子进程独立计算,实现了并行计算和串行计算使用的伪随机数序列完全一致,保证了并行计算结果与串行计算的一致,提高了离散客体的MC模拟效率,有效解决了计算量大、串行算法执行时间过长的问题 相似文献
4.
研究了无网格局部Petrov-Galerkin方法MLPG(Meshless Local Petrov-Galerkin Method)的并行算法与并行实现过程。将MLPG方法推广到弹性动力学问题,研究了MLPG方法中节点搜索、积分点搜索、数值积分及方程组求解等过程的并行算法,并给出了MLPG方法并行计算的具体实现过程。两个数值算例验证了MLPG并行算法的有效性;计算结果表明,MLPG方法的并行计算具有很好的并行性能和可扩展性。 相似文献
5.
6.
为实现钢-超高性能混凝土(UHPC)华夫板组合梁结构快速经济合理的设计,提出了基于并行计算与遗传算法的结构优化设计方法。通过Python建立了并行计算平台,使Abaqus和Python能够执行同步数值模拟和数据处理,以成本最小化为目标,采用遗传算法对钢-UHPC华夫板组合梁进行了优化,验证了所提方法的可行性。结果表明,遗传算法中密集的分析任务可以并行化并分配给不同的计算资源以提高计算效率;使用并行计算可以提高8.6倍的优化效率;并行计算和串行计算的CPU平均使用率分别为82%和18%。本文方法的成功应用可为其他类型结构的优化设计提供参考。 相似文献
7.
回顾了有限元并行计算发展的历史,阐述了微机网络并行计算环境的意义,给出了基于微机网络并行环境的杆壳组合结构动力分析并行算法,该算法包括杆壳组合结构总刚度矩阵和总质量矩阵的并行计算以及求解广义特征值问题的并行子空间迭代法的并行计算,在多台微机上安装PVM.使用Linux操作系统.构成分布式微机网络并行计算环境,将上述算法用于某型号飞机机翼及某型号挂架动力特性的并行计算,在该并行环境下的教值试验表明所给算法是非常有效的。 相似文献
8.
9.
驻定斜爆轰波并行数值模拟 总被引:1,自引:0,他引:1
采用多组分化学反应Euler方程组对驻定在高速飞行弹丸上的斜爆轰波流场进行了数值模拟。计算中分别采用TVD格式和基元反应模型,并基于并行编程模型MPI(message passing interface)实现了非结构网格上的并行计算,对流项和化学反应项用时间分裂法进行处理。计算结果表明并行计算能有效地提高计算速度,扩展计算规模,为进一步研究超驱爆轰推进技术奠定基础。 相似文献
10.
可扩展的冲击—接触并行计算研究 总被引:1,自引:0,他引:1
冲击—接触计算模型在汽车碰撞、金属成型等的模拟计算中有着广泛的应用,鉴于冲击—接触计算过程复杂和计算量大,本文在分布式可扩展的并行计算平台上,设计并实现了冲击—接触的并行计算。算例证明,计算平台稳定可靠,算法简单实用,且具有较好的并行效率和可扩展性。 相似文献
11.
12.
根据分布式存储并行计算机的体系结构特点,提出了一种结构静力有限元分层并行计算方法. 该方法在两级分区两次缩聚策略的基础上不仅实现了大量数据的分布式存储,提高了数据的内存访问速率;而且实现了计算过程的三层并行,有效提高了通信效率;此外,它还进一步降低了界面方程的规模,大幅度减少了界面方程的求解时间. 因此,它能够充分利用分布式存储并行计算机的体系结构特点提升大规模并行计算效率. 最后通过典型数值算例验证了该方法的正确性和有效性. 相似文献
13.
基于FTM算法的GPU加速 总被引:1,自引:1,他引:0
为了解决FTM(Front Tracking Method)算法在计算机中计算耗时长的问题,利用CUDA(Compute Unified Device Architecture)来实现FTM算法在GPU中的并行计算。结合GPU并行计算架构的特性以及FTM算法的特点,本文通过共享内存的引入、线程块划分和线程块共享内存边界元素的纳入、迭代方法的改进和迭代过程中存储结构的变换等方法,提出了将FTM算法中的网格计算以及界面标记点处理方法在GPU中的实现方式。最后,通过模拟单气泡在静止液体中的自由上升运动,验证了FTM在GPU中计算的可行性与计算效率的提升。 相似文献
14.
15.
CONSTRUCTION OF CLASSICAL ELASTICITY SOLUTION DATABASE WITH INDEPENDENCE AND TIMELINESS MANAGEMENT1)
在前期交互式操作和可视化教学方法的探讨和实践基础上,通过Visual C++和MATLAB联合编程,构筑了基于独立性和时效性管理的弹性力学经典解答数据库。数据库采用模块化设计和子程序并行计算方法,建立了问题描述模块、参数输入模块、可视化结果输出模块和结果调用模块,实现了调用模块对数据的独立性调用和可视化模块的动态调整。数据库各个计算子程序采用多线程并行计算,以及显示模块的快速准确输出结果,保证了交互式操作的时效性,达到了对弹性力学经典解答的形象、生动、有 色彩的教学目的。 相似文献
16.
17.
有限元并行计算的预处理 总被引:3,自引:4,他引:3
首先指出了有限元并行计算预处理的重要性和影响有限元并行计算效率的关键因素,然后介绍了两类有限元并行计算的任务划分方法,并在此基础上提出了一种改进的划分方法,经过验证这种方法是有效的。最后基于网络机群并行环境和消息传递编程模式,给出了一种能够降低通信成本的消息传递次序调整方法,并对调整前后的通信成本进行了比较。 相似文献
18.
19.
20.
子结构是有限元并行计算常用的一种方法,本文采用面向对象的方法,首先对子结构进行了面向对象的设计,得到了其类层次结构图;然后针对工作站网络有限元并行计算环境。提出了基于PVM消息传递平台上的Shadow—Mirror数据传输模型,该模型在有限元并行计算数据传输时,充分发挥数据面向对象的特性,采用设置数据缓冲区、短消息合并等方法以缩短数据通信时间,并据此编制了相应的程序。计算结果表明,使用文中提出的面向对象的Shadow—Mirror数据传输模型可以得到较为理想的并行加速比,而且随着问题规模增大,并行加速比增高。本文研究内容为进一步开展基于工作站网络的并行有限元研究提供了一个可参考的基础。 相似文献