首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 109 毫秒
1.
针对交错网格下的SIMPLE数值算法实施了分区并行计算方法,在小型局域网下实现了流动和传热问题的并行数值计算.对两个经典的流动和传热问题的数值模拟实验表明,所建立的并行计算环境和分区并行算法能够得到正确的和收敛的数值结果.但与串行计算结果相比,并行计算误差明显大于串行计算误差.对并行算法做出的性能分析表明,所给出的并行算法得到了明显的加速效率.随着计算规模的增大,加速比和并行效率提高更显著.  相似文献   

2.
光互连在短距离传输中的应用是未来大规模计算领域的关键技术。针对并行运算系统对高速高效传输的应用需求,研究了不同结构和不同传输方式下并行运算系统的性能,并从并行运算性能这一角度比较了光互连系统与电互连系统的优劣。采用网孔结构和超立方结构两种模型,用加速比和效率两个指标来评价光互连系统和电互连系统在并行运算方面的性能差异。得到光互连系统及电互连系统在进行并行计算时的加速比和效率与计算规模之间的关系,分析了计算规模对计算速比和效率的影响。通过加速比和效率这两个量的比较得到结论,在大规模并行计算中,光互连系统有着电互连系统不可比拟的优势。  相似文献   

3.
MC程序并行设计及提高加速比措施   总被引:4,自引:0,他引:4  
MC程序的并行设计涉及算法及模块划分,它直接关系到并行加速效率的高低,中子-γ耦合输运蒙特卡罗程序MCNP经过行改造,实现了PVM和MPI两种系统下的并行化,由于作了模块化设计,并行加速效率极佳,PVM版和MPI版并行程序在多个处理器下的加速比均呈线性增长,相比PVM,MPI的适应性列强,多数情况下其效率高于OPVM,并行MCNP程序的计算结果可靠,MPI并行程序在16、32和64个处理器上的并行效率分别达到99%、97%和89%。  相似文献   

4.
基于消息传递接口(Message Passing Interface,MPI),用两种不同的并行程序设计方法对Autodock程序进行修改.将修改后的程序应用于HIV-1蛋白酶(Protease)和小分子抑制剂XK263的对接体系,测试了并行程序的加速比和并行效率.结果表明,两种改进的并行Autodock程序都可以很好地完成计算,尤其是方案Ⅱ并行程序的加速比和并行效率更高.  相似文献   

5.
并行I/O已经在当前的高性能计算领域得到广泛应用,并行I/O是一个综合了远程文件管理、高速通信和并发控制的层次化系统,由于高度复杂,它的评测也具有一定的难度。一个详细的并行I/O带宽评测工作不仅要求衡量并行I/O系统的性能与性质,还要求能够给设计师和用户以I/O参数上的提示,从而提高I/O效率。  相似文献   

6.
研究了闪光X射线辐射照像蒙特卡罗程序(FXRMC)在MPI平台下的并行计算实现,给出了实现过程中并行随机数的产生方法。对并行程序的测试结果表明:并行程序与串行程序结果一致,加速比比较理想,呈线性增长,并行效率在16个处理器上可达80%以上。算例的结果说明了并行化可有效地解决程序计算散射技术性能时的耗时问题,从而有效化解FXRMC耗时和大规模计算的困难,提高了FXRMC程序的计算规模和计算速度,达到了研究要求。 (Institute of Fluid Physics, CAEP, P. O. Box 919-105, Mianyang 621900, China)  相似文献   

7.
 并行计算是解决爆炸与冲击问题大规模数值模拟最有效的手段之一。针对Euler方法并行程序设计的复杂性,阐述了三维多物质弹塑性流体动力学程序MMIC-3D并行设计的总体策略,基于消息传递接口(MPI)设计出相应的PMMIC-3D并行程序,并提出了一套实用的程序测试方案。结合聚能射流形成过程的数值模拟算例,在八节点的集群上测试了加速比、并行效率及可扩放性,分析了影响并行性能的因素。  相似文献   

8.
激波与火焰面相互作用数值模拟的GPU加速   总被引:1,自引:0,他引:1  
蒋华  董刚  陈霄 《计算物理》2016,33(1):23-29
为考察计算机图形处理器(GPU)在计算流体力学中的计算能力,采用基于CPU/GPU异构并行模式的方法对激波与火焰界面相互作用的典型可压缩反应流进行数值模拟,优化并行方案,考察不同网格精度对计算结果和计算加速性能的影响.结果表明,和传统的基于信息传递的MPI 8线程并行计算相比,GPU并行模拟结果与MPI并行模拟结果相同;两种计算方法的计算时间均随网格数量的增加呈线性增长趋势,但GPU的计算时间比MPI明显降低.当网格数量较小时(1.6×104),GPU计算得到的单个时间步长平均时间的加速比为8.6;随着网格数量的增加,GPU的加速比有所下降,但对较大规模的网格数量(4.2×106),GPU的加速比仍可达到5.9.基于GPU的异构并行加速算法为可压缩反应流的高分辨率大规模计算提供了较好的解决途径.  相似文献   

9.
为解决串行时域多分辨率(MRTD)散射模型运行时间长和内存消耗大的问题,基于消息传递接口(MPI)技术设计了一种非球形气溶胶散射并行计算模型。介绍了MRTD散射模型的基本框架和2种并行数据通信方案,并基于MPI重复非阻塞通信技术实现了MRTD散射模型的并行化设计;搭建了网络并行计算平台,实现了模型的并行化计算。将MRTD散射模型与Mie散射模型、T矩阵法进行了对比,验证了并行MRTD散射模型的计算准确性。结果表明,MRTD模型可较准确地模拟非球形粒子散射特性,并行计算技术可显著提高计算效率;电磁场分量同时交换的并行设计方案的计算效率略高于仅交换磁场分量的方案;通过增加中央处理器核数,程序的并行加速比随之增大,但单核运行效率却略有降低。随着粒子尺度参数的增大,单核计算效率随之增加,复折射率的改变并不会显著影响并行计算效率。  相似文献   

10.
为解决串行时域多分辨率(MRTD)散射模型运行时间长和内存消耗大的问题,基于消息传递接口(MPI)技术设计了一种非球形气溶胶散射并行计算模型。介绍了MRTD散射模型的基本框架和2种并行数据通信方案,并基于MPI重复非阻塞通信技术实现了MRTD散射模型的并行化设计;搭建了网络并行计算平台,实现了模型的并行化计算。将MRTD散射模型与Mie散射模型、T矩阵法进行了对比,验证了并行MRTD散射模型的计算准确性。结果表明,MRTD模型可较准确地模拟非球形粒子散射特性,并行计算技术可显著提高计算效率;电磁场分量同时交换的并行设计方案的计算效率略高于仅交换磁场分量的方案;通过增加中央处理器核数,程序的并行加速比随之增大,但单核运行效率却略有降低。随着粒子尺度参数的增大,单核计算效率随之增加,复折射率的改变并不会显著影响并行计算效率。  相似文献   

11.
The paper addresses the issues of solving complex problems that require using supercomputers or multiprocessor clusters available for most researchers nowadays. Efficient distribution of high performance computing resources according to actual application needs has been a major research topic since high-performance computing (HPC) technologies became widely introduced. At the same time, comfortable and transparent access to these resources was a key user requirement. In this paper we discuss approaches to build a virtual private supercomputer available at user’s desktop: a virtual computing environment tailored specifically for a target user with a particular target application. We describe and evaluate possibilities to create the virtual supercomputer based on light-weight virtualization technologies, and analyze the efficiency of our approach compared to traditional methods of HPC resource management.  相似文献   

12.
赵海龙  董烨  周海京  王刚华  王强 《强激光与粒子束》2020,32(7):075005-1-075005-7
大型脉冲功率装置真空汇流区的电子输运过程对于电流汇聚有重要的影响,在高性能计算集群的帮助下,使用NEPTUNE3D软件开展三维全电磁PIC模拟进行了研究,模拟区域(34 cm×34 cm×18 cm)包括双层柱-孔盘旋(DPHC)结构和部分内、外磁绝缘传输线等关键位置。计算结果清晰地展示了零磁位区分布和电子输运轨迹,电子主要由外磁绝缘传输线阴极表面发射,在洛伦兹力作用下向中心漂移并损失在零磁位区处;对电子能量沉积的统计结果表明,受电子流轰击最严重的位置在DPHC结构下层阳极柱表面,来自大型脉冲功率装置的实验结果证实了上述结论。根据计算结果,最大电流损失率(437 kA,27%)发生在电流传输的早期时刻(~15 ns),而电流峰值时刻损失率则仅有0.48%,此时磁绝缘已完全生效,表明DPHC结构在峰值电流的汇聚与传输上有很高的效率。  相似文献   

13.
This article investigates the functional properties of complex networks used as grid computing systems. Complex networks following the Erdös-Rényi model and other models with a preferential attachment rule (with and without growth) or priority to the connection of isolated nodes are studied. Regular networks are also considered for comparison. The processing load of the parallel program executed on the grid is assigned to the nodes on demand, and the efficiency of the overall computation is quantified in terms of the parallel speedup. It is found that networks with preferential attachment allow lower computing efficiency than networks with uniform link attachment. At the same time, considering only node clusters of the same size, preferential attachment networks display better efficiencies. The regular networks, on the other hand, display a poor efficiency, due to their implied larger internode distances. A correlation is observed between the topological properties of the network, specially average cluster size, and their respective computing efficiency.  相似文献   

14.
基于微扰形式的守恒磁流体方程,采用基于通量向量分裂(FVS)以及加权本质无振荡格式(WENO)的有限差分方法,发展了平板位形下的非线性磁流体模拟程序.程序准确地模拟了开尔文-亥姆霍兹不稳定性和单撕裂模不稳定性.采用MPI和OpenMP的并行计算框架,使得程序可以在多节点上运行.在并行计算过程中采用负载均衡化,对各个节点...  相似文献   

15.
A general-purpose Fortran-90 code for calculation of the electromagnetic scattering and absorption properties of multiple sphere clusters is described. The code can calculate the efficiency factors and scattering matrix elements of the cluster for either fixed or random orientation with respect to the incident beam and for plane wave or localized-approximation Gaussian incident fields. In addition, the code can calculate maps of the electric field both interior and exterior to the spheres. The code is written with message passing interface instructions to enable the use on distributed memory compute clusters, and for such platforms the code can make feasible the calculation of absorption, scattering, and general EM characteristics of systems containing several thousand spheres.  相似文献   

16.
CFD分析技术目前已经成为飞机设计的主要手段,国外主要飞机制造商依托自主知识产权的核心求解器从事气动专业相关工作,如美国波音公司自主开发的TRANAIR软件[1].一款能够成功应用到工程上的CFD工具必须满足计算快速、分析准确、操作简单、运行稳定、功能全面等5方面要求,因此开发了面向工程应用的CFD快速自动分析SUN程序[2],采用内外流耦合流场分析技术,实现从前处理、网格生成、流场求解到后处理全流程一体化分析,可对机身、机翼、挂架和短舱部件组合的任意构型飞机亚声速和跨声速流场进行快速分析,形成具有中国商飞自主知识产权的核心CFD快速求解器,实现气动设计领域关键核心技术自主可控,在中国商飞多个项目中已经得到初步应用、支撑了相关工作开展.   相似文献   

17.
将理想全二维磁流体(MHD)稳定性数值代码GATO成功移植到HL-2A高性能计算系统,并用其模拟研究了HL-2A装置一次典型弹丸注入实验的等离子体的理想MHD稳定性。利用HL-2A装置第4050次放电的实验数据,应用EFIT代码重建了几个时间片的平衡位形,然后应用GATO代码对每个平衡位形的MHD稳定性进行了计算。通过对结果进行分析比较得出初步结论,由于弹丸注入而造成的反剪切位形的致稳作用,可以提高等离子体的约束性能。  相似文献   

18.
We present a quantum error correction code which protects three quantum bits (qubits) of quantum information against one erasure, i.e., a single-qubit arbitrary error at a known position. The present code has a high encoding efficiency, since only one auxiliary qubit is needed for one message qubit on average. In addition, we note that the code can also work even in a worse case that the interaction with the environment causes a leakage out of the qubit space. The code may have some applications in the storage of quantum information for small-scale quantum computing, quantum information processing, and quantum communication.  相似文献   

19.
张若兴  侯士敏  丑强 《计算物理》2015,32(6):631-638
为了解决基于第一性原理分析计算大尺度量子输运体系时遇到的耗时长久问题,挖掘密度泛函理论与非平衡格林函数相结合方法(DFT+NEGF方法)在自洽迭代过程中的计算热点,就计算电子密度矩阵时的能量点积分和计算格林函数时的矩阵求逆/乘法运算提出MPI/Open MP并行计算方案.能量点积分采用MPI多进程并行方案,在数据初始化时需要将稀疏矩阵和积分能量点依照轮询调度算法分配给各进程.矩阵求逆/乘法的并行化既可调用ScaLAPACK子程序实现又可调用IntelMKL数学库中的OpenMP多线程加速函数实现.由于不同能量点计算的独立性,能量点积分采用的MPI并行计算获得近乎线性的加速比曲线.由于Open MP多线程并行采用的是基于共享内存的数据交换机制以及线程间切换通信开销小,矩阵求逆/乘法运算的OpenMP并行实现在计算效率上要优于而在程序的可扩展性上要劣于MPI多进程并行实现.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号