共查询到19条相似文献,搜索用时 109 毫秒
1.
2.
3.
4.
5.
并行I/O已经在当前的高性能计算领域得到广泛应用,并行I/O是一个综合了远程文件管理、高速通信和并发控制的层次化系统,由于高度复杂,它的评测也具有一定的难度。一个详细的并行I/O带宽评测工作不仅要求衡量并行I/O系统的性能与性质,还要求能够给设计师和用户以I/O参数上的提示,从而提高I/O效率。 相似文献
6.
研究了闪光X射线辐射照像蒙特卡罗程序(FXRMC)在MPI平台下的并行计算实现,给出了实现过程中并行随机数的产生方法。对并行程序的测试结果表明:并行程序与串行程序结果一致,加速比比较理想,呈线性增长,并行效率在16个处理器上可达80%以上。算例的结果说明了并行化可有效地解决程序计算散射技术性能时的耗时问题,从而有效化解FXRMC耗时和大规模计算的困难,提高了FXRMC程序的计算规模和计算速度,达到了研究要求。 (Institute of Fluid Physics, CAEP, P. O. Box 919-105, Mianyang 621900, China) 相似文献
7.
8.
激波与火焰面相互作用数值模拟的GPU加速 总被引:1,自引:0,他引:1
为考察计算机图形处理器(GPU)在计算流体力学中的计算能力,采用基于CPU/GPU异构并行模式的方法对激波与火焰界面相互作用的典型可压缩反应流进行数值模拟,优化并行方案,考察不同网格精度对计算结果和计算加速性能的影响.结果表明,和传统的基于信息传递的MPI 8线程并行计算相比,GPU并行模拟结果与MPI并行模拟结果相同;两种计算方法的计算时间均随网格数量的增加呈线性增长趋势,但GPU的计算时间比MPI明显降低.当网格数量较小时(1.6×104),GPU计算得到的单个时间步长平均时间的加速比为8.6;随着网格数量的增加,GPU的加速比有所下降,但对较大规模的网格数量(4.2×106),GPU的加速比仍可达到5.9.基于GPU的异构并行加速算法为可压缩反应流的高分辨率大规模计算提供了较好的解决途径. 相似文献
9.
为解决串行时域多分辨率(MRTD)散射模型运行时间长和内存消耗大的问题,基于消息传递接口(MPI)技术设计了一种非球形气溶胶散射并行计算模型。介绍了MRTD散射模型的基本框架和2种并行数据通信方案,并基于MPI重复非阻塞通信技术实现了MRTD散射模型的并行化设计;搭建了网络并行计算平台,实现了模型的并行化计算。将MRTD散射模型与Mie散射模型、T矩阵法进行了对比,验证了并行MRTD散射模型的计算准确性。结果表明,MRTD模型可较准确地模拟非球形粒子散射特性,并行计算技术可显著提高计算效率;电磁场分量同时交换的并行设计方案的计算效率略高于仅交换磁场分量的方案;通过增加中央处理器核数,程序的并行加速比随之增大,但单核运行效率却略有降低。随着粒子尺度参数的增大,单核计算效率随之增加,复折射率的改变并不会显著影响并行计算效率。 相似文献
10.
《光学学报》2017,(6)
为解决串行时域多分辨率(MRTD)散射模型运行时间长和内存消耗大的问题,基于消息传递接口(MPI)技术设计了一种非球形气溶胶散射并行计算模型。介绍了MRTD散射模型的基本框架和2种并行数据通信方案,并基于MPI重复非阻塞通信技术实现了MRTD散射模型的并行化设计;搭建了网络并行计算平台,实现了模型的并行化计算。将MRTD散射模型与Mie散射模型、T矩阵法进行了对比,验证了并行MRTD散射模型的计算准确性。结果表明,MRTD模型可较准确地模拟非球形粒子散射特性,并行计算技术可显著提高计算效率;电磁场分量同时交换的并行设计方案的计算效率略高于仅交换磁场分量的方案;通过增加中央处理器核数,程序的并行加速比随之增大,但单核运行效率却略有降低。随着粒子尺度参数的增大,单核计算效率随之增加,复折射率的改变并不会显著影响并行计算效率。 相似文献
11.
The paper addresses the issues of solving complex problems that require using supercomputers or multiprocessor clusters available for most researchers nowadays. Efficient distribution of high performance computing resources according to actual application needs has been a major research topic since high-performance computing (HPC) technologies became widely introduced. At the same time, comfortable and transparent access to these resources was a key user requirement. In this paper we discuss approaches to build a virtual private supercomputer available at user’s desktop: a virtual computing environment tailored specifically for a target user with a particular target application. We describe and evaluate possibilities to create the virtual supercomputer based on light-weight virtualization technologies, and analyze the efficiency of our approach compared to traditional methods of HPC resource management. 相似文献
12.
大型脉冲功率装置真空汇流区的电子输运过程对于电流汇聚有重要的影响,在高性能计算集群的帮助下,使用NEPTUNE3D软件开展三维全电磁PIC模拟进行了研究,模拟区域(34 cm×34 cm×18 cm)包括双层柱-孔盘旋(DPHC)结构和部分内、外磁绝缘传输线等关键位置。计算结果清晰地展示了零磁位区分布和电子输运轨迹,电子主要由外磁绝缘传输线阴极表面发射,在洛伦兹力作用下向中心漂移并损失在零磁位区处;对电子能量沉积的统计结果表明,受电子流轰击最严重的位置在DPHC结构下层阳极柱表面,来自大型脉冲功率装置的实验结果证实了上述结论。根据计算结果,最大电流损失率(437 kA,27%)发生在电流传输的早期时刻(~15 ns),而电流峰值时刻损失率则仅有0.48%,此时磁绝缘已完全生效,表明DPHC结构在峰值电流的汇聚与传输上有很高的效率。 相似文献
13.
This article investigates the functional properties of complex
networks used as grid computing systems. Complex networks following
the Erdös-Rényi model and other models with a preferential
attachment rule (with and without growth) or priority to the
connection of isolated nodes are studied. Regular networks are also
considered for comparison. The processing load of the parallel
program executed on the grid is assigned to the nodes on demand, and
the efficiency of the overall computation is quantified in terms of
the parallel speedup. It is found that networks with preferential
attachment allow lower computing efficiency than networks with
uniform link attachment. At the same time, considering only node
clusters of the same size, preferential attachment networks display
better efficiencies. The regular networks, on the other hand,
display a poor efficiency, due to their implied larger internode
distances. A correlation is observed between the topological
properties of the network, specially average cluster size, and their
respective computing efficiency. 相似文献
14.
基于微扰形式的守恒磁流体方程,采用基于通量向量分裂(FVS)以及加权本质无振荡格式(WENO)的有限差分方法,发展了平板位形下的非线性磁流体模拟程序.程序准确地模拟了开尔文-亥姆霍兹不稳定性和单撕裂模不稳定性.采用MPI和OpenMP的并行计算框架,使得程序可以在多节点上运行.在并行计算过程中采用负载均衡化,对各个节点... 相似文献
15.
D.W. Mackowski M.I. Mishchenko 《Journal of Quantitative Spectroscopy & Radiative Transfer》2011,112(13):2182-4352
A general-purpose Fortran-90 code for calculation of the electromagnetic scattering and absorption properties of multiple sphere clusters is described. The code can calculate the efficiency factors and scattering matrix elements of the cluster for either fixed or random orientation with respect to the incident beam and for plane wave or localized-approximation Gaussian incident fields. In addition, the code can calculate maps of the electric field both interior and exterior to the spheres. The code is written with message passing interface instructions to enable the use on distributed memory compute clusters, and for such platforms the code can make feasible the calculation of absorption, scattering, and general EM characteristics of systems containing several thousand spheres. 相似文献
16.
CFD分析技术目前已经成为飞机设计的主要手段,国外主要飞机制造商依托自主知识产权的核心求解器从事气动专业相关工作,如美国波音公司自主开发的TRANAIR软件[1 ].一款能够成功应用到工程上的CFD工具必须满足计算快速、分析准确、操作简单、运行稳定、功能全面等5方面要求,因此开发了面向工程应用的CFD快速自动分析SUN程序[2 ],采用内外流耦合流场分析技术,实现从前处理、网格生成、流场求解到后处理全流程一体化分析,可对机身、机翼、挂架和短舱部件组合的任意构型飞机亚声速和跨声速流场进行快速分析,形成具有中国商飞自主知识产权的核心CFD快速求解器,实现气动设计领域关键核心技术自主可控,在中国商飞多个项目中已经得到初步应用、支撑了相关工作开展. 相似文献
17.
将理想全二维磁流体(MHD)稳定性数值代码GATO成功移植到HL-2A高性能计算系统,并用其模拟研究了HL-2A装置一次典型弹丸注入实验的等离子体的理想MHD稳定性。利用HL-2A装置第4050次放电的实验数据,应用EFIT代码重建了几个时间片的平衡位形,然后应用GATO代码对每个平衡位形的MHD稳定性进行了计算。通过对结果进行分析比较得出初步结论,由于弹丸注入而造成的反剪切位形的致稳作用,可以提高等离子体的约束性能。 相似文献
18.
We present a quantum error correction code which protects three quantum bits (qubits) of quantum information against one erasure, i.e., a single-qubit arbitrary error at a known position. The present code has a high encoding efficiency, since only one auxiliary qubit is needed for one message qubit on average. In addition, we note that the code can also work even in a worse case that the interaction with the environment causes a leakage out of the qubit space. The code may have some applications in the storage of quantum information for small-scale quantum computing, quantum information processing, and quantum communication. 相似文献
19.
为了解决基于第一性原理分析计算大尺度量子输运体系时遇到的耗时长久问题,挖掘密度泛函理论与非平衡格林函数相结合方法(DFT+NEGF方法)在自洽迭代过程中的计算热点,就计算电子密度矩阵时的能量点积分和计算格林函数时的矩阵求逆/乘法运算提出MPI/Open MP并行计算方案.能量点积分采用MPI多进程并行方案,在数据初始化时需要将稀疏矩阵和积分能量点依照轮询调度算法分配给各进程.矩阵求逆/乘法的并行化既可调用ScaLAPACK子程序实现又可调用IntelMKL数学库中的OpenMP多线程加速函数实现.由于不同能量点计算的独立性,能量点积分采用的MPI并行计算获得近乎线性的加速比曲线.由于Open MP多线程并行采用的是基于共享内存的数据交换机制以及线程间切换通信开销小,矩阵求逆/乘法运算的OpenMP并行实现在计算效率上要优于而在程序的可扩展性上要劣于MPI多进程并行实现. 相似文献