共查询到20条相似文献,搜索用时 109 毫秒
1.
激波与火焰面相互作用数值模拟的GPU加速 总被引:1,自引:0,他引:1
为考察计算机图形处理器(GPU)在计算流体力学中的计算能力,采用基于CPU/GPU异构并行模式的方法对激波与火焰界面相互作用的典型可压缩反应流进行数值模拟,优化并行方案,考察不同网格精度对计算结果和计算加速性能的影响.结果表明,和传统的基于信息传递的MPI 8线程并行计算相比,GPU并行模拟结果与MPI并行模拟结果相同;两种计算方法的计算时间均随网格数量的增加呈线性增长趋势,但GPU的计算时间比MPI明显降低.当网格数量较小时(1.6×104),GPU计算得到的单个时间步长平均时间的加速比为8.6;随着网格数量的增加,GPU的加速比有所下降,但对较大规模的网格数量(4.2×106),GPU的加速比仍可达到5.9.基于GPU的异构并行加速算法为可压缩反应流的高分辨率大规模计算提供了较好的解决途径. 相似文献
2.
面对需要实时计算的相机位姿估计问题,针对经典的广泛应用的正交迭代算法,提出了一种加速正交迭代算法。其关键思想是将每一次迭代过程规整化,从而提炼出每一次迭代的重复计算,若将此重复计算在迭代开始前提前计算,则可以大幅度的减少迭代过程中的计算量,使得每一次迭代的计算复杂度从O(n)降低为O(1)。因此,可以在更短的时间内迭代更多的次数,从而获得更高的精度。进行了对比实验,结果显示本加速算法计算精度更高,速度更快。并通过实验提出了选择稳健n点透视(RPn P)计算初值,再使用加速正交迭代算法进行迭代运算的方法,在控制点不多的情况下,是一种精度接近最大似然估计,计算速度最快的算法。 相似文献
3.
4.
在带有详细化学反应机理的可压缩反应流数值模拟中,化学反应源项的计算会极大增加计算时间,基于建表技术的化学加速算法可以通过查找数据表中的数据来替代化学反应计算,从而有效提高计算效率,但数据表尺寸的过度增长会导致计算的中断.文章提出了基于两种数据表容量控制策略的并行动态存储/删除算法,并在激波诱导火焰界面失稳的数值模拟中进行了应用,以考察算法的性能.两种数据表容量控制策略分别为单表容量(Msin)控制和总表容量(Mtot)控制,当单个数据表尺寸达到Msin或总数据表尺寸达到Mtot时,对数据表进行节点删除,以保证计算的正常进行.计算结果表明,文章提出的基于表容量控制的并行加速算法,其计算准确度和计算效率之间存在关联,具有较好计算准确度算例显示了较高的计算效率.在不同的Msin和Mtot条件下,计算的化学加速比在2.73~3.93之间.两种表控策略的组合影响了数据表删除的频率和删除之间的同步性,当数据表删除频率小、删除同步性强时,化学加速比要更高. 相似文献
5.
6.
提出一种类似于PE算法的实用并行迭代算法(VPE),可以克服M-1r(s)向量或并行化处理的困难.这种算法格式简单明了,收敛速度快.并证明了当矩阵A是M-阵和H-阵时,该算法是收敛的。计算实例显示该算法很有效. 相似文献
7.
描述了HL-2A等离子体实时平衡重建的GPU并行化算法,主要包括G-S方程的并行化处理、三对角方程求解、网格边界磁通计算以及一系列矩阵相乘的并行加速。并行后,在129×129的网格下完成一次迭代计算需要约575μs。 相似文献
8.
描述了HL-2A等离子体实时平衡重建的GPU并行化算法,主要包括G-S方程的并行化处理、三对角方程求解、网格边界磁通计算以及一系列矩阵相乘的并行加速.并行后,在129×129的网格下完成一次迭代计算需要约575μs. 相似文献
9.
为了解决基于第一性原理分析计算大尺度量子输运体系时遇到的耗时长久问题,挖掘密度泛函理论与非平衡格林函数相结合方法(DFT+NEGF方法)在自洽迭代过程中的计算热点,就计算电子密度矩阵时的能量点积分和计算格林函数时的矩阵求逆/乘法运算提出MPI/Open MP并行计算方案.能量点积分采用MPI多进程并行方案,在数据初始化时需要将稀疏矩阵和积分能量点依照轮询调度算法分配给各进程.矩阵求逆/乘法的并行化既可调用ScaLAPACK子程序实现又可调用IntelMKL数学库中的OpenMP多线程加速函数实现.由于不同能量点计算的独立性,能量点积分采用的MPI并行计算获得近乎线性的加速比曲线.由于Open MP多线程并行采用的是基于共享内存的数据交换机制以及线程间切换通信开销小,矩阵求逆/乘法运算的OpenMP并行实现在计算效率上要优于而在程序的可扩展性上要劣于MPI多进程并行实现. 相似文献
10.
反应堆屏蔽计算是评估核电站安全性能的基础,是指导电站设计、运行的重要手段之一。JSNT程序是中物院高性能数值模拟软件中心研制的大规模并行离散纵标输运程序,具有较高的计算精度和计算效率。利用JSNT程序对某压水堆进行了建模计算,给出了中子通量密度的分布结果,并与实验测量值进行了对比。对比结果显示:无论是采用S8计算还是S16计算,计算结果都能满足工程要求;相比S8而言,采用S16计算可以显著提高计算精度,能够将某些测点处的相对误差降至1%以内。 相似文献
11.
12.
13.
随着计算空间光调制器的分辨率的尺寸逐渐变大,全息图三维动态显示的计算量也越来越大,使得对全息计算速度提出了新的要求。利用GPU并行计算处理的方式实现全息图的快速层析法计算,该方法利用GPU并行多线程和层析法中的图像二维傅里叶变换的优势对菲涅尔衍射变换算法加速计算;同时通过对GPU底层资源的调用和对CUDA中程序的流处理过程,有效减少中间的延时等待。通过对计算速度对比分析表明:与在CPU上运算相比,计算速度大幅提升,基于GPU并行计算的方法比基于CPU计算的方法速度快10倍左右。 相似文献
14.
近些年,我国对海洋不断深入的探索对复杂环境中声场的快速预报提出了越来越高的需求。BELLHOP3D是一种基于射线法的三维声传播计算模型,在海洋声学中应用十分广泛。BELLHOP3D的计算效率比其他常用模型高,但是仍然有非常大的提升空间。该文使用信息传递接口对BELLHOP3D进行粗粒度的并行优化,并行后的程序计算结果稳定可靠,并行效率高,更适合在实际应用中实现快速的声场预报。并行BELLHOP3D程序可以在https://github.com/nj-zyq/BELLHOP3D_MPI.git下载。 相似文献
15.
16.
17.
18.
19.
20.
Pu Zhou Yanxing Ma Xiaolin Wang Haotong Ma Xiaojun Xu 《Optics & Laser Technology》2010,42(7):1059-1065
We present the numerical analysis and improvement of the bandwidth of the beam phasing of fiber amplifiers using the stochastic parallel gradient descent (SPGD) algorithm. Time-varying phase distortions are incorporated into the dynamic simulation. It is shown by numerical calculation that the bandwidth of the standard SPGD algorithm is dependent on the phase distortions and on the number of lasers. The time-averaged cost function will decrease with an increase in the amplitude and frequency of phase distortions, and in the number of lasers. A cross-grouped SPGD algorithm is proposed, which offers attractive performance due to its robustness to various time-varying phase distortions and faster convergence rate for beam phasing of larger number of lasers. Dynamic simulation shows that the control bandwidth can be improved using the cross-grouped SPGD algorithm. 相似文献