期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

《光学技术》2013,(2):128-132

为了达到傅里叶变换成像光谱仪(FTIS)数据快速重建的目的,使用GPU并行计算技术设计了基于CUDA(compute unified device architecture)的成像光谱仪快速数据重建优化算法。采用CUDA下的CUFFT库和CUDA并行计算内核,以达到加快成像光谱仪快速数据重建。结果表明,基于CUDA的并行计算技术能有效调动GPU的硬件资源,可大幅度提高光谱重建处理任务的计算效率。如果将该技术应用到更多核的并行计算工作站上,那么单台计算机完成干涉成像光谱仪数据的实时处理任务将成为可能。相似文献

2.

气体动力学直接模拟Monte Carlo的高效GPU并行计算

贺永翔刘昕赵海波《计算物理》2015,(2):169-176

实现了基于计算统一设备架构(CUDA)的直接模拟Monte Carlo(DSMC)并行算法,改进了原有多图形处理器(GPU)数据之间传输并行算法,数值模拟计算二维Couette流和二维顶盖驱动方腔流,定量比较了CPU、单GPU和多GPU并行计算的结果和计算时间.结果表明单GPU并行计算相对CPU计算的加速效果可以达到10~30倍,双GPU并行计算加速效果可以达到40~60倍,多GPU并行计算的加速效率接近100%,且计算精度能够得到良好保证. 相似文献

3.

基于OpenCL/GPU异构计算的高速数据协调系统设计

贺超郭大波穆健健马识途《量子光学学报》2019,(3)

针对当前连续变量量子密钥分发时数据协调运算速度低的问题,本文提出一种采用GPU与OpenCL异构计算的多维数据协调方案,并提出了一种静态双向十字链表存储超大规模LDPC码的校验矩阵,以适应OpenCL平台特殊要求。实验仿真结果显示,当码长为2×105时,在保证有效数据协调且相同码率的前提下,GPU平均译码速率可达到CPU的4.2倍,但牺牲了部分精度。相似文献

4.

大规模声学边界元法的GPU并行计算

张锐文立华校金友《计算物理》2015,32(3):299-309

提出一种大规模声学边界元法的高效率、高精度GPU并行计算方法.基于Burton-Miller边界积分方程,推导适于GPU的并行计算格式并实现了传统边界元法的GPU加速算法.为提高原型算法的效率,研究GPU数据缓存优化方法.由于GPU的双精度浮点运算能力较低,为了降低数值误差,研究基于单精度浮点运算实现的doublesingle精度算法.数值算例表明,改进的算法实现了最高89.8%的GPU使用效率,且数值精度与直接使用双精度数相当,而计算时间仅为其1/28,显存消耗也仅为其一半.该方法可在普通PC机(8GB内存,NVIDIA Ge Force 660 Ti显卡)上快速完成自由度超过300万的大规模声学边界元分析,计算速度和内存消耗均优于快速边界元法. 相似文献

5.

激波与火焰面相互作用数值模拟的GPU加速 总被引：1，自引：0，他引：1

蒋华董刚陈霄《计算物理》2016,33(1):23-29

为考察计算机图形处理器（GPU）在计算流体力学中的计算能力,采用基于CPU/GPU异构并行模式的方法对激波与火焰界面相互作用的典型可压缩反应流进行数值模拟,优化并行方案,考察不同网格精度对计算结果和计算加速性能的影响.结果表明,和传统的基于信息传递的MPI 8线程并行计算相比,GPU并行模拟结果与MPI并行模拟结果相同;两种计算方法的计算时间均随网格数量的增加呈线性增长趋势,但GPU的计算时间比MPI明显降低.当网格数量较小时（1.6×10⁴）,GPU计算得到的单个时间步长平均时间的加速比为8.6;随着网格数量的增加,GPU的加速比有所下降,但对较大规模的网格数量（4.2×10⁶）,GPU的加速比仍可达到5.9.基于GPU的异构并行加速算法为可压缩反应流的高分辨率大规模计算提供了较好的解决途径. 相似文献

6.

相控阵雷达的关键技术与物理学的波动知识

李正《大学物理》2006,25(3):55-59

应用波的相干原理分析了相控阵雷达的工作原理.以波的形成、波的发射和回波的接收等三个环节为主线,简要地介绍了由固态技术、光电子技术、计算机技术和信号处理技术所形成的相控阵雷达关键技术的背景、现状,并展望了相控阵雷达关键技术的未来. 相似文献

7.

耗散粒子动力学GPU并行计算研究 总被引：1，自引：0，他引：1

下载免费PDF全文

林晨森陈硕李启良杨志刚《物理学报》2014,63(10):104702-104702

研究了耗散粒子动力学基于计算统一设备架构的图形处理器(GPU)并行计算的实施.对其中涉及的算法映射模型、Cell-List法数组的并行化更新、随机数生成、存储器访问优化、负载平衡等进行了详细的讨论.进一步模拟了Poiseuille流动和突扩突缩流动,从而验证了GPU计算结果的正确性.计算结果表明,相对于基于中央处理器的串行计算,在耗散粒子动力学中实施GPU并行计算可以获得约20倍的加速比. 相似文献

8.

基于CUDA的多GPU加速SART迭代重建算法

雷德川陈浩王远张成鑫陈云斌胡栋材《强激光与粒子束》2013,25(09):2418-2422

为解决SART迭代重建算法计算耗时的问题,在单GPU基础上,利用多块GPU 的并行计算能力,提出了一种多GPU加速迭代重建算法。实验结果表明,与CPU重建相比,在不影响重建图像质量的情况下,采用GPU重建速度有明显提高,且增加GPU数量可以进一步提高重建速度。相似文献

9.

基于CUDA的多GPU加速SART迭代重建算法

下载免费PDF全文

雷德川陈浩王远张成鑫陈云斌胡栋材《强激光与粒子束》2013,25(9):2418-2422

为解决SART迭代重建算法计算耗时的问题,在单GPU基础上,利用多块GPU 的并行计算能力,提出了一种多GPU加速迭代重建算法。实验结果表明,与CPU重建相比,在不影响重建图像质量的情况下,采用GPU重建速度有明显提高,且增加GPU数量可以进一步提高重建速度。相似文献

10.

采用字典递归更新的目标检测稀疏算法及GPU实现

《光学学报》2016,(8)

稀疏表示是一种有潜力的图像信息表示方法,已应用于图像目标检测。正交匹配追踪算法(OMP)求解稀疏系数过程计算复杂,不能满足快速处理的要求,因此引入Kalman滤波器的递归思想,提出了一种计算稀疏系数的快速OMP(FastOMP)算法。利用Hermitian引理,从上一时刻的状态更新当前信息,避免了高维矩阵数据的重复计算。为提高算法的执行效率,提出了基于GPU/CUDA(图形处理器/统一计算设备架构)的并行计算方法,充分利用GPU的并行计算能力,提高了FastOMP算法的计算速度。实验结果表明,与传统OMP算法相比,FastOMP算法可大幅度缩短计算时间并提高检测精度。相似文献