首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 93 毫秒
1.
在EAST装置单道运动斯塔克效应(MSE)诊断系统数据处理中,采用CPU(中央处理器)+GPU(图形处理器)异构化模型,实现了数字谐波分析(DHA)算法的并行化加速计算。由CPU完成数据的加载及简单的数学计算,由GPU实现DHA算法的傅里叶正、逆变换及滤波等并行化计算,与串行算法相比,获得了2000倍以上的加速,可以满足MSE诊断实验期间及时数据处理的要求。  相似文献   

2.
在EAST装置单道运动斯塔克效应(MSE)诊断系统数据处理中,采用CPU(中央处理器)+GPU(图形处理器)异构化模型,实现了数字谐波分析(DHA)算法的并行化加速计算。由CPU完成数据的加载及简单的数学计算,由GPU实现DHA算法的傅里叶正、逆变换及滤波等并行化计算,与串行算法相比,获得了2000倍以上的加速,可以满足MSE诊断实验期间及时数据处理的要求。  相似文献   

3.
为了使液晶大气湍流模拟器具有实时大气模拟能力,在GPU通用计算架构下提出了基于GPU的液晶大气湍流模拟器实时波面生成计算方法。针对液晶湍流模拟器高分辨率、高精度的特点介绍了湍流波面生成计算方法,论述了CUDA通用计算架构。建立基于GPU的波面生成模型,并对该模型进行了并行化优化和共享存储器优化。给出了采用CPU与GPU进行波面生成的实验对比结果。结果表明:采用GPU生成分辨率为256×256,192项Zernike多项式进行波面生成的平均时间为2.5ms,生成速度比CPU少两个量级,满足实时波面生成的要求。  相似文献   

4.
分布式光纤拉曼温度传感(DTS)系统是一套基于光纤中的拉曼散射效应来实现分布式温度监控的系统,利用光纤中拉曼散射光的强度与光纤的温度状态有关的原理对温度进行实时监测。设计了一套9 km的光纤拉曼测温系统,利用数据采集卡对斯托克斯和反斯托克斯光进行采集,在电脑端对温度进行累加平均处理,将微弱的信号从系统的噪声中提取出来,提高其信噪比。在累加平均16 000次的情况下测温精度达到了±2℃。  相似文献   

5.
刘恒  张军  戴广宇  吕堃林  陈哲 《应用光学》2016,37(3):372-379
针对实际应用中轨面伤损检测系统检测速度较慢的问题,在保证检测精度的前提下,结合轨面图像特点及软件工程的思想,提出了面向算法、编程技术和存储介质3个层面的优化方法。算法优化通过重新设计算法流程,合理取舍步骤,实现算法到CPU的高效映射;编程技术优化使用多线程编程,通过并行运算充分利用处理器的多核优势;存储介质优化通过使用读写快、质量轻、能耗低、体积小的固态硬盘进行图像读写,有效地提升了硬件效率。实验结果表明,优化后平均每幅轨面图像检测耗时由17.94 ms降低到仅8.33 ms,速度提升了53.57%,在分辨率为1 mm的精度下换算成车速约为207 km/h,可以满足铁路轨面伤损在线检测需求。  相似文献   

6.
为解决点源法计算全息速度较慢的问题,提出了一种新的查表算法,命名为三角函数查表法(T-LUT算法)。该算法是基于点源法基本的数学公式,通过一系列数学近似与恒等变换,生成了一种纯相位查找表,该查找表具有三维特性,并具有生成速度快、精度高、占用内存少等特点,克服了点源法重复计算相位的缺点。同时采用统一计算设备架构(CUDA)并行计算在图形处理器(GPU)上加以实现,并进行了三次并行优化。在算法的验证与对比实验中,采用单显卡(GPU显卡)实现T-LUT算法,在不牺牲全息图再现像质量的前提下,成功地将点源法计算全息的速度大幅度提升。实验发现在不同的物空间采样点数量的情况下,速度相对于点源法GPU运算提升30倍至近千倍不等。  相似文献   

7.
詹飞  马晓川  杨力 《声学学报》2018,43(4):445-452
针对宽带编码脉冲、多输入多输出等新型目标探测体制发展带来的运算量和数据存储需求剧增的问题,根据水下航行器相位编码脉冲回波检测算法的数据级并行特点,提出应用图形处理器(Graphics Processing Unit,GPU)众核处理架构,并从任务分配策略、数据处理流程、GPU硬件资源利用率和存储器访问等角度考虑,设计了算法在GPU上的并行实现框架。利用湖试数据测试了桌面级GPU平台、嵌入式GPU平台与基于多核数字信号处理器(Digital Signal Processor,DSP)的传统航行器信号处理平台的性能,与多核DSP平台相比,嵌入式GPU平台在功耗、运算性能等方面更有优势。研究结果表明采用嵌入式GPU平台可大幅提升每瓦特性能指标并简化系统设计,能满足新型航行器探测系统大数据量、低功耗和实时性的应用需求。   相似文献   

8.
针对现代战争复杂电磁环境以及数字相控阵雷达干扰信号生成数据量大、多波束等难点,利用图形处理器(GPU)带宽高,运算能力强的特点,使用OpenCL异构编程框架实现数据级并行策略,设计了基于OpenCL的五种典型数字干扰并行算法。算法根据GPU的读写机制进行优化设计,充分发掘了现有GPU的并行计算能力。实验结果表明:基于GPU的数据并行计算程序与中央处理器(CPU)平台相比较,加速比最大可达3.25,提高了相关雷达回波模拟设备的速度,基本满足数字相控阵雷达信号处理的实时性要求。  相似文献   

9.
多帧盲解卷积图像复原技术能够进一步提高自适应光学图像的分辨力,但其算法比较复杂,处理耗时过长,对序列图像复原经常需要几分钟甚至几十分钟的计算时间,对实际应用造成了极大不便。为了提升算法的运行速度,改善其耗时过长的问题,通过研究和分析盲解卷积算法原理和算法结构,采用目前高速发展的中央处理器(CPU)和图形处理器(GPU)异构加速技术,主要对耗时最长的矩阵卷积运算进行优化,通过使用库函数与算法结构微调相结合的方法并行加速,实现多帧盲解卷积的图像复原算法的并行化。使用并行算法对图像进行复原处理,针对16帧以上分辨率为256256像素的空间目标图像,可以实现17的加速比,为图像复原的实时/准实时提供一种可行的方案。  相似文献   

10.
现有的HL-2A实时平衡重建系统采用的是网格尺寸为33×33,将无法满足HL-2M装置对控制精度和速度要求。为此开发了网格尺寸为129×129的重建系统,并通过GPU并行、算法重构等优化方法,使得新的重建系统在保证计算精度的情况下能够使得每一次平均重建计算维持在600μs内,可满足HL-2A和HL-2M中周期为1ms等离子体控制系统对重建系统精度和速度要求。  相似文献   

11.
现有的HL-2A实时平衡重建系统采用的是网格尺寸为33×33,将无法满足HL-2M装置对控制精度和速度要求.为此开发了网格尺寸为129×129的重建系统,并通过GPU并行、算法重构等优化方法,使得新的重建系统在保证计算精度的情况下能够使得每一次平均重建计算维持在600μs内,可满足HL-2A和HL-2M中周期为1ms等离子体控制系统对重建系统精度和速度要求.  相似文献   

12.
针对工业大视场物镜畸变成像的实时校正问题,提出一种校正算法和CPU+GPU并行加速方案.根据光学畸变理论和相机标定技术,建立非球面畸变校正模型.利用棋盘样板计算光学中心和估计畸变系数,设计校正算法.在CPU+GPU并行加速方案基础上,设计内核自适应维度算法并优化运行程序,结合OPENGL驱动进行实时校正和显示.实验结果表明,本文设计的实时校正系统对高分辨率的畸变成像校正率可以达到98.2%,单帧耗时0.026 s,平均综合加速比为29.1.该系统精度高,可移植性强,简单易行,能够广泛应用于成像畸变的实时校正.  相似文献   

13.
为解决SART迭代重建算法计算耗时的问题,在单GPU基础上,利用多块GPU 的并行计算能力,提出了一种多GPU加速迭代重建算法。实验结果表明,与CPU重建相比,在不影响重建图像质量的情况下,采用GPU重建速度有明显提高,且增加GPU数量可以进一步提高重建速度。  相似文献   

14.
王新华  王晓坤 《中国光学》2015,8(5):785-793
为了满足工程应用对图像拼接实时性的要求,依据已设计完成的基于同心球透镜与微相机拼接阵列复合结构的十亿像素瞬态成像系统,提出一种基于统一计算设备架构(CUDA)与先验信息相结合的自适应图像拼接并行加速算法。首先,利用高精度四维标定平台对相邻微相机成像重叠区域进行预标定。接着,采用基于CUDA的快速鲁棒特征(SURF)方法检测提取重叠区域图像的候选特征点集。然后,运用基本线性代数运算子程序(CUBLAS)加速基于随机KD-Tree索引的近似最近邻搜索(ANN)算法,用于获取初始匹配点对。最后,提出一种改进的并行渐近式抽样一致性(IPROSAC)算法,用于剔除误匹配点对和空间变换矩阵的参数估计,从而得到拼接图像的空间几何变换关系。实验结果表明,该算法的图像拼接时间为287 ms,与单独采用CPU串行算法相比速度提高了近30倍。  相似文献   

15.
Canny算法在PC机上的执行速度较慢,这极大地限制了其实用性。本文在前人的研究基础上对算法进行更深的优化和改进。首先在VS2012开发环境下利用数字图像处理技术对原算法进行原理上的改进,再利用GPU流处理器数量众多的优势以及强大的多线程并发执行能力对Canny算法进行并行加速。在500 pixel×500 pixel的图片上,对本文算法和原Canny算法进行了实验验证。实验结果表明,在4 096 pixel×4 096 pixel大小的图片上采用本文的GPU移植算法处理后,执行速度从80 ms降到了6 ms以内。在不影响边缘检测效果的前提下极大地提高了算法的实用性。  相似文献   

16.
提出利用显卡图形处理单元(Graphics Processing Units, GPU)的并行信息处理能力解决仪器软件在执行海量数据处理、建模、渲染以及交互所面临的开销过大的难题,基于DirectX 11的计算着色器(Compute Shader,CS)实现海量测量数据的处理和建模以及高速推送渲染,建立在GPU内实现海量数据模型上点的拾取模块,以提高仪器可视化测量中的交互执行。实验比对证实了基于GPU的可视化测量仪器软件的高执行效率。研究为挖掘可视化测量仪器硬件能力、合理配置仪器CPU与GPU开销、在整体上提高仪器运行效率提供了一条有价值的技术路径。  相似文献   

17.
基于格子Boltzmann方法的多孔介质流动模拟GPU加速   总被引:1,自引:0,他引:1  
利用NVIDIA CUDA平台,在GPU上结合稀疏存贮算法实现基于格子Boltzmann方法的孔隙尺度多孔介质流动模拟加速,测试该算法相对基本算法的性能.比较该算法在不同GPU上使用LBGK和MRT两种碰撞模型及单、双精度计算时的性能差异.测试结果表明在GPU环境下采用稀疏存贮算法相对基本算法能大幅提高计算速度并节省显存,相对于串行CPU程序加速比达到两个量级.使用较新构架的GPU时,MRT和LBGK碰撞模型在单、双浮点数精度下计算速度相同.而在较上一代的GPU上,计算精度对MRT碰撞模型计算速度影响较大.  相似文献   

18.
孙玉强  李银银  顾玉宛 《应用声学》2017,25(3):195-196, 230
并行问题和最短路径问题已成为一个热点研究课题,传统的最短路径算法已不能满足数据爆炸式增长的处理需求,尤其当网络规模很大时,所需的计算时间和存储空间也大大的增加;MapReduce模型的出现,带来了一种新的解决方法来解决最短路径;GPU具有强大的并行计算能力和存储带宽,与CPU相比具有明显的优势;通过研究MapReduce模型和GPU执行过程的分析,指出单独基于MapReduce模型的最短路径并行方法存在的问题,降低了系统的性能;论文的创新点是结合MapReduce和GPU形成双并行模型,并行预处理数据,针对最短路径中的数据传输和同步开销,增加数据动态处理器;最后实验从并行算法的性能评价指标平均加速比进行比较,结果表明,双重并行环境下的最短路径的计算,提高了加速比。  相似文献   

19.
本文针对通用图形处理器(GPGPU)的特点,对二维传热数值求解算法及三类不同边界条件问题在GPU上的求解进行了分析.图形处理器是一种专用并行处理器,主要用于三维场景渲染加速,其结构和程序设计方式与CPU完全不同,但却比CPU具有更强的浮点运算能力和内存带宽.随着图形处理器可编程特性的发展,它已越来越超出原有的应用范围,向通用计算领域发展,成为一个新的研究领域.采用Jacobi迭代,能够在GPU上实现二维导热方程的求解.本文在已有研究的基础上,实现了二维导热计算的混合边界条件问题在GPU上的求解方法,通过计算时间的比较显示GPU在计算传热学中有良好应用前景.  相似文献   

20.
李大禹  胡立发  穆全全  宣丽 《光子学报》2008,37(8):1643-1647
利用GPU进行液晶自适应光学波前重构的加速计算.介绍了液晶自适应光学的Zernike模式波前重构算法,详细论述了GPU的通用架构和GPU实现波前重构的方法,给出了GPU与CPU的实验对比结果.结果表明,GPU计算波前重构不但可以准确无误地计算出液晶波前校正器的灰度级分布,计算速度更是传统CPU波前计算的几十倍.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号