期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

商哲然谭贤四曲智国王红丰骁《雷达科学与技术》2016,14(5):505-509

RFT(Radon-Fourier Transform)是一种广义的MTD算法,可沿着目标径向运动轨迹进行相参积累。然而对距离-速度二维搜索产生的巨大计算量使得其难以快速实现和工程化。针对这个问题,根据雷达信号的回波数据结构和RFT算法思路,提出一种基于GPU的RFT并行化算法。通过实验,GPU平台实现的RFT算法与标准RFT和快速RFT相比,获得了巨大的加速比。另外,通过对比在CPU平台执行的MTD算法,得到在GPU平台上的RFT计算结果在不需要传回主机内存的条件下,计算速度快于在CPU平台上MTD算法。相似文献

2.

基于NVIDIA GPU 的机载SAR 实时成像处理算法CUDA 设计与实现

下载免费PDF全文

孟大地胡玉新石涛孙蕊李晓波《雷达学报》2013,2(4):481-491

合成孔径雷达(SAR)成像处理的运算量较大,在基于中央处理器(Central Processing Unit, CPU)的工作站或服务器上一般需要耗费较长的时间,无法满足实时性要求。借助于通用并行计算架构(CUDA)编程架构,该文提出一种基于图形处理器(GPU)的SAR 成像处理算法实现方案。该方案解决了GPU 显存不足以容纳一景SAR 数据时数据处理环节与内存/显存间数据传输环节的并行化问题,并能够支持多GPU 设备的并行处理,充分利用了GPU设备的计算资源。在NVIDIA K20C 和INTEL E5645 上的测试表明,与传统基于GPU 的SAR 成像处理算法相比,该方案能够达到数十倍的速度提升,显著降低了处理设备的功耗,提高了处理设备的便携性,能够达到每秒约36兆采样点的实时处理速度。相似文献

3.

基于TMS320VC5416的FFT算法的实现

贾玮杨录张艳花《山西电子技术》2009,(2):11-13

快速傅里叶变换（FFT）是一种将信号从时域变换到频域的变换形式,是声学、图像、电信和信号处理等领域中一种重要的分析工具。近年来,专用的数字信号处理器以其优化的硬件结构和优良的性能价格比为FFT的实现提供了一个有效的途径。详细介绍了以浮点型DSP5416为核心的实现FFT算法的硬件平台设计。相似文献

4.

大点数FFT算法的改进及其实现

苏涛庄德靖《现代雷达》2005,27(7):23-26

针对高速实时信号处理的需要，提出了一种对任意长度序列进行FFT的快速改进算法。通过对FFT处理前数据添零个数和DFT分解参数的优化选择，显著降低了FFT处理的运算量。结合频域脉冲压缩等信号处理实例，探讨了该算法在高速DSP上实现时的资源分配、程序编程以及传输I／O瓶颈问题，分别提出了具体的解决方法，并在实际DSP系统中测试了这种改进算法的性能指标，将其和普通算法的性能作了比较。相似文献

5.

细粒度并行计算编程模型研究 总被引：5，自引：1，他引：4

刘伟峰王智广《微电子学与计算机》2008,25(10)

作为应用软件模型和计算机硬件之间的桥梁,编程模型在计算机领域的重要性不言而喻.但随着具备细粒度并行计算能力的多核心微处理器进入主流市场,与之相适应的编程模型发展却相对滞后.对细粒度的并行计算编程模型进行研究.首先,介绍3种典型的多核心微处理器体系结构;其次,介绍3个已有的细粒度并行计算编程模型;最后,探讨并行计算编程模型的必备条件. 相似文献

6.

无存储访问冲突的基2×K并行FFT架构

侯宁赵红梅赵张飞张多利《微电子学与计算机》2014,(7)

提出了一种无存储访问冲突的基2×K并行FFT架构.该架构通过并行地址产生算法,使K个基2蝶形运算单元同时读取或写入所需的2 K个操作数,达到平均每周期完成K个基2蝶式运算的处理能力.与已有的并行FFT架构相比,新架构地址产生电路简单,并且对于不同的K值,并行地址产生模块结构相同.在资源消耗方面,不考虑旋转因子,N点FFT处理器只需要3 N/2个存储单元. 相似文献

7.

基于CUDA的压缩感知重构算法并行化研究

董蕾黄方卜栓栓冯杰周纪《信息技术》2016,(4):32-36,40

压缩感知重构算法存在计算量大、运行时间过长的问题,无法满足人们对算法处理实时/准实时性要求。最近几年,GPU计算能力得到很大的提升,已成为提高算法处理速度最有效的方式之一。根据GPU的硬件特性,文中提出了基于CUDA的压缩感知重构算法的并行设计。实验结果表明:在NVIDIA K20Xm平台上运行,并行算法取得的加速比可达到100X。相似文献

8.

WFTA算法的FPGA设计与实现

魏鹏孙磊王华力《通信技术》2011,44(4):167-169

Winograd傅里叶变换算法（WFTA）利用旋转因子W的特性对其进行分解,能够把FFT运算中乘法次数降到最低,是一种高效且资源占用相对较少的FFT实现方法。以256点分解为两维16×16点的小数组WFTA进行运算为例介绍了大数组WFTA算法的FPGA设计与实现方案。仿真测试表明,所设计的256点FFT处理器,乘法器资源消耗仅为基-2FFT的1/2、基-4FFT的2/3,且在100 MHz主时钟频率下完成运算仅需5.8μs,满足FFT处理器的高速实时性要求。相似文献

9.

基于BWDSP的HEVC帧内预测角度模式的并行化算法

汪辉段苓丽郎文辉佘成龙《电视技术》2018,(3):33-39

针对HEVC帧内预测角度模式算法的特点,提出实现角度预测模式的并行化方法.该方法基于BWDSP1041仿真平台通过分析角度模式算法的可并行性,提出了适合多乘法器并行计算的数据分配方式,结合处理器所搭载的硬件资源,设计了多运算部件并行工作的算法程序.实验结果表明角度预测模式20和垂直模式26在BWDSP1041上利用硬件资源的并行化实现,并行加速比分别达到161.68和344.65.该并行化算法减少了视频编码的时间,其数据分配方案对于帧内预测算法在多核和多运算部件结构上的并行化研究也具有一定的参考价值. 相似文献

10.

基于激光导引头信号的并行高速FFT算法设计

下载免费PDF全文

朱立坤贾方秀李兴隆《激光技术》2018,42(1):89-93

为了减少激光半主动武器中测量光学器件光斑点坐标时噪声和干扰对探测精度影响、增加脉冲信号的测量带宽、提取信号的有效值,同时克服串行快速傅里叶变换（FFT）运算耗时及时间复杂度较大的问题,基于多核和并行架构的SoC-FPGA平台以及OpenCL软件,提出了实现并行FFT的计算方法。结果表明,利用该方法可使FFT（1-D）的时间复杂度下降到原来的1/Q,得到了较好的加速效果;通过3种平台（先进精简指令集微处理器、数字信号处理器和片上系统现场可编程门阵列）的运算耗时实验对比,该算法运算耗时为6.0449ms（1-D 4096点）,要比同点数其它两种平台运算耗时少。并行FFT算法不仅满足激光半主动导引头信号实时性的要求,而且可以达到去噪的效果,能有效地降低噪声和背景光的影响。相似文献

11.

基于SIMD-BF模型的并行FFT算法设计与实现

张世层《电声技术》2014,38(12):65-66

在单指令多数据流-蝶形网络模型(SIMD-BF)上设计实现FFT算法。当前算法中,W指数的获得需要进行位反,左移和补零操作。本算法采用按时间抽取(Decimation-in-Time)方式,其W指数可以由处理器所在位置轻松获得,只需进行简单左移操作,利用该算法中清晰简单的W指数规律进行递归运算,输出即为结果。在提出的算法中,SIMD-BF模型结构处理器的通信方式发生变化,满足选通直达无需选路时间。改进型算法结果表明,W指数规律明显简单,可节省W的计算时间,可处理倒序输入的待变换序列。相似文献

12.

Implementation of Motion Compensation Algorithm for AVS Decoding Based on ADSP-BF561

YE Chang-wei SHEN Jie TANG Ling-na 《电视技术》2008,32(7)

相似文献

13.

基于ADSP-BF561的AVS解码运动补偿算法实现

叶昌伟申杰唐玲娜《电视技术》2008,32(7)

针对自制的ADSP-BF561解码器平台的特点,提出了样本插值的快速算法,提高了运动补偿部分执行的效率。结合汇编指令级优化及存储优化等策略和方法对AVS解码模块进行全局优化,试验结果表明D1画质的视频基本满足了实时解码的要求。相似文献

14.

基于模型的连续运动矢量估值算法

王兴国刘济林顾伟康叶秀清《电子学报》1999,27(8):87-89,59

文中首先简述数字粒子图像测流体速度场ＤｉｇｉｔａｌＰａｒｔｉｃｌｅＩｍａｇｅＶｅｌｏｃｉｍｅｔｒｙ（ＤＰＩＶ）的原理以及现有的处理ＤＰＩＶ的算法思想,详细地分析这些算法的优缺点,为了克服现存算法在应用中暴露出来的共同缺陷,本文提出了一种新的处理ＤＰＩＶ序列图像的算法－－基于模型的连续运动矢量估值算法,该算法充我分利用图像的整体信息获得速度场的基本约束,同时根据流场的物理性质获得速度场基于模型相似文献

15.

基于Map-Reduce模型的BCkmeans并行聚类算法

《电子技术》2016,(5)

相似文献

16.

基于嵌入式系统的运动检测算法的设计及实现 总被引：1，自引：0，他引：1

邓博范文兵常伯乐《电视技术》2013,37(9)

提出一种基于TMS320DM6437嵌入式视频处理系统的运动检测算法,采用实时性很强的ViBe算法进行背景建模及像素点分类,在背景更新的算法上,引入帧级更新的策略,以弥补ViBe算法对突变的背景更新较慢的不足.对前景二值图,使用扫描标记法实现对运动物体的捕捉.实验结果表明,该算法实时性强,适用于嵌入式系统. 相似文献

17.

多目标问题的游戏模型并行共同进化算法

王高平王永骥《微电子学与计算机》2006,23(Z1):20-22

游戏理论的主要成就是进化稳定战略,由MaynardSmith在1982年提出。使用基于游戏模型的共同进化算法寻找ESS作为多目标问题(MOPs)的解,该算法是一种基于粗粒度并行模型的进化算法。首先,研究游戏模型的共同进化方法解决MOPs的有效性。且说明进化游戏如何由共同进化算法来具体实现,证实它是否能达到MOP的最佳均衡点。其次,通过在几个多目标问题上的严格的实验,与其它一些方法比较,评估该方法的性能。相似文献

18.

带运动检测的自适应去隔行算法及其GPU实现

伍刘李明远鲍伟琴《电视技术》2008,32(Z1)

提出了一种简单可行的带运动检测的自适应去隔行算法,该算法能区分图像中的运动区域与静止区域,在静止区域采用场"编织"算法,在动态区域采用场内插值算法,较好的照顾到了图像的动静特性.利用GPU并行渲染图形单元的特性,并实现了该算法. 相似文献

19.

基于MapReduce的并行蚁群算法研究与实现 总被引：4，自引：1，他引：4

夏卫雷王立松《电子科技》2013,26(2):146-149

蚁群算法在处理大规模TSP问题耗时较长,为解决这一不足,给出了一种基于MapReduce编程模式的并行蚁群算法。采用MapReduce的并行优化技术对蚁群算法中最耗时的循环迭代和循环赋值部分进行改进,同时运用PC集群环境的优势将具有一定规模的小蚁群分配到对应的PC机上,使其并行执行,减少运行时间。实验证明改进后的并行蚁群算法在大数据集上运行时间明显缩短,执行效率显著提高。相似文献

20.

自适应并行模型组合的鲁棒语音身份识别算法

下载免费PDF全文

李聪葛洪伟《信号处理》2018,34(7):867-875

由于环境噪声的影响,实际应用中说话人识别系统性能会出现急剧下降。提出了一种基于高斯混合模型-通用背景模型和自适应并行模型组合的鲁棒性语音身份识别方法。自适应并行模型组合是一种噪声鲁棒性的特征补偿算法,能够有效减少训练环境与测试环境之间的不匹配现象,从而提高系统识别准确率和抗噪性能。首先,算法从测试语音中估计出噪声特征,然后用一个单高斯模型对噪声特征进行拟合得到噪声均值和协方差。最后,根据得出的噪声均值和协方差,调整训练好的高斯混合模型均值向量和协方差矩阵,使其尽可能地匹配测试环境。实验结果表明,该方法可以准确地重构干净语音的高斯混合模型参数,并且能够显著提高说话人识别的准确率,特别是在低信噪比情况下。相似文献