共查询到20条相似文献,搜索用时 15 毫秒
1.
早期区块链系统主要运行在冯·诺依曼架构的通用处理器上,随着区块链技术的发展,其在各行各业得到广泛应用和大规模部署的情况下,在计算密集型和通信密集型场景中,需要同时兼顾高计算能效和高计算灵活性.本文在此基础上,利用本地计算机和云服务器这类通用处理器结合现场可编程门阵列(FPGA)组成异构计算区块链网络,从而经济有效地获得... 相似文献
2.
3.
用可编程门阵列(FPGA)作为主处理芯片实现雷达信号处理时,大阶数矩阵转置经常由于双倍速率同步动态随机存储器(DDR)的跳行访问速率而成为系统处理速率的瓶颈。文中分析了DDR的读写机制,对DDR读写时间的组成进行了定量分析,提出了一种提高矩阵转置效率的分块式矩阵转置方法。该方法采用矩阵分块技术,使矩阵转置时DDR的读写速率得以均衡,从而提高DDR读写的平均效率。文中提供了矩阵转置效率的实验室实测数据,验证了该方法的有效性。该方法已在工程实践中得到了成功的应用。 相似文献
4.
5.
6.
7.
研究了基于信号处理单元(SPU)平台的雷达信号处理技术,结合某雷达系统需求,采用高性能双数字信号处理器(DSP)和现场可编程门阵列(FPGA)的SPU硬件处理平台实现雷达信号处理,使用串行设计技术提高雷达信号处理的实时性、通用性、可靠性,同时减少信号处理的硬件设备量。实验结果验证了基于单块SPU雷达信号处理的可行性。 相似文献
8.
9.
DSP中FPGA实现的新思路 总被引:1,自引:0,他引:1
本文论述了FPGA在DSP应用上的优缺点,比较了FPGA芯片和DSP芯片之间的差别,介绍了解决隔阂的方案-XtremeDSP轮件包和平台级的Virtex Ⅱ芯片,最后,对Xtreme和Vitrex Ⅱ芯片的特点进行了详细说明。 相似文献
10.
随着芯片技术的迅猛发展,越来越多的技术被应用到硬件数字处理领域。在硬件设计中也越来越多地使用了更为复杂的算法。但是,由于硬件设计本身的原因,用其实现复杂算法始终略感欠缺。目前在复杂算法的硬件实现上,主要有两种方式:一是以运算能力见长的、以指令方式运行的DSP处理器;二是以并行处理和可编程的FPGA为主的ASIC设计;两种方式各有所长。文中主要是针对在设计船用雷达信息处理系统中所涉及到的一些较为复杂算法,如跟踪算法、堆栈排序和数据存储等,谋求以FPGA方式的较优实现。通过实现设计中用到的复杂算法,提出硬件实现复杂算法的一些优化方法,以及可供利用的诸如Matlab的Simulink模块库中Xilinx组件等的工具软件。 相似文献
11.
利用FPGA实现数字信号处理 总被引:8,自引:1,他引:8
本文以FFT、FIR滤波器、自适应信号处理和可再配置计算为例,讨论了现场可编程门陈阵(FPGA)器件的DSP典型应用。在具体应用过程中会存在的一些实际问题,如有效字长影响、并行与串行结构的选择和FPGA内部结构对设计的影响等,本文也对此进行了分析。 相似文献
12.
矩阵求逆是工程计算中的基本问题,在大规模MIMO系统、阵列信号处理以及图像信号处理等应用中,大规模矩阵求逆的处理速度对系统性能至关重要,但传统矩阵求逆方法运算复杂度高、并行性低且消耗大量存储空间,不利于硬件加速。针对大规模矩阵求逆硬件加速问题,文中研究了基于LDL分解的矩阵求逆算法,并提出了一种基于该算法的大规模矩阵求逆加速架构。利用LDL分解后三角矩阵对角线元素全为1的特点,对矩阵进行分块迭代设计,减少了求逆运算的计算量,提高了计算速度。文中基于Xilinx Virtex7 FPGA设计实现了该加速器,实验结果表明,在128阶矩阵下,吞吐量达105.2 Inv·s-1,最高时钟频率达200 MHz。与现有矩阵求逆加速方案相比,该设计占用的硬件资源更少,且具有更高的性能。 相似文献
13.
14.
15.
针对卷积神经网络(CNN)计算量大、计算时间长的问题,该文提出一种基于现场可编程逻辑门阵列(FPGA)的卷积神经网络硬件加速器。首先通过深入分析卷积层的前向运算原理和探索卷积层运算的并行性,设计了一种输入通道并行、输出通道并行以及卷积窗口深度流水的硬件架构。然后在上述架构中设计了全并行乘法-加法树模块来加速卷积运算和高效的窗口缓存模块来实现卷积窗口的流水线操作。最后实验结果表明,该文提出的加速器能效比达到32.73 GOPS/W,比现有的解决方案高了34%,同时性能达到了317.86 GOPS。 相似文献
16.
17.
矩阵运算广泛应用于实时性要求的各类电路中,其中矩阵求逆运算最难以实现。基于现场可编程门阵列(FPGA)实现矩阵求逆能够充分发挥硬件的速度与并行性优势,加速求逆运算过程。基于改进的脉动阵列的计算架构,采用一种约化因子求逆的优化算法,将任意一个n×n阶上三角矩阵转换成对角线为1的上三角矩阵,使得除法运算与乘加运算分离开来,大大简化矩阵求逆运算过程。以一个4×4阶上三角矩阵求逆为例,在Xilinx ISE平台下,采用Virtex5 FPGA完成算法实现与功能验证,在14个周期内,使用了2个除法器,3个乘法器与4个加法器实现整个矩阵求逆运算。相比于经典的脉动阵列架构,仅占用近一半资源的同时,性能提升了26.43%;相比于集成更多处理单元(PE)的脉动阵列实现方式,在性能近乎不变的情况下,耗费的资源缩减到1/4,大幅度提升了资源利用率。 相似文献
18.
互联网时代已经来临,面对大规模数据的处理,传统计算机技术已跟不上步伐,文章引入了开源云计算系统Hadoop(一种分布式计算平台),利用Mapreduce编程模式对互联网中经常涉及的大规模矩阵乘法的算法理论进行了相关研究,并对Hadoop相关技术领域的应用做了展望。 相似文献
19.
为提高线性调频连续波雷达的探测精度,提出一种Rife算法与Jacobsen算法的联合频率估计算法。该算法分别对三角波调制的线性调频连续波的差频信号的上下扫频的频谱进行峰值搜索,当其频率在量化频率点附近时用Jacobsen算法优化,其他情况使用Rife算法直接估计。通过理论及Matlab软件仿真分析算法的估计性能,结合现场可编程门阵列(FPGA) EP4CE30F23C8N设计了用于三角波调制的LFMCW雷达,通过SignalTapⅡ软件实时捕捉目标参数,得到速度及距离信息。该方法应用于调频连续波雷达可以取得较高探测精度,同时具有较高的实时性、稳定性。 相似文献
20.
基于DSP+FPGA的红外视频实时处理系统 总被引:1,自引:0,他引:1
介绍了一种高速实时红外视频信号处理系统的原理、结构.系统采用FPGA DSP的结构,FPGA完成系统的时序控制和低层算法,而由DSP实现高层算法.给出了实验结果,验证了本系统能够满足实时红外视频成像系统的要求. 相似文献