首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 437 毫秒
1.
陈升来  黄廉卿 《光学技术》2006,32(4):587-590
针对SPIHT(set partitioning in hierarchical trees)算法的编码过程具有重复运算、存储量大等问题,提出了一种适合于DSP(digital signal processors)处理的低内存并行SPIHT算法。该算法采用乒乓缓存策略,使得数据的传输和编码能够同时进行。通过引入基于行的整型提升方案,使得只需经少量行变换就能进行列变换,提高了小波的变换速度。根据DSP的并行特性和SPIHT算法的缺点,采用“改进的最大幅值求取方法”、“误差位数以及绝对零值和绝对零集合”、“最大值与零值图”和“单棵零树编码”等多种方法对其进行了改进,大大缓解了对内存的压力,减少了算法的运算量。该算法与LZC(listless zerotree coding)算法相比,重构图像的峰值信噪比相当,但速度提高了2倍,能满足一般的实时压缩要求。  相似文献   

2.
现役运载火箭一体化测发系统的单任务测试模式,已无法满足运载火箭的高密度、快速测发的需求。通过控制软件多线程设计实现多任务控制的并行处理;使用分布式执行终端,同步完成并行测试功能。设计具有包含多任务信息的通讯协议,实现并行测试信息的网络传输。利用软件的共享缓存技术实现多任务之间的信息交互。在信息传输中通过字节流模式进行先进先出的实时通信,保证了运载火箭测发的实时性。通过对一体化测发系统的并行测试研究,可实现一套测发控系统对箭上多个子系统同时进行测试。 并行测试技术的研究利用了计算机系统并行处理能力,通过测发软件的并行设计,实现可由用户控制的多任务并行测试系统,提高了运载火箭的测试效率和节省测试费用,是解决运载火箭高密度、低成本发射的一种技术途径。  相似文献   

3.
郭红  曹小林  胡晓燕 《计算物理》2011,28(4):475-480
为解决并行应用程序使用FFTW(Fastest Fourier Transform in the West)并行软件包所面临的计算规模难以扩展、数据结构变动大、实现不同数据结构间通信难度大、接口不确定等问题,在JASMIN框架内设计实现FFT并行解法器.该解法器封装了数据分布存储、数据通信等并行计算细节,通过重新分布存储数据,调用一维FFT变换实现高维FFT的并行计算,并提供规范接口,支撑用户简便地实现FFT的并行计算.数值测试表明,该解法器具有很好的并行性能.该解法器已应用于激光等离子体成丝不稳定性的数值模拟并行程序,它在2048个处理器上的并行效率可达80%以上.  相似文献   

4.
多通道热释电IRFPA图像拼接采集系统   总被引:1,自引:1,他引:0       下载免费PDF全文
程瑶 《应用光学》2014,35(5):806-810
为了实现分辨率高的大规模热释电IRFPA探测器,设计了多路通道并行输出的读出电路。针对多路输出的热释电IRFPA探测器,依据热释电探测的时序要求,设计了图像拼接采集系统。利用外部驱动信号控制采集卡的触发及采样时钟,由斩波器同步信号判断热释电探测器的亮场及暗场信号。构造PC-DAQ虚拟仪器系统对多通道输出的热释电型IRFPA进行多路并行图像采集,并对每路图像信号进行亮、暗场判断后进行差分处理,通过软件拼接处理成一副完整的图像,最终在软件平台上显示。对实验室研制的160列120行双通道读出及320列120行四通道读出的热释电读出电路进行了图像采集实验,对于同样阵列大小的单通道读出探测器,双通道结构读出速度提高了1倍,四通道结构读出速度提高了3倍。通过采集成像实验验证了系统的可行性。  相似文献   

5.
基于PCI总线的多通道图像数据高速采集   总被引:2,自引:0,他引:2  
根据立体测绘相机的数据传输要求,需要将多个图像数据源产生的异步图像数据传输和存储到计算机上,研究和实现了一种实用的完整解决方案。采用FPGA对多个图像数据进行组合,在FPGA内部进行一级缓存,将异步的图像数据源,变换成同步数据,经过独立的FIFO芯片对图像数据进行缓存,方便总线繁忙时对图像进行缓存;然后通过专用的PCI接口芯片,将图像数据传输到PCI总线上;使用DriverWorks进行驱动程序的设计,将数据存入内存中,通过应用程序显示及存储于硬盘中。  相似文献   

6.
基于驰豫超前变换中的超前展开、求和近似和延时近似技术,提出了流水线并行自适应CMA盲均衡算法。利用基于迭代短卷积的并行FIR滤波算法分析了提出的并行自适应盲均衡算法的滤波部分的高效实现结构;再利用基于组合短卷积的并行自适应系数更新算法分析了提出的并行均衡算法的系数更新部分的高效实现结构,从而得到了基于短卷积的流水线并行自适应盲均衡的完整实现框图,并分析了各模块的流水线延时需满足的关系。最后对该并行自适应盲均衡算法进行了FPGA量化实现,并通过MATLAB仿真及实际FPGA实现结果的对比,验证了本并行均衡算法的正确性和有效性。  相似文献   

7.
实时数字图像无损压缩的研究   总被引:1,自引:0,他引:1  
针对实时数字图像的无损压缩方法进行了分析,采用三级5-3整数提升小波变换,小波变换的高频和低频系数分别采用不同的编码方法。进行了基于DSP和FPGA的压缩系统结构设计,提出了软、硬件并行的方法。进行三级小波变换时,硬件结构能够实现在对当前级小波变换的同时进行前一级小波变换的高频系数编码,提高了压缩系统的实时性。并对压缩系统的关键技术进行了研究。可以对80MB/s的数字图像进行无损压缩,压缩比可以达到1.68~1.8左右。  相似文献   

8.
2008年我们研究和编制了冲击动力学计算软件(IPDC),目前已基本实现串行版本和基于主从模式的MPI并行版本。IPDC的串行版本和并行版本已具备初步应用性,并且有较好的计算精确度和并行效率。已经实现的功能:计算结构跌落的瞬态响应;计算结构被高速撞击的瞬态响应和侵蚀效果。IPDC目前应用的材料有:各向同性弹性材料和各向同性弹塑性材料。使用的几何单元为六面体实体单元。中位移采用线性插值方法,应力、应变更新采用单点积分方法。  相似文献   

9.
张刚  马震环  雷涛  崔毅  张三喜 《应用光学》2019,40(6):1067-1076
在光电监视系统中,广泛应用于运动目标分割的PBAS(pixel base adaptive segmenter)算法计算复杂、参数量大,难以达到实时分割的要求。针对PBAS算法是对图像中每个像素点进行独立处理,特别适合于GPU并行加速的特点,对其在嵌入式GPU平台Jetson TX2上进行了并行优化实现。在数据存储结构、共享内存使用、随机数产生机制3个方面对该算法进行了优化设计。实验结果表明,对于480×320像素分辨率的中波红外视频序列,该并行优化方法可以达到132 fps的处理速度,满足了实时处理的要求。  相似文献   

10.
计算机辅助的化学结构搜索在化学信息学中地位十分重要,本文设计了一套高性能的化学结构和化学数据搜索系统,称为DCAIKU.DCAIKU基于CouchDB无模式数据库和ElasticSearch基础架构构建,通过将结构相似性搜索变换为文字搜索实现了高性能和高灵活性的检索引擎:在满足化学信息存储的高灵活性条件下,仍然可以做到低延迟和高准确性,同时拥有良好的伸缩性,可以大规模并行化和集群化.  相似文献   

11.
马涛    汶德胜 《光子学报》2009,38(4):1010-1019
提出了一种JPEG2000编码系统结构和VLSI方案.该方案以小波子带为单位,多套并行处理.对JPEG2000标准中各个模块的算法进行了逻辑化简、并行编码等优化.如采用双行并行9/7提升小波分解,条带并行的比特平面编码,简化区间更新和并行归一化算术编码等.各模块均以流水线方式工作,其中的比特平面编码和算术编码采用异步流水线方式动态分配执行时间,加速比均接近于流水段数3.以图像信号产生板送入原始图像,编码后送入PC机进行码流截断和解压缩.该系统在各个压缩率下的信噪比与LuraWave商用压缩软件的差距均在0.8 dB之内,可见改进后的算法可行且有效,像元时钟可达20 MHz.  相似文献   

12.
提出了一种JPEG2000编码系统结构和VLSI方案.该方案以小波子带为单位,多套并行处理.对JPEG2000标准中各个模块的算法进行了逻辑化简、并行编码等优化.如采用双行并行9/7提升小波分解,条带并行的比特平面编码,简化区间更新和并行归一化算术编码等.各模块均以流水线方式工作,其中的比特平面编码和算术编码采用异步流水线方式动态分配执行时间,加速比均接近于流水段数3.以图像信号产生板送入原始图像,编码后送入PC机进行码流截断和解压缩.该系统在各个压缩率下的信噪比与LuraWave商用压缩软件的差距均在0.8 dB之内,可见改进后的算法可行且有效,像元时钟可达20 MHz.  相似文献   

13.
Beyond-5G wireless networks are expected to gain a excellent trade-off among computational accuracy, latency, and efficient use of available resources. This poses a significant challenge to the channel decoder. In this paper, a novel memory efficient algorithm for decoding Low-Density Parity-Check (LDPC) codes is proposed with a view to reduce the implementation complexity and hardware resources. The algorithm, called Check Node Self-Update (CNSU) algorithm, is based on layered normalized min-sum (LNMS) decoding algorithm while utilizing iteration parallel techniques to integrate both Variable Nodes (VNs) message and A-Posterior Probability(APP) message into the Check Nodes (CNs) message, which eliminates memories of both the VNs message and the APP message as well as updating module of APP message in CNs unit. Based on the proposed CNSU algorithm, design of partially parallel decoder architecture and serial simulations followed by implementation on the Stratix II EP2S180 FPGA are presented. The results show that the proposed algorithm and implementation bring a significant gain in efficient using of available resources, include reducing hardware memory resources and chip area while keeping the benefit of bit-error-rate (BER) performance and speeding up of convergence with LNMS, which are beneficial to apply in Beyond-5G wireless networks.  相似文献   

14.
LED背光源中侧发光导光管长度与出光性能的关系   总被引:3,自引:1,他引:2       下载免费PDF全文
微细侧发光导光管可以将LED点光源转化成线光源.为了同时发挥LED光源和CCFL光源的优势,本文对导光管模型进行了改进,使不同长度导光管均能满足良好的出光性能.在网点公式基础上引入非线性修正参数α,并找到导光管长度与α的对应关系,得到不同长度导光管的优化网点排布形式.针对较短导光管光能利用率偏低的问题,采用导光管一端入...  相似文献   

15.
The algorithm and optical implementation of full parallel adder using combina-torial logic architecture have been suggested in this paper.The hybrid full parallel adder,which can perform multiple bits addition simultaneously,is implemented by utilizing VLSItechnology and acoustooptic Bragg cells.The algorithm has the advantages of high parallelismand easy optical implementation.The full parallel adder finishes n-bit addition within the du-ration T_d if the pipeline architecture is employed,whose hardware complexity is O(n~2).  相似文献   

16.
Xiaoxu Lu  Liyun Zhong  Hongzhan Liu  Zhun Zhang 《Optik》2010,121(19):1777-1780
Causes of the bright cross appearing in the reconstructed field of lensless Fourier transform digital hologram (LFDH) are presented. Firstly, as LFDH's reconstruction was directly performed by Fourier transform algorithm, the intensity distribution of reconstructed image plane was just LFDH's spectrum, and three parts of the reconstructed field are imaged in the spectral plane. Meanwhile their intensities were almost the same. Hence, the ratio of signal to noise of the reconstructed image was obviously lower than that of the conventional digital hologram. Further, non-uniformity of the background intensity and random noises usually existed in a practical LFDH. Meanwhile their spectra spread through the central and the edge areas; this also led to decrease in the ratio of signal to noise of the reconstructed image. Specially, as the two-dimensional Fourier transform algorithm was performed row by row, and then column by column, the low-frequency spectrum induced by the non-uniformity of the background and random noises along the directions of rows and columns would concentrate on the central column and row, respectively, and what is gotten looked like a cross. Therefore, the cross appearing in LFDH's reconstructed field should be attributed to the combination of the background and the Fourier transform algorithm itself.  相似文献   

17.
We propose an optical implementation of a parallel two-step phase-shifting digital holography that utilizes a polarization technique. The implementation uses a phase-shifting array device consisting of a retarder array attached to an image sensor, and does not require the optical system to image the phase-shifting array device onto the image sensor required for the previously reported optical implementation of the parallel two-step phase-shifting digital holography. Then, the proposed implementation is essentially simple to align and compose. A preliminary experiment showed that the parallel two-step phase-shifting digital holography based on the proposed implementation can remove the conjugate image clinging to the image reconstructed by Fresnel transform alone with DC term suppression. Also, when the reconstruction distance was changed, the qualities of the reconstructed images were quantitatively evaluated by using normalized root-mean-square error. It was clarified that the proposed implementation was superior to other parallel phase-shifting digital holographies and Fresnel transform alone. Thus, the validity of the proposed implementation was confirmed.  相似文献   

18.
人工智能的快速发展需要人工智能专用硬件的快速发展,受人脑存算一体、并行处理启发而构建的包含突触与神经元的神经形态计算架构,可以有效地降低人工智能中计算工作的能耗.记忆元件在神经形态计算的硬件实现中展现出巨大的应用价值;相比传统器件,用忆阻器构建突触、神经元能极大地降低计算能耗,然而在基于忆阻器构建的神经网络中,更新、读取等操作存在由忆阻电压电流造成的系统性能量损失.忆容器作为忆阻器衍生器件,被认为是实现低耗能神经网络的潜在器件,引起国内外研究者关注.本文综述了实物/仿真忆容器件及其在神经形态计算中的最新进展,主要包括目:前实物/仿真忆容器原理与特性,代表性的忆容突触、神经元及神经形态计算架构,并通过总结近年来忆容器研究所取得的成果,对当前该领域面临的挑战及未来忆容神经网络发展的重点进行总结与展望.  相似文献   

19.
随着计算空间光调制器的分辨率的尺寸逐渐变大,全息图三维动态显示的计算量也越来越大,使得对全息计算速度提出了新的要求。利用GPU并行计算处理的方式实现全息图的快速层析法计算,该方法利用GPU并行多线程和层析法中的图像二维傅里叶变换的优势对菲涅尔衍射变换算法加速计算;同时通过对GPU底层资源的调用和对CUDA中程序的流处理过程,有效减少中间的延时等待。通过对计算速度对比分析表明:与在CPU上运算相比,计算速度大幅提升,基于GPU并行计算的方法比基于CPU计算的方法速度快10倍左右。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号