共查询到17条相似文献,搜索用时 93 毫秒
1.
一种快速高效的二维一级小波变换的硬件实现 总被引:2,自引:1,他引:1
提出了一种针对9/7小波滤波器的二维一级小波变换的硬件平台,整体结构采用流水方式实现,数据分组输入,列变换采用多个小波变换单元,行变换模块为可重构硬件结构,行列变换之间不需要片上存储器。与已有结构相比,该结构可以通过更少的硬件资源消耗获得更高的处理速度。 相似文献
2.
文中通过深入研究三维离散小波变换(3D DWT)核心算法并根据序列图像编码的特点,设计并实现了一种适合硬件实现的高效的三维小波变换VLSI结构。编写了相应verilog模型,并进行了仿真和逻辑综合。仿真结果表明行列滤波并行处理并采用流水线设计方法,加快了运算速度,有效降低了片内存储容量。 相似文献
3.
4.
5.
6.
一种新型基于提升算法的二维离散小波变换结构的实现 总被引:2,自引:0,他引:2
在提升算法原理分析的基础上,设计出一种采用提升算法的二维离散小波变换结构,改变了传统的提升算法先行后列的运算方式,将行列运算操作结合起来进行,这样,相比于传统结构,在基本不增加硬件单元的前提下,变换时间减小为原来的75%左右,提高了硬件效率。 相似文献
7.
针对JPEG2000中小波变换的硬件实现占用资源量大、速度慢等问题,提出了一种有效的二维小波硬件实现模型。该模型采用流水线并行结构,即对图像中各行像素进行流水线处理的同时,对小波分解的各级采用并行结构处理。这样的结构提高了小波变换的处理速度,实现了实时处理,节省了硬件的片上存储及外部存储资源。用FPGA对此模型进行验证。验证实验采用Xinlinx公司的SPARTEN-3系列芯片,对1 024×2 048的大图像进行处理,图像处理速度达到80Mpixels/s,满足实时性要求。 相似文献
8.
9.
在JPEG 2000中,无损图像压缩是采用整数5/3小波变换实现的.JPEG 2000也给出了5/3小波基于提升方法的算法.对提升方法的整数5/3小波变换算法进行了研究,针对二维的变换提出一种VLSI结构.该结构由4个模块构成,模块之间并行运行,模块内部采用流水线技术.对多级变换,级间的运算还可交叉,体现了提升方法的优势,较大地提高了硬件效率.其主要优点是消耗资源少且运算速度高,同时也适用于其他整数小波变换. 相似文献
10.
离散小波变换需要较大的运算量和运算空间,为了提高JPEG2000图像压缩速度,提出一种基于提升算法的二维离散5/3小波变换的VLSI架构,这种结构同时进行行变换和列变换。文章对于VLSI架构的五大模块(行小波变换运算模块、两个列小波变换模块、FIFO寄存组和系统整体控制模块)的硬件实现给出了相应的方案。在Quartus II 7.2的平台下对于设计的该系统的时序仿真测试结果表明,综合分析后系统最小组合逻辑时延为7.142ns,可达到的最高频率为140.02MHz。时序仿真测试中当系统工作频率为100MHz,数据吞吐率达到773.944Mbit/s。 相似文献
11.
提出一种基于提升算法实现JPEG2000编码系统中的二维离散小波变换(Discrete Wavelet Transform)的并行阵列式的VLSI结构设计方法.利用该方法所得结构由两个行处理器,一个列处理器以及少量行缓存组成;行列处理器内部是由并行阵列式的处理单元组成;能使行和列滤波器同时进行滤波,用优化的移位加操作替代乘法操作.整个结构采用流水线的设计方法处理,在保证同样的精度下,大大减少了运算量和提高了硬件资源利用率,几乎达到100%,加快了变换速度,也减少了电路的规模.该结构对于N×N大小的图像,处理速度达到O(N2/2)个时钟周期.二维离散小波滤波器结构已经过FPGA验证,并可作为单独的IP核应用于正在开发的JPEG2000图像编解码芯片中. 相似文献
12.
Xiong Chengyi Tian Jinwen Liu Jian Gao Zhirong 《电子科学学刊(英文版)》2006,23(2):244-248
A novel Parallel-Based Lifting Algorithm (PBLA) for Discrete Wavelet Transform (DWT), exploiting the parallelism of arithmetic operations in all lifting steps, is proposed in this paper. It leads to reduce the critical path latency of computation, and to reduce the complexity of hardware implementation as well. The detailed derivation on the proposed algorithm, as well as the resulting Very Large Scale Integration (VLSI) architecture, is introduced, taking the 9/7 DWT as an example but without loss of generality. In comparison with the Conventional Lifting Algorithm Based Implementation (CLABI), the critical path latency of the proposed architecture is reduced by more than half from (4Tm + 8Ta)to Tm + 4Ta, and is competitive to that of Convolution-Based Implementation (CBI), but the new implementation will save significantly in hardware. The experimental results demonstrate that the proposed architecture has good performance in both increasing working frequency and reducing area. 相似文献
13.
本文提出一种新的低功率分层运动估值器的VLSI结构,它支持低比特视频编码器的高级预测模式,如H.263和MPEG-4。为减少芯片尺寸及功率消耗,在所有搜索层中使用同一个基本的搜索单元 (BSU)。另外,通过对数据流的有效控制,使其在高级预测模式下,在获得宏块运动矢量的同时,也获得每个宏块中的4个88子块的运动矢量。实验结果表明,这种结构采用较少的门电路,有效降低了功率消耗,并且实现了与全搜索块匹配算法(FSBMA)相似的编码效果,可广泛应用于无线视频通信所需的低功率视频编码器中。 相似文献
14.
15.
Biorthogonal discrete wavelet transform (BDWT) has gained general acceptance as an image processing tool. For example, the
JPEG2000 standard is completely based on the BDWT. In BDWT, the scaling (low-pass) and wavelet (high-pass) filters are symmetric
and linear phase. In this work we show that by using a specific sign modulator the BDWT filter bank can be realized by only
two biorthogonal filters. The analysis and synthesis parts use the same scaling and wavelet filters, which simplifies especially
VLSI designs of the biorthogonal DWT/IDWT transceiver units. Utilizing the symmetry of the scaling and the wavelet filters
we introduce a fast convolution algorithm for implementation of the filter modules. In multiplexer–demultiplexer VLSI applications
both functions can be constructed via two running BDWT filters and the sign modulator.
This work was supported by the National Technology Agency of Finland (TEKES). 相似文献
16.
针对Bayer格式阵列的CMOS图像传感器(CIS)片上系统(SoC)中图像信号处理单元(ISP)的研究,提出一种适合VLSI实现的高效颜色插补算法。算法重点重建了缺失的G分量,先进行像素边缘判断,进而结合边缘方向梯度加权计算,使得G分量的重建有效避免了传统方法中易造成边缘变模糊的现象;对于B和R分量的重建,充分利用小范围内已知的像素分量值对其进行线性插补,使得插补后的值更接近真实值。通过对色彩测试标板和自然图像的模拟实验表明,该算法插补后的图像与传统算法相比更清晰、信噪比更高。算法基于VL-SI设计实现,并通过FPGA验证,结果表明,该算法易于片上实现,耗费资源892个LE,最大频率可达142MHz,完全满足实时处理需求。 相似文献
17.
一种高性能的适用于AVS的二维整数逆变换实现结构 总被引:1,自引:0,他引:1
针对AVS视频标准中的整数逆变换,本文提出了一种高性能的硬件实现方案.本方案采用两个一维逆变换核和4个16(16的双口SRAM.通过合理控制SRAM的读写方式,避免了数据的预处理与后处理,流水线的深度也得到减少.在列变换时,改变数据运算次序,从而保证了4个双口SRAM不影响运算速度.处理8(8的数据块,本结构仅需要37个时钟,与传统的实现方案相比,在同等运算速度下,面积节约28%.实验表明该结构适用于采用AVS标准的HDTV编解码器. 相似文献