共查询到19条相似文献,搜索用时 62 毫秒
1.
2.
提出了一种新的两维全搜索运动估计VLSI结构。该结构基于两维脉动阵列,能够完全实现两维数据重用,减少了对外部存储器数据量的访问,具有100%的硬件效率和高吞吐率。该结构也可以很容易地应用于不同块尺寸、不同的搜索范围的全搜索块匹配运动估计,具有通用性。 相似文献
3.
4.
本文提出了一个新的序列图象运动矢量估计算法:空时相关多分辨运动估计算法,充分利用运动矢量场在空域相邻块,时域物体运动和分层父子块之间的相关性降低运动搜索范围。达到比三步法还要少的搜索次数,运动补偿增益和运动矢量熵均比三步法有明显改善。 相似文献
5.
本文提出了一种用于H.264/AVC的D级数据重用整数运动估计VLSI结构.提出的结构是在一种固定块尺寸运动估计VLSI结构基础上,利用交叉网络实现变块尺寸的计算,使用多bank的存储器组织方式,使片上存储器的读写规则简单,易于处理不同搜索范围和不同尺寸的视频的运动估计.提出的运动估计结构用Verilog HDL描述,使用HJTC 0.18μm工艺,用Synopsys DC做了逻辑综合.相比现有结构,该结构由于增加片上存储器,因此数据重用率高,大大降低了存储带宽需求;另外数据吞吐率高,能够满足高性能视频编码需求. 相似文献
6.
7.
8.
基于运动矢量插值的运动补偿算法 总被引:3,自引:1,他引:3
本文首先研究了相关性约束运动估值算法,然后提出了基于运动矢量插值的运动估值算法,实验表明新算法的预测性能明显一比传统块匹配运动估值算法(BMA)好,而且预测图象的主观质量得到显著改善。 相似文献
9.
一种低资源消耗的运动估计VLSI实现算法 总被引:1,自引:1,他引:0
现有的VLSI(verylarge scale integration)视频编码芯片多使用全搜索运动估计(ME)方法,且没有搜索中心偏移(CB)的并行实现方法。本文提出一种适合VLSI的H.264、AVS CB并行搜索方案,减少搜索点数量,降低逻辑资源的消耗,并且使用预测高概率区域的方法,保证ME精度。实验表明,本方法具备较好的率失真性能。在现场可编程门阵列(FPGA)平台上实现了本算法,逻辑综合的数据表明,硬件资源消耗降低了64%。本算法可应用于标清和高清电视(HDTV,hign-definition television)视频编码器。 相似文献
10.
本文针对块匹配运动估计快速搜索算法的要求,设计了一种算法可编程的运动估计及运动补偿协处理器。该协处理器设计采用软硬件协同处理结构。灵活的指令集和高效的硬件并行执行单元相结合,使得该协处理器具备可编程处理器结构及树形结构运动估计VLSI结构的优点,可以兼顾运动估计算法高处理效率和灵活性的要求。设计的协处理器不拘泥于某种快速搜索算法,通过改变内部程序代码,可以实现多种快速运动估计算法,包括TSS、DS、HEXBS、MVFAST、EPZS等,同时具备很强的可扩展性。与同类设计相比,本设计具有高效、灵活、算法可配置的特点,同时设计消耗的硬件资源也大幅减小。 相似文献
11.
文中给出了一种用于实现多分辨率运动估算算法后阶段任务的改进的树结构。在一个简单的RISC类型核控制下,它能够完成整个运动估值过程中除粗分辨率精度运动矢量搜索之外的所有后阶段子任务。包括运动矢量优化(搜索)在内的多任务是通过二叉树最底层叶节点上的多功能处理单元和可以拆分成子树的加法树来实现的。此外,运算单元寄存器堆的设计使能在二维方向上复用图像数据,完全避免了同一类数据从存储器中重复读取,从而实现了最小的存储器访问带宽,并有助于减小存储功耗。 相似文献
12.
13.
运动估计中一种基于分级搜索的快速菱形算法 总被引:1,自引:1,他引:0
文章在分析菱形算法的基础上,设计了一种区分出运动剧烈和缓慢的视频帧分析方法.在此基础上针对大部分的运动缓慢帧提出了一种新的搜索模板。实验结果表明,该方法同菱形搜索算法相比.可在基本不降低搜索效果的情况下极大的提高搜索效率。 相似文献
14.
Yi-Hau Chen Tung-Chien Chen Shao-Yi Chien Yu-Wen Huang Liang-Gee Chen 《Journal of Signal Processing Systems》2008,53(3):335-347
The H.264/AVC Fractional Motion Estimation (FME) with rate-distortion constrained mode decision can improve the rate-distortion
efficiency by 2–6 dB in peak signal-to-noise ratio. However, it comes with considerable computation complexity. Acceleration
by dedicated hardware is a must for real-time applications. The main difficulty for FME hardware implementation is parallel
processing under the constraint of the sequential flow and data dependency. We analyze seven inter-correlative loops extracted
from FME procedure and provide decomposing methodologies to obtain efficient projection in hardware implementation. Two techniques,
4×4 block decomposition and efficiently vertical scheduling, are proposed to reuse data among the variable block size and
to improve the hardware utilization. Besides, advanced architectures are designed to efficiently integrate the 6-taps 2D finite
impulse response, residue generation, and 4×4 Hadamard transform into a fully pipelined architecture. This design is finally
implemented and integrated into an H.264/AVC single chip encoder that supports realtime encoding of 720×480 30fps video with
four reference frames at 81 MHz operation frequency with 405 K logic gates (41.9% area of the encoder).
相似文献
Liang-Gee ChenEmail: |
15.
16.
提出了一种新的多级运动估值器的结构 ,它支持低比特视频编码器的高级预测模式 ,如H.2 63和 MPEG- 4。该 VLSI结构的所有级别中共用一个基本的搜索单元 ( BSU) ,减小了芯片尺寸。另外 ,由于它为计算 8× 8块的绝对误差和 SAD提供了一种对存储器数据流的控制电路 ,因此 ,对于高级预测模式 ,可同时获得 1个宏块运动矢量和每个宏块中的 4个子块运动矢量。这种尺寸较小的运动估值电路可以获得与全搜索块匹配算法 ( FSBMA)相似的编码效果 相似文献
17.
18.
在分析了块匹配运动估值模型的基础上,指同处于块中央的象素眯在块匹配时作用 小,最了一种减少块匹配运算象素的方法。不仅如此,提出的方法可与任一基于减少匹配次数的快速算法相结合,从而得到各种事型的块匹配快速算法。最后试验结果,提出了的方法是有效的。 相似文献