首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 66 毫秒
1.
面向按序执行处理器开展预执行机制的设计空间探索,并对预执行机制的优化效果随 Cache 容量和访存延时的变化趋势进行了量化分析。实验结果表明,对于按序执行处理器,保存并复用预执行期间的有效结果和在预执行访存指令之间进行数据传递都能够有效地提升处理器性能,前者还能够有效地降低能耗开销。将两者相结合使用,在平均情况下将基础处理器的性能提升 24. 07% ,而能耗仅增加 4. 93% 。进一步发现,在 Cache 容量较大的情况下,预执行仍然能够带来较大幅度的性能提升。并且,随着访存延时的增加,预执行在提高按序执行处理器性能和能效性方面的优势都将更加显著。  相似文献   

2.
传统数据预取技术在处理结构复杂的非规则数据应用程序时,其有效性明显下降.为解决该问题,基于程序运行时的数据访问阶段性特征,提出一种面向非规则数据的阶段预取策略,研究应用程序的访存规律和预取调度机制.该策略通过在线剖析应用程序的访存行为,识别出数据访问性能指标表现稳定的数据访问阶段和具有特定访存行为特征的预取阶段,实现在数据访问阶段内依据预取阶段的访存规律动态调整预取操作.实验结果表明,与传统的基于访存流模型的数据预取技术相比较,阶段预取策略能够减少无用预取,更加有效地改善非规则数据应用程序性能.  相似文献   

3.
本文用分片线性元离散椭圆型问题.用预处理共轭梯度法求解有限元方程。逐层分离节点,构造了一类代数多级网格预处理器。预处理后的矩阵的条件数为0(m+1)2),其中(m+1)为多级网格的级数。  相似文献   

4.
提出了一种快速分层的深度预测试方法.通过结合Z_max和Z_min算法,从像素块和像素点两个单位层次,快速地预剔除了无需绘制的像素点,避免了诸如深度值、颜色值和纹理值的读写等针对像素点的绘制操作,降低了渲染场景所需的时间.合理的共享像素块缓存(TileZcache)的设计,有效地提高了命中率,进一步减少了预测试的时间.同时提出的动态更新像素块的方法,以更小的硬件代价,提高了深度预测试的效率.仿真结果表明,对于随机测试的绘制场景,这种快速分层的深度预测试方法,使得每帧绘制时间减少了12.5%~25.6%,访存的带宽节省与每个像素点的存储面积比最大增加了43.8%,适用于嵌入式3D的渲染引擎中.  相似文献   

5.
一个面向移动设备的可编程顶点处理器的设计   总被引:1,自引:0,他引:1  
为了取代传统的功能单一、电路复杂的固定功能的几何单元电路,设计了一个高性能的面向移动设备的可编程顶点处理器(VPU).该处理器采用了定点的4路单指令多数据(SIMD)的运算结构和具备数据旁路功能的流水线结构,并具有一个高精度的特殊函数求值单元.这些结构加快了处理器的运算速度,并有效减少了电路面积.该处理器已经在FPGA平台上实现.实验结果表明,该处理器能够完成几何部分的计算功能,并且允许用户编程实现自定义的变换模型和光照模型,以实现各种特殊效果.  相似文献   

6.
异步CORDIC处理器设计与FPGA原型验证   总被引:1,自引:0,他引:1  
提出了用同步电路设计工具和同步FPGA进行设计和验证异步电路原型的方法,设计并验证了一款异步坐标旋转数字处理器(CORDIC).首先设计出同步CORDIC电路,并得到关键路径延时数据,然后采用和同步类似的数据通路,用组合电路设计的异步握手控制单元取代同步电路的时钟,利用FPGA的内部进位链来匹配数据通路的延时.整个电路全部采用Xilinx公司的FPGA设计工具 ISE7.1进行设计和验证,布局布线后的仿真结果表明异步CORDIC处理器工作正确,利用同步电路设计工具,可以快速验证异步电路原型,缩短异步电路的开发周期.  相似文献   

7.
电子设计自动化技术正成为电子系统设计的主流。本文基于可编程逻辑器件FPGA,利用硬件描述语言VHDL设计实现了一个简易中央处理器,为今后的进一步开发打下了基础。  相似文献   

8.
延时估计偏差对多项式预失真的影响   总被引:1,自引:0,他引:1  
延时估计偏差通常会严重影响射频(RF)功率放大器预失真技术的性能.通过对预失真技术中延时估计偏差的理论分析,发现若要保证存在延时估计偏差时预失真器仍能实现放大器的线性化,则设计的预失真器应是理论上理想预失真器的一个延时版本;并提出一种记忆多项式模型用于放大器的预失真.仿真结果表明,采用记忆多项式模型比一般多项式模型对延时估计偏差有更强的鲁棒性.  相似文献   

9.
面向Cell宽带引擎架构的异构多核访存技术   总被引:3,自引:1,他引:3  
针对Cell宽带引擎架构(CBEA)多核高性能处理器要求软件显式地对分层存储结构进行管理,带来架构的可编程性及性能等问题,提出了一种基于CBEA的异构多核访存技术.将CBEA访存分为批量访存和按需访存;通过合理部署数据缓冲区来减小批量访存计算中的片内访存开销,利用支持粗粒度访问的软件管理cache及数据预取来降低按需访存的片外访存开销;以访存接口库的方式来改善软件的可编程性.实验结果表明,所提技术的访存接口库在批量访存方式下的性能比ALF和CellSs提高了30%~50%,按需访存中软件管理cache性能比CBE软件开发工具包提高了20%~30%,4路数据预取访存比单路缓存的性能提高约50%.  相似文献   

10.
IEEE 802.11p协议是针对车载环境应用制定的物理层(physical Layer,PHY)与媒体接入控制层(media ac-cess control,MAC)标准。作为智能交通系统的一部分,该协议能极大增加车辆与外界沟通的通讯能力。通过研究802.11p协议和802.11a协议的异同点,在802.11a的基础上给出了采用DSP(digital signal processor)进行802.11p物理层的OFDM(orthogonal frequency division multiplexing)基带处理的设计与实现方案,并给出了基于经典SC算法的接收端保持同步的DSP处理方法。经过仿真及DSP片上系统验证,测试结果表明,设计达到了预期效果。  相似文献   

11.
警察的执法困境说明我国社会的荣辱观念发生错位、警察执法脱离群众路线、警察自身装备和维权意识淡薄以及警察执法形象被内部违法犯罪行为破坏.我国应在法律上规定袭警行为,对挑战警察执法权威的行为予以严厉打击.  相似文献   

12.
关节间隙对机器人末端执行器位姿误差的影响   总被引:6,自引:0,他引:6  
影响机器人末端执行器位姿的因素很多,其中关节间隙的影响历来为人们所关注。本文讨论了关节间隙对机器人末端执行器位姿误差的影响,推导出了由关节间隙引起的机器人末端执行器位姿误差的精确计算公式,且给出了算例,本文的工作为提高机器人的工作精度及有效地控制机器人,提供了理论依据。  相似文献   

13.
本文针对数据采集系统中超限报警报表设计问题进行了探讨,其中着重讨论了多路快速信号数据采集系统的超限报警报表设计问题,并提出了几种具体的设计方案.而后通过实例阐述一个多路快速信号数据采集系统超限报警报表的硬件和软件设计过程.  相似文献   

14.
入世后中国百货公司实施服装买手机制探讨   总被引:3,自引:0,他引:3  
分析了目前我国百货公司服装零售现状,指出“引厂进店”模式使百货公司市场竞争力下降,不利于整个服装业的健康成长;在此基础上,介绍了百货公司服装买手机制,论述了入世后百货公司实施服装买手机制的意义:是我国服装零售业态发展的需要,是提高百货商店竞争力的需要。最后,提出了实施服装买手机制的几点建议。  相似文献   

15.
研究在共享内存式计算机架构下,基于OpenMP及矢量算术逻辑单元(VALU)硬件加速的表面积分方程矩量法的混合并行求解技术. 讨论了矩量法并行程序设计中的关键问题,并分析了影响并行计算的主要因素. 针对一些典型散射目标,给出了由混合并行程序得到的雷达散射截面数值结果. 通过对计算数据的对比分析,指出负载平衡及内存读取连续性是影响混合并行效率的关键问题所在.   相似文献   

16.
介绍了一种实现导气式武器自动机反馈控制的技术,采用单片机组成了一套自动机后坐能量的闭环控制系统,建立了导气装置调节量与后坐能量关系的控制模型。实弹射击实验结果证明后坐能量可以自动稳定在预先拟定的数值上。  相似文献   

17.
本文通过对未经训练和已经充分训练的量Ni—49.7 at%Ti合金在相变过程中电阻,内耗,模量以及相变应变的原位测量和对比,证实了该合金经充分训练可由I/C(无公度/公度)转变提供完全可逆的双程形状记忆效应.研究了该合金在双程形状记忆训练过程电阻及相变阻力的变化.结果表明,双程形状记忆效应的训练过程,实际上就是在温度及应力的复合作用下,I/C相变逐渐被诱导、总的相变阻力下降并趋于稳定的过程.在训练过程中,高相变阻力的过程逐渐被抑止,而低相变阻力的过程逐渐发展并成为主要过程;因此使相变过程变得完全可逆,正反相变均按阻力最小的惯习面进行,试样即具有双程形状记忆效应.  相似文献   

18.
分布数据采集系统扩展法及评估原则   总被引:6,自引:2,他引:4  
提出一种适用于分布式数据检控系统的数据采集通道扩展方法及其性能评价原则.它能几十倍甚至几百倍地增加数据采集点,在扫描频率允许的情况下,能增强抖动抗干扰能力,又能大幅度地提高整个数据检控系统的信价比.该系统尤其适用于热工和其他“慢变化过程”动态参数的检测.  相似文献   

19.
分析了模糊诊断原理与联想记忆模型的相似性,提出了一种递归的模糊关系矩阵自动获取及自学习方法,并成功就用于空气压缩机组的故障诊断,取得了满意的效果。  相似文献   

20.
对综采设备失效的模式、规律、原因及影响成度进行了分析,提出主动预防维修的新维修方式。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号