期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

王辉王长山《中国集成电路》2011,20(3):27-30,65

随着片上网络IP核结点的增加,芯片面积受限的问题日益突出,利用39拓扑,用体积换取芯片面积是一种可行的方案,这种结构使各个结点的物理距离更近,从而充分地利用了空间资源,可以有效地减少芯片面积.提出一种3D Octagon双环拓扑结构,在均衡负载模式和对称随机负载模式下分析了其网络延迟和吞吐率.结果表明,3D Octagon双环是一种性能良好、可行性高的片上网络拓扑结构. 相似文献

2.

层次化片上网络结构的簇生成算法 总被引：2，自引：1，他引：2

下载免费PDF全文

王宏伟陆俊林佟冬程旭《电子学报》2007,35(5):916-920

半导体工艺的发展及嵌入式电子产品复杂度的不断增长,系统芯片互连结构的吞吐量、功耗、信号完整性、延迟以及时钟同步等问题更加复杂.基于总线的片上通信结构不足以提供良好的通信能力,出现了以片上网络为核心的通信结构.本文提出了层次化片上网络设计中,根据实现工艺和应用需求,进行层次划分的簇生成算法.实验表明,通过使用该算法,能够有效的分配系统芯片的内部通信,提高系统性能,降低硬件实现开销,同时满足一定的服务质量需求. 相似文献

3.

片上网络拓扑结构的研究 总被引：3，自引：1，他引：3

张恒龙顾华玺王长山《中国集成电路》2007,16(11):42-46,59

随着SoC体系结构设计复杂度的提高,传统的总线结构已成为IP核之间通信的瓶颈。为了满足大规模集成电路发展对扩展性、能耗、面积、时钟异步、重用性、QoS等方面的需求,新的设计方法—片上网络(NoC)应运而生,它是对原有设计模式的一次革新。本文分析了NoC的技术特点以及在该领域中的关键技术,详细地对NoC中常见的拓扑结构进行了分类研究,并指出了每种拓扑结构中的优点与不足;然后通过分析每种拓扑结构的性能参数,从而对其性能进行综合的比较。相似文献

4.

一种片上互连网络的参数化蝶形网络拓扑结构的方法

游和艺葛青《中国集成电路》2023,(9):23-29

本文实现了一种片上互连网络的参数化蝶形拓扑结构的生成方式。蝶形网络拓扑结构的电路实现上,相比较全连接网络具有一定时序优势。通过对网络具体的研究,本文实现了8输入8输出、16输入16输出和32输入32输出的蝶形网络等任意2的幂次方输入的蝶形网络的参数化结构。提出了一种新的参数化蝶形网络拓扑结构。相似文献

5.

三维片上网络拓扑研究 总被引：2，自引：0，他引：2

陈亦欧胡剑浩凌翔《电信科学》2009,25(4)

三维片上网络是集成电路领域的新技术,用于解决目前片上系统集成度越来越高所面临的通信瓶颈.本文介绍了当前三维片上网络的拓扑和相关技术,提出了三种新型的基于De Bruijn图的拓扑,并对各种拓扑的性能参数进行了比较. 相似文献

6.

一种分层结构的片上网络路由设计

姚放吾翟欣虎《微电子学与计算机》2009,26(11)

随着同一芯片中处理器数日的不断增加,层次化网络结构将成为片上网络(NoC)拓扑研究的热点.针对典型的NoC不规则分层拓扑结构,设计了一套新的免死锁混合路由算法以及新的节点编址方式.同时提出了一种新的交换节点设计构想,并给出了一种有效的拥塞控制策略.仿真结果表明,当网络中数据流量变大时分层网络比传统二维网络具有更小的传输时延以及更大的吞吐量. 相似文献

7.

基于统计时分复用技术的三维片上网络

王佳文李丽潘红兵李伟张荣《电子与信息学报》2012,34(10):2501-2507

在片上网络(Network on Chip, NoC)系统中,本地子系统通常基于总线结构,而全局通信则由基于包交换的网络构成。然而,由于总线和网络之间通讯机制的差异,当本地子系统内各核访问全局资源的时候,系统整体性能将下降。在3D NoC中,由于全局网络规模的扩大,该问题将越发显著。对此,该文提出一种基于统计时分复用(Statistical Time Division Multiplex, STDM)技术的3D NoC架构。该架构首先在本地子系统引入STMD控制单元,然后在网络接口设计中增加了计数及等待机制,并对路由节点针对STDM技术进行了优化设计,以增强对STDM的支持,减小总线、网络间的差异。同时,该文还充分利用STDM帧的特点,设计了一种新的数据包格式,以进一步降低全局通信的网络负荷。为证明新方案的高效,该文采用SystemC语言进行系统级建模,仿真结果表明：该方案在降低网络负荷、减小通信延时方面有着显著效果。最佳情况下,两者可以分别降低为传统方案的45%和20.5%。而实际应用中,尤其对于通信密集型应用而言,该方法的改善效果也同样明显。相似文献

8.

一种基于BFT型拓扑结构片上网络低费用测试方法

尤志强彭福慧邝继顺张大方《电子学报》2011,39(11):2663-2669

随着集成电路制作工艺的进步,多核与众核系统是片上系统的发展趋势.传统的二维网格(2D-mesh)型拓扑结构通信效率低、功耗高和时延长等缺点变得越来越明显.本文首先分析对比了几种常用拓扑结构在多核与众核情况下的性能,进而采用布线复杂度较低、性能较好的蝴蝶型胖树(BFT)拓扑结构来解决片上系统的设计和测试问题.随后,本文针... 相似文献

9.

一种新颖的面向数据流量特征的片上网络设计

胡森森陈皇吉《电讯技术》2018,58(5)

片上网络中处理器核之间、处理器与缓存之间通信具有不同的数据流量特征,因此需要不同的网络带宽和网络拓扑结构。针对上述两种通信流量的差异,设计了一种异构非对称双片上网络,分别用于处理器核之间和处理器与缓存之间的通信,并且每个网络都针对占主导地位的数据流量类型进行了优化。实验结果表明,与传统的单片上网络和同构的双片上网络相比,该设计不仅具有网络延迟低、网络带宽高的优点,而且提升了系统的整体性能。相似文献

10.

片上网络流量模型的研究与实现

彭元喜陈诚《微电子学与计算机》2011,28(1)

分析了三种具有代表性的流量模型:均匀分布、泊松分布、自相似流量模型,并实现了基于这些模型的流量生成器.模拟结果与预期结果符合,目前流量生成器已经应用到实际模拟平台之中. 相似文献

11.

基于拓扑划分的片上网络快速映射算法 总被引：1，自引：0，他引：1

邓植顾华玺杨银堂李慧《电子与信息学报》2011,33(12):3028-3034

该文针对片上网络建立了以能耗和流量均衡为优化目标的映射模型,提出一种基于拓扑划分的快速映射算法(TPBMAP)。该算法不仅考虑芯片的布局特性从而产生规整的拓扑,还采用虚拟IP核技术修正通信核图以完成IP核和网络节点数不等的映射;通过引入以流量均衡为目标的优化模型同时将通信量大的IP核映射到拓扑边缘区域,有效地降低了网络中心的流量;采用迭代的拓扑划分方法以及将通信量大的IP核映射到网络相邻位置,可快速完成低能耗映射。仿真结果表明,相比现有算法,该文提出的算法在映射速度、全网能耗以及网络中心流量等方面有较大优势。相似文献

12.

片上网络通信性能分析建模与缓存分配优化算法 总被引：1，自引：0，他引：1

王坚李玉柏蒋勇男《电子与信息学报》2009,31(5):1059-1062

该文建立了一种面向应用设计的片上网络的性能分析模型,并在此基础上提出了片上缓存优化策略和分配算法。在硬件实现平台上的仿真表明,该文建立的片上网络分析模型能很好地分析片上网络通信时延和路由节点各方向的阻塞概率,以此进行片上网络的缓存资源优化,能在同等缓存资源的情况下降低数据通过网络的平均时延,使片上网络的性能得到改善。相似文献

13.

一种片上网络路由测试方法研究

许川佩胡旭《微电子学与计算机》2011,28(7)

对片上网络路由器的结构进行了分析,建立了相应的故障模型.针对此故障模型结合内建自测试,提出了一种基于量子遗传算法的测试矢量传递路径寻优方法.该算法具有收敛速度快,精度高等优点.最后通过对测试故障覆盖率和测试时间进行分析表明这种测试方法具有较高的故障覆盖率、较少的测试时间. 相似文献

14.

SRNoC: A novel high performance Shared-Resource routing scheme for Network-on-Chip

《Microelectronics Journal》2014,45(8):1103-1117

This paper proposes a novel Shared-Resource routing scheme, SRNoC, that not only enhances network transmission performance, but also provides a high efficient load-balance solution for NoC design. The proposed SRNoC scheme expands the NoC design space and provides a novel effective NoC framework. SRNoC scheme mainly consists of the topology and routing algorithm. The proposed topology of SRNoC is based on the Shared-Resource mechanism, in which the routers are divided into groups and each group of routers share a set of specified link resource. Because of the usage of Shared Resource mechanism, SRNoC could effectively distribute the workload uniformly onto the network so as to improve the utilization of the resource and alleviate the network congestion. The proposed routing algorithm is a minimal oblivious routing algorithm. It could improve average latency and saturation load owing to its flexibility and high efficiency. In order to evaluate the load-balance property of the network, we proposed a method to calculate the Φ which represents the characteristic value of load-balance. The smaller the Φ, the better the performance in load-balance. Simulation results show that the average latency and saturation load are dramatically improved by SRNoC both in synthetic traffic patterns and real application traffic trace with negligible hardware overhead. Under the same simulation condition, SRNoC could cut down the total network workload to 48.67% at least. Moreover, SRNoC reduces the value of Φ 45% at least compared with other routing algorithms, which means it achieves better load-balance feature. 相似文献

15.

基于提前分配路径的低时延片上路由器结构 总被引：1，自引：0，他引：1

郑小富顾华玺杨银堂黄忠凡《电子与信息学报》2013,35(2):341-348

该文针对片上网络提出一种基于提前分配路径的低时延片上路由器结构(PAPR)。新路由器采用提前路由计算和提前分配路径来缩短路由器流水线深度。提前路由计算为虚信道提前分配提供了可靠保障,即使在虚信道路径提前分配失败的情况下,也不影响分组在网络中的传输时延。该文提出基于缓存状态的仲裁算法BSTS(Buffer Status)综合考虑当前节点缓存信息和下游节点缓存信息,不但降低了分组等待时延,而且降低了缓存空闲的概率。仿真结果表明,新路由器能明显改善网络的时延和吞吐性能,相比采用滑动迭代轮询仲裁iSLIP(iterative Round-Robin Matching with SLIP(Serial Line Interface Protocal))算法的经典虚信道路由器,网络平均端到端时延降低了24.5%,吞吐率提高了27.5%;与采用轮询迭代 RRM(Round-Robin Matching) 算法的经典虚信道路由器相比,平均端到端时延降低了39.2%,吞吐率提高了47.2%。路由器硬件开销和平均功耗分别增加仅为8.9%,5.9%。相似文献

16.

BiLink: A high performance NoC router architecture using bi-directional link with double data rate

《Integration, the VLSI Journal》2016

This paper presents a novel high performance Network-on-Chip (NoC) router architecture design using a bi-directional link with double data rate (BiLink). Ideally, it can provide as high as 2 times speed-up compared with the conventional NoC router. BiLink utilizes an extra link stage between routers and transmits two flits in one link per cycle using phase pipelining if both routers require to use the current link. To further increase the effective bandwidth, the direction of each link can be configured in every clock cycle to cater for different traffic loads from each side. Therefore, the data rate can be as high as 4 times compared with conventional NoC routers under uneven traffic. Centralized mode control scheme is implemented using a finite state machine (FSM) approach. Cycle-accurate simulations are carried out on both synthetic traffic patterns as well as real application benchmarks. Simulation results show that BiLink can provide as high as 90% and 250% speedup compared with conventional NoC routers for even and uneven traffic, respectively. 2X and 3X gains in throughput are obtained under even and uneven traffic, respectively, when compared with the conventional NoC router for the virtual channel flow control. The BiLink router architecture is synthesized using TSMC 65 nm process technology and it is shown that an area overhead of 28% over state-of-the-art bi-directional NoC is introduced while the critical path is about 9% higher than that of the conventional routers. Despite the overhead in critical path and power consumption, a 47.45% improvement of Energy-Delay-Product (EDP) is achieved by BiLink under high injection rate traffic. 相似文献

17.

An orchestrated NoC prioritization mechanism for heterogeneous CPU-GPU systems

《Integration, the VLSI Journal》2019

In a heterogeneous CPU-GPU multicore system that contains various types of computation units as well as on-chip storage units, the on-chip interconnection network is a critical shared resource responsible for sending coherence and memory traffic. On-chip traffic originated from or designated to different components has different performance and throughput requirements. A naive or un-optimized traffic prioritization mechanism usually results in suboptimal system performance. In this work, we quantify the performance/throughput requirements for both CPU and GPU applications, abstract critical information, and propose a network prioritization mechanism which effectively coordinates the on-chip traffic to improve overall system performance. 相似文献

18.

适用于无线传感器网络的层次化分布式压缩感知

程银波司菁菁候肖兰《电子与信息学报》2017,39(3):539-545

分布式压缩感知(Distributed Compressed Sensing, DCS)是在无线传感器网络(Wireless Sensor Network, WSN)中减少数据传输量、降低能量消耗的有效手段。该文面向分簇WSN,提出层次化分布式压缩感知(Hierarchical Distributed Compressed Sensing, HDCS)。在利用簇内DCS消除簇内时间、空间冗余的基础上,利用簇间DCS消除簇间空间冗余,减少簇头的数据发送量。针对分簇WSN采集信号的结构化稀疏特性,建立块稀疏簇内联合稀疏模型与块稀疏簇间联合稀疏模型,提出HDCS观测方案与层次化联合重构算法。仿真结果表明,与普通DCS相比,HDCS在保证重建信号质量的同时,能够有效减轻簇头的通信负担,并显著降低Sink上的信号重构时间。相似文献

19.

基于内建自测技术的Mesh结构NoC无虚通道容错路由算法 总被引：1，自引：0，他引：1

下载免费PDF全文

姚磊蔡觉平李赞张海林王韶力《电子学报》2012,40(5):983-989

在Zhang's算法绕行思想的基础上,提出了一种2D-Mesh结构片上网络无虚通道容错路由算法,用于解决多故障节点情况下片上网络的无虚通道容错路由问题.算法利用内建自测试机制获取故障区域的位置信息,通过优化绕行策略来均衡故障区域周围链路的负载并减少部分数据的绕行距离.针对8×8的2D-Mesh网络的仿真表明,与Chen's算法相比,在故障区域大小为2×2,网络时延为70 cycles的情况下,随着故障区域位置的变化所提算法可提高1.2%到4.8%的网络注入率.且随着故障区域面积的扩大,所提算法在减少通信时延,提高网络吞吐量方面的作用更为明显. 相似文献