首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
光学互连     
芯片的集成度增大必将导致大规模集成电路和系统在传输上的困难,电磁性与平面分布引起严重的信号相互干扰和损耗,这样必然影响到数据的运行速度,限制数据的存储.本文通过同用于高速运行的电子系统的常规电互连的比较,介绍了光学互连的特点以及在不同水平、不同方面的应用.光学互连最有价值的应用在于对时钟分布问题的解决,即引导单一信号到达芯片的不同部位.而更为复杂的问题是对于数据传输问题的解决,即提高数据传输的速度和并行性能.  相似文献   

2.
针对交错网格下的SIMPLE数值算法实施了分区并行计算方法,在小型局域网下实现了流动和传热问题的并行数值计算.对两个经典的流动和传热问题的数值模拟实验表明,所建立的并行计算环境和分区并行算法能够得到正确的和收敛的数值结果.但与串行计算结果相比,并行计算误差明显大于串行计算误差.对并行算法做出的性能分析表明,所给出的并行算法得到了明显的加速效率.随着计算规模的增大,加速比和并行效率提高更显著.  相似文献   

3.
为了能够使大型机和高性能集群得到更好的加速比和并行计算效率,在深入研究并行和FDTD-PIC算法的基础上,在CHIPIC软件平台上开发了Linux系统下的大型全三维可并行电磁PIC代码。分别以一个磁绝缘线振荡器、回旋管和相对论速调管为例进行测试和计算,得到了3.70,6.72和6.00的加速比,验证了在同等的进程数下,高性能集群能够得到比PC机群高得多的加速比和计算效率,能够更好地利用计算资源。  相似文献   

4.
梁国栋  徐迈 《发光学报》1996,17(3):272-275
光学互连与电互连相比,具有并行处理、传输速度快、信息容量大、空间频带宽、串音小和能量损耗低等优点,因此在光计算和信息处理领域中成为越来越吸引人的课题[1~4].在光信息处理中,光互连在实行多种函数及变换过程中具有重要的地位[5].在数字光计算中,光互连可实行多种算法和构造,其中自由空间规则光互连如全混洗(perfect shuffle)光互连、交叉(crossover)光互连及蝶(butterfly)光互连已得到广泛研究和应用[6~8].  相似文献   

5.
构建了用于高性能并行计算的PC机群环境,将基于此机群环境的三维并行时域有限差分算法用于光子晶体薄板W3波导传输特性研究.性能分析表明:对于大规模问题,机群并行FDTD算法能够获得较理想的加速比.具体计算了W3波导的透射率频谱和光场分布.结果表明:光子晶体薄板W3波导能够实现光的三维约束,其导带中存在着微小禁带(mini-gap).  相似文献   

6.
基于Tahoe框架的某夹具并行计算   总被引:1,自引:0,他引:1  
在开源软件Tahoe框架基础上,结合有限元前后处理程序MSC.Patran及Tecplot,对某复杂夹具进行建模.通过区域分解、编制接口和采用PHG中提供的PCG(preconditioned conjugate gradient,预处理共轭梯度法)迭代解法成功实现262×104自由度模型的串、并行计算.结果表明,并行计算收敛速度更快,4进程并行计算时间不到串行计算时间的1/4.通过与商用程序MSC.Nastran比较,验证计算结果的正确性.利用大型并行计算机对该模型并行计算性能进行研究,获得最高32进程的并行计算加速比.研究表明,改进后的Tahoe计算框架对于开展大规模自由度下的结构并行计算分析研究是可行的,并且随计算节点增加,并行计算过程基本呈线性加速.  相似文献   

7.
研究了闪光X射线辐射照像蒙特卡罗程序(FXRMC)在MPI平台下的并行计算实现,给出了实现过程中并行随机数的产生方法。对并行程序的测试结果表明:并行程序与串行程序结果一致,加速比比较理想,呈线性增长,并行效率在16个处理器上可达80%以上。算例的结果说明了并行化可有效地解决程序计算散射技术性能时的耗时问题,从而有效化解FXRMC耗时和大规模计算的困难,提高了FXRMC程序的计算规模和计算速度,达到了研究要求。 (Institute of Fluid Physics, CAEP, P. O. Box 919-105, Mianyang 621900, China)  相似文献   

8.
激波与火焰面相互作用数值模拟的GPU加速   总被引:1,自引:0,他引:1  
蒋华  董刚  陈霄 《计算物理》2016,33(1):23-29
为考察计算机图形处理器(GPU)在计算流体力学中的计算能力,采用基于CPU/GPU异构并行模式的方法对激波与火焰界面相互作用的典型可压缩反应流进行数值模拟,优化并行方案,考察不同网格精度对计算结果和计算加速性能的影响.结果表明,和传统的基于信息传递的MPI 8线程并行计算相比,GPU并行模拟结果与MPI并行模拟结果相同;两种计算方法的计算时间均随网格数量的增加呈线性增长趋势,但GPU的计算时间比MPI明显降低.当网格数量较小时(1.6×104),GPU计算得到的单个时间步长平均时间的加速比为8.6;随着网格数量的增加,GPU的加速比有所下降,但对较大规模的网格数量(4.2×106),GPU的加速比仍可达到5.9.基于GPU的异构并行加速算法为可压缩反应流的高分辨率大规模计算提供了较好的解决途径.  相似文献   

9.
光互连网络中的光学比较交换实现方法   总被引:1,自引:1,他引:0  
罗风光  曹明翠 《光子学报》1994,23(3):206-211
本文提出了一种全混洗交换光互连网络中对两个数字光信号进行比较交换的新方法。用液晶光调制器和光导开关构成数字光信号交换控制单元,自动完成两列数字光信号大小的并行比较和交换  相似文献   

10.
张若兴  侯士敏  丑强 《计算物理》2015,32(6):631-638
为了解决基于第一性原理分析计算大尺度量子输运体系时遇到的耗时长久问题,挖掘密度泛函理论与非平衡格林函数相结合方法(DFT+NEGF方法)在自洽迭代过程中的计算热点,就计算电子密度矩阵时的能量点积分和计算格林函数时的矩阵求逆/乘法运算提出MPI/Open MP并行计算方案.能量点积分采用MPI多进程并行方案,在数据初始化时需要将稀疏矩阵和积分能量点依照轮询调度算法分配给各进程.矩阵求逆/乘法的并行化既可调用ScaLAPACK子程序实现又可调用IntelMKL数学库中的OpenMP多线程加速函数实现.由于不同能量点计算的独立性,能量点积分采用的MPI并行计算获得近乎线性的加速比曲线.由于Open MP多线程并行采用的是基于共享内存的数据交换机制以及线程间切换通信开销小,矩阵求逆/乘法运算的OpenMP并行实现在计算效率上要优于而在程序的可扩展性上要劣于MPI多进程并行实现.  相似文献   

11.
二维光学神经网络自由空间互连结构设计   总被引:1,自引:0,他引:1  
高胜泉  杨建文 《光子学报》1996,25(6):492-495
本文分析了以透镜阵列元件建立空间互连通道的光学神经网络中神经元数的理论极限.为了提高网络中的神经元数,我们提出了一种并行结构设计,该结构克服了小透镜成象中的离轴象散的影响,提高了系统的光能利用效率,同时降低了系统中的对位精度误差,提高了互连运算精度.  相似文献   

12.
孙玉强  李银银  顾玉宛 《应用声学》2017,25(3):195-196, 230
并行问题和最短路径问题已成为一个热点研究课题,传统的最短路径算法已不能满足数据爆炸式增长的处理需求,尤其当网络规模很大时,所需的计算时间和存储空间也大大的增加;MapReduce模型的出现,带来了一种新的解决方法来解决最短路径;GPU具有强大的并行计算能力和存储带宽,与CPU相比具有明显的优势;通过研究MapReduce模型和GPU执行过程的分析,指出单独基于MapReduce模型的最短路径并行方法存在的问题,降低了系统的性能;论文的创新点是结合MapReduce和GPU形成双并行模型,并行预处理数据,针对最短路径中的数据传输和同步开销,增加数据动态处理器;最后实验从并行算法的性能评价指标平均加速比进行比较,结果表明,双重并行环境下的最短路径的计算,提高了加速比。  相似文献   

13.
定常粒子输运蒙特卡罗并行计算是成功的,因为粒子游动是独立的,可以把模拟的粒子数等分到每个处理器去.然而,对非定常问题,由于每个时间步涉及散射源和几何网格的通讯,它严重的制约了并行规模,导致并行不可扩展.研究了两种算法,采用自适应分配处理器,提高了加速比和处理器的利用率;采用蒙特卡罗分层抽样大大降低了处理器之间散射源的通讯量,并行可扩展性显著改善,取得了理想的加速比.  相似文献   

14.
实现了基于计算统一设备架构(CUDA)的直接模拟Monte Carlo(DSMC)并行算法,改进了原有多图形处理器(GPU)数据之间传输并行算法,数值模拟计算二维Couette流和二维顶盖驱动方腔流,定量比较了CPU、单GPU和多GPU并行计算的结果和计算时间.结果表明单GPU并行计算相对CPU计算的加速效果可以达到10~30倍,双GPU并行计算加速效果可以达到40~60倍,多GPU并行计算的加速效率接近100%,且计算精度能够得到良好保证.  相似文献   

15.
何晓清  周革 《光子学报》1996,25(8):703-706
在并行多处理机系统中应用光纤互连网络完成处理单元之间的数据交换,可以极大地提高系统中数据通信的速率、带宽、抗干扰性和准确可靠性.本文详细阐述了并行多处理机系统的体系结构、实现方法、性能分析和实验结果.  相似文献   

16.
针对二维柱几何非定常中子输运方程的Sn-间断有限元方法,提出基于格式的界面预估校正并行算法.数值算例表明,该并行算法在精度与并行度等诸方面均具有良好的性质,与已有的基于隐式格式的并行扫描算法相比,对于二维中子输运大规模计算问题,并行计算效率较高,并行加速比可增加-倍以上,且可保持原隐式格式的计算精度.  相似文献   

17.
张义招  包芸 《物理学报》2015,64(15):154702-154702
Ra数Rayleigh-Bénard热对流的湍流特性研究是当前国际上的一个热门研究课题, DNS模拟计算是研究该课题的重要手段之一. 当计算规模增大而网格数巨大时计算工作难以实现, 高Ra湍流热对流的数值模拟研究面临重大挑战. 本文创建了大规模高效并行计算的三维湍流热对流直接求解方法. 采用FFT变换解耦压力泊松方程, 将其变换成沿z方向上的块三对角方程组, 并利用块三对角方程的MPI与OpenMP联立的大规模高效并行近似解求解方案, 创建了可以高效并行计算的热对流直接求解方法. 通过对该方法并行效率的验证计算, 证明新的直接求解并行计算方法具有很好的并行效率和计算时效. 三维窄方腔热对流的计算结果表明, 本文方法计算的三维热对流特性是合理的. 本文创建的可大规模高效并行计算的三维湍流热对流直接求解方法, 也很可能是关于计算流体力学不可压NS方程大规模高效并行计算在特殊情况中计算技术上的一个突破.  相似文献   

18.
为解决串行时域多分辨率(MRTD)散射模型运行时间长和内存消耗大的问题,基于消息传递接口(MPI)技术设计了一种非球形气溶胶散射并行计算模型。介绍了MRTD散射模型的基本框架和2种并行数据通信方案,并基于MPI重复非阻塞通信技术实现了MRTD散射模型的并行化设计;搭建了网络并行计算平台,实现了模型的并行化计算。将MRTD散射模型与Mie散射模型、T矩阵法进行了对比,验证了并行MRTD散射模型的计算准确性。结果表明,MRTD模型可较准确地模拟非球形粒子散射特性,并行计算技术可显著提高计算效率;电磁场分量同时交换的并行设计方案的计算效率略高于仅交换磁场分量的方案;通过增加中央处理器核数,程序的并行加速比随之增大,但单核运行效率却略有降低。随着粒子尺度参数的增大,单核计算效率随之增加,复折射率的改变并不会显著影响并行计算效率。  相似文献   

19.
为解决串行时域多分辨率(MRTD)散射模型运行时间长和内存消耗大的问题,基于消息传递接口(MPI)技术设计了一种非球形气溶胶散射并行计算模型。介绍了MRTD散射模型的基本框架和2种并行数据通信方案,并基于MPI重复非阻塞通信技术实现了MRTD散射模型的并行化设计;搭建了网络并行计算平台,实现了模型的并行化计算。将MRTD散射模型与Mie散射模型、T矩阵法进行了对比,验证了并行MRTD散射模型的计算准确性。结果表明,MRTD模型可较准确地模拟非球形粒子散射特性,并行计算技术可显著提高计算效率;电磁场分量同时交换的并行设计方案的计算效率略高于仅交换磁场分量的方案;通过增加中央处理器核数,程序的并行加速比随之增大,但单核运行效率却略有降低。随着粒子尺度参数的增大,单核计算效率随之增加,复折射率的改变并不会显著影响并行计算效率。  相似文献   

20.
叙述了近年来在天津大学研究及开发光互连网络的情况。这些研究围绕着解决信号传输中的延迟和通信带宽,开展的研究工作有:完成包括64个处理器的光电混合处理器阵列系统;giga—bit/s机群系统光互连链路;在链路中采用时分复用技术(TDM),实现了“虚拟并行传输”;在链路中设计了硬件路由功能,并组成光环网;在网络系统中实现波长路由,并建立了波长路由双环网,采用该技术可以避免路由延迟;在光互连网络中应用了MEMS光开关,实现了星型一环形二级结构;用同步光传输技术实现了多通道数据传输卡。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号