首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 156 毫秒
1.
徐小文  莫则尧 《计算物理》2007,24(4):387-394
对当今求解大型稀疏线性代数方程组最有效的迭代方法之--代数多重网格(AMG)算法的并行计算进行可扩展性能分析.给出一套并行计算可扩展性能分析方法,用于分析和指导并行迭代算法及实现技术的设计与优化并应用于并行AMG算法.分析表明,网格算子的平均模式大小和迭代过程的算法效率分别制约了AMG算法启动阶段和迭代求解阶段并行性能的发挥,成为该类算法急需解决的两个关键问题.  相似文献   

2.
描述了HL-2A等离子体实时平衡重建的GPU并行化算法,主要包括G-S方程的并行化处理、三对角方程求解、网格边界磁通计算以及一系列矩阵相乘的并行加速.并行后,在129×129的网格下完成一次迭代计算需要约575μs.  相似文献   

3.
尹亮  杨超  马石庄 《计算物理》2019,36(1):1-14
旋转球层中热对流运动的数值模拟是地球发电机模型的重要组成部分,对研究地球发电机作用机理具有重要意义.本文设计一个基于国产超级计算平台并行性能良好的地球外核热对流运动并行数值模型.时间积分方案采用与Crank-Nicolson格式和二阶Adams-Bashford公式相结合的近似分解分步法,空间离散基于立方球网格的二阶精度有限体积格式.所得到的两个大规模稀疏线性代数方程组采用带预处理的Krylov子空间迭代法进行求解.为加速迭代求解过程及提高并行性能,迭代过程采用区域分解多重网格的多层限制型加法Schwarz预处理子,减少了求解程序的计算时间,提高了数值模型的并行性能,模型被很好地扩展到上万处理器核数.数值模拟结果与基准模型算例0的参考值吻合得很好.  相似文献   

4.
描述了HL-2A等离子体实时平衡重建的GPU并行化算法,主要包括G-S方程的并行化处理、三对角方程求解、网格边界磁通计算以及一系列矩阵相乘的并行加速。并行后,在129×129的网格下完成一次迭代计算需要约575μs。  相似文献   

5.
基于驰豫超前变换中的超前展开、求和近似和延时近似技术,提出了流水线并行自适应CMA盲均衡算法。利用基于迭代短卷积的并行FIR滤波算法分析了提出的并行自适应盲均衡算法的滤波部分的高效实现结构;再利用基于组合短卷积的并行自适应系数更新算法分析了提出的并行均衡算法的系数更新部分的高效实现结构,从而得到了基于短卷积的流水线并行自适应盲均衡的完整实现框图,并分析了各模块的流水线延时需满足的关系。最后对该并行自适应盲均衡算法进行了FPGA量化实现,并通过MATLAB仿真及实际FPGA实现结果的对比,验证了本并行均衡算法的正确性和有效性。  相似文献   

6.
构造基于界面修正的迭代并行方法的一般途径是:将物理空间区域剖分成若干不重叠的块;在分块子区域的内边界上,采用某种显式格式计算出界面值作为预估值;然后采用某种隐式格式并行求解各个子块区域上的解,这里的隐式格式通常需要进行迭代求解(称为内迭代);可在每一迭代步或几次迭代步结束时,利用已计算出的分块子区域内的(近似)解,在分块子区域内边界处利用隐式格式计算出在内边界处的校正值;随后再转入各个子块区域上的求解,该过程称为外迭代。与以往的并行差分格式不同,在求解的子区域上的定解问题时,可以仅仅在第一个(初始)迭代步求解时所需边界条件使用子区域内界面处的某种显式格式的解,在随后的迭代步中即可改用子区域内界面处的隐式修正格式的解。由此,至少可区分如下3类性质不完全相同的迭代并行格式。  相似文献   

7.
针对设计高次方程大范围收敛性迭代分治算法和并行迭代算法,给出高次方程的适应于正项分解的一种有限区间分裂方法及在指定分裂子区间内求解的收敛性迭代解法。  相似文献   

8.
研究各流域三维流动问题的Boltzmann模型方程计算方法,建立直接求解分子速度分布函数的气体运动论耦合迭代数值格式;基于变量依赖关系、数据通信与并行可扩展性分析,使用区域分解并行化方法,建立气体运动论数值算法并行方案,发展求解各流域三维绕流问题的气体运动论并行算法.拟定高低不同马赫数下来自不同流域的三维球体及返回舱绕流算例,进行高性能Fortran(HPF)大规模并行计算,将计算结果与有关实验数据、相关理论预测等进行比较分析,研究揭示不同流区复杂绕流现象及流动机理.研究表明,所发展的气体运动论并行算法具有很好的并行独立性,基本达到线性加速的并行效果,显示出良好的并行可扩展性.  相似文献   

9.
涡旋光束经过大气湍流时,其波前会发生畸变,因此需要对畸变的波前进行校正.无波前传感器的波前畸变校正系统基于随机并行梯度下降算法,可以实现对波前畸变的校正,但算法的收敛速度及稳定性受随机扰动电压的影响.结合深度学习理论中改进的梯度下降算法,对随机并行梯度下降算法中随机扰动电压的迭代方式进行调整,并分析不同湍流强度下改进型...  相似文献   

10.
代数迭代重建算法在折射衬度CT中的应用   总被引:1,自引:0,他引:1       下载免费PDF全文
X射线折射衬度CT是一种基于相位衬度的断层成像技术,特别适合对由轻元素组成的生物、医学样品进行成像,可以观察到常规吸收衬度CT无法观察到的软组织内部微细结构,是一种具有巨大发展潜力的新成像方法.迭代重建算法和解析重建算法是计算机断层成像技术中并行发展的两种算法,虽然已经提出了几种X射线折射衬度CT的解析重建算法,可是还未见X射线折射衬度CT迭代重建算法的报道.研究了代数迭代重建算法在X射线折射衬度CT中的应用,比较分析了不同的投影数据排列方式对于折射衬度CT重建图像的影响,并对实验数据进行了图像重建,获得了满意的CT图像.研究结果表明,在相位衬度CT中,迭代重建算法相对于解析重建算法而言,能减少投影次数,降低曝光剂量,减少对生物样品的辐射损伤,在生物样品成像和投影数据不完整的情况下具有明显的优势. 关键词: 衍射增强成像 代数迭代算法 CT重建 同步辐射  相似文献   

11.
宋旸  张斌  贺安之 《光子学报》2007,36(4):636-641
描述了一种新的叠栅层析代数迭代模型,并针对传统代数迭代法中的垂直投影算法收敛速度较慢的问题,结合新模型提出了一种改进了的平行投影重建算法.用该算法进行了数值模拟重建,结果表明:与叠栅层析中的变换类算法相比,对非完全数据问题,新算法具有有效结合先验知识进行重建的能力;与传统的垂直投影算法相比,新算法能在保证重建准确度的前提下大幅度的提高收敛速度.  相似文献   

12.
基于DPDV算法的二元光学元件设计   总被引:1,自引:0,他引:1  
谢敬辉  刘锡宇 《光学技术》2000,26(3):225-227
为解决用于高斯分布激光束整形的二元光学元件设计问题 ,在深入研究现有的各种迭代算法 ,如GS算法、模拟退火法、Alopex法等的基础上 ,提出了并行模拟退火算法和DPDV算法 (DifferentParametertoDifferentVariables)。特别是DPDV算法综合了各种算法的优点 ,而避开了其缺点。得到了迄今为止最好的计算结果  相似文献   

13.
A quaternary signed-digit number representations-based arithmetic unit is proposed. The arithmetic unit performs parallel one-step addition (subtraction), multiplication and division. We use the symbolic substitution technique to reduce the number of the computation rules involved in the computation rules. Fast parallel nonrecoded quaternary signed-digit multiplication is proposed using our proposed one-step quaternary signed-digit adder. Also, parallel quaternary signed-digit division is performed in constant time by exploiting an iterative conversion algorithm where in every iterative step a negation operation, an addition operation and two multiplication operations are performed. The execution times of the proposed QSD operations are proportional to log2 n, where n are the length of operands.  相似文献   

14.
An algorithm for solving the linear Cauchy problem for large systems of ordinary differential equations is presented. The algorithm for systems of first-order differential equations is implemented in the EDELWEISS code with the possibility of parallel computations on supercomputers employing the MPI (Message Passing Interface) standard for the data exchange between parallel processes. The solution is represented by a series of orthogonal polynomials on the interval [0, 1]. The algorithm is characterized by simplicity and the possibility to solve nonlinear problems with a correction of the operator in accordance with the solution obtained in the previous iterative process.  相似文献   

15.
1 Introduction  Moderndigitalcommunicationsystemsoftenrequireerror freetransmission .Errorcontrolcodingtechnologyhasbeenusedwidelyincommunicationsystem .Andithasbeenimprovingtheperformanceofcommunicationsystem greatly ,especiallyinwirelesscommunicationss…  相似文献   

16.
In order to content with forward error correction (FEC) technology of the high-speed optical communication system, a new simple decoding algorithm for triple-error correcting Bose, Chaudhuri, and Hocquenghem (BCH) code is proposed. Without complicated matrix-operation or division-operation or intricate iterative algorithm, the algorithm is high efficient and high-speed because of its simplicity in structure. The result of hardware emulation confirms that the algorithm is feasible completely. Introduction of the parallel structure increases the speed of coding greatly. The algorithm can be used in the high-speed optical communication system and other fields.  相似文献   

17.
基于Tahoe框架的某夹具并行计算   总被引:1,自引:0,他引:1  
在开源软件Tahoe框架基础上,结合有限元前后处理程序MSC.Patran及Tecplot,对某复杂夹具进行建模.通过区域分解、编制接口和采用PHG中提供的PCG(preconditioned conjugate gradient,预处理共轭梯度法)迭代解法成功实现262×104自由度模型的串、并行计算.结果表明,并行计算收敛速度更快,4进程并行计算时间不到串行计算时间的1/4.通过与商用程序MSC.Nastran比较,验证计算结果的正确性.利用大型并行计算机对该模型并行计算性能进行研究,获得最高32进程的并行计算加速比.研究表明,改进后的Tahoe计算框架对于开展大规模自由度下的结构并行计算分析研究是可行的,并且随计算节点增加,并行计算过程基本呈线性加速.  相似文献   

18.
A modified version of the Least-Square QR-factorisation (LSQR) algorithm has been implemented in conjunction with Conditional Source-term Estimation (CSE) for lean, turbulent premixed methane–air combustion via Large Eddy Simulation (LES). The iterative solver can reduce computational times by an order of magnitude during the inversion phase of CSE in comparison with the conventional LU-decomposition method. The advantages of iterative and parallel iterative solvers become more prominent as the size of the system increases. The ensemble selection procedure for computing averages within localised regions of the simulation domain has also been updated to a dynamic routine. This allows for more flexible and efficient allocation of computational resources along with reduced input from the user, especially for complex geometries. Preliminary LES calculations have shown that the implementation of an iterative solver and a dynamic ensemble selection algorithm will reduce computational times significantly with negligible error contribution for one-condition CSE, which is applicable to purely premixed or non-premixed turbulent combustion problems. In addition, these algorithms provide the foundation for exceptional computational cost savings for the inversion in two-condition CSE, or Doubly Conditional Source-term Estimation (DCSE), which has shown promise for predicting partially-premixed combustion. Parallel computation of the inverse solution is particularly beneficial to DCSE as the computational cost of the inversion process is considerably larger than in one-condition CSE.  相似文献   

19.
叶轮机械S1/S2两类流面迭代计算具有天然可并行性,在科学与工程计算国家重点实验室的SGI工作站网络上首次实现了两类流面准三元迭代并行计算.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号