首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 124 毫秒
1.
针对现有的算法无法对爆炸冲击进行有效的研究这一问题,在改进了Youngs界面技术的基础上设计了三维多物质Euler界面处理的并行算法。然后采用MPI标准进行了算法的程序设计并对程序进行了并行性能测试和不同分区的算例测试,测试结果表明并行算法对加速比有较大的提高,而不同分区对并行算法的计算结果并没有影响。最后应用所编写的程序对空中爆炸和聚能射流进行了仿真,结果表明程序的模拟结果与前人的研究数据是符合的,说明了程序的有效性。  相似文献   

2.
 提出了两种改进的3维粒子模拟并行算法,改进的并行算法能在每个时间步减少一次进程同步。算法分析和数值模拟表明,由于粒子运动路径和发射的初始位置与随机函数有关,只有一种改进的并行算法能保证并行计算正确。在3维粒子模拟软件CHIPIC3D上实现了改进的并行算法,应用CHIPIC3D对一种相对论返波管进行了并行模拟,模拟结果表明改进的并行算法能取得更高的加速比和效率。  相似文献   

3.
扩散方程区域分解的多步算法   总被引:1,自引:1,他引:0  
盛志明  崔霞  刘兴平 《计算物理》2011,28(6):825-830
利用分数步法进行内边界值的多步计算,改进二维扩散方程的区域分解算法,形成新的并行算法,放宽稳定性条件.其中采用分数步空间大步长离散格式计算内边界点值.算法精度与隐格式相当.与改进前相比,稳定性条件放宽了q倍(g为两个相邻时间步之间执行分数步内边界值计算的次数).利用离散极值原理,严格证明了算法的收敛性.在并行机上进行数...  相似文献   

4.
针对交错网格下的SIMPLE数值算法实施了分区并行计算方法,在小型局域网下实现了流动和传热问题的并行数值计算.对两个经典的流动和传热问题的数值模拟实验表明,所建立的并行计算环境和分区并行算法能够得到正确的和收敛的数值结果.但与串行计算结果相比,并行计算误差明显大于串行计算误差.对并行算法做出的性能分析表明,所给出的并行算法得到了明显的加速效率.随着计算规模的增大,加速比和并行效率提高更显著.  相似文献   

5.
三维电磁粒子模拟并行计算的研究   总被引:3,自引:0,他引:3       下载免费PDF全文
廖臣  刘大刚  刘盛纲 《物理学报》2009,58(10):6709-6718
三维电磁粒子模拟基于时域有限差分算法(FDTD)和PIC(particle-in-cell)方法.根据FDTD和PIC方法的特点,可以将整个模拟区域分割为多个子区域,每个计算进程模拟计算一个子区域,通过消息传递交换子区域的边界数据从而实现并行计算这一基本思路,完成了并行算法的设计,并分析了并行加速比的影响因素.在三维电磁粒子模拟软件CHIPIC3D上实现了该并行算法并验证了算法的正确性,最后应用CHIPIC3D并行版本对磁绝缘线振荡器和相对论速调管两种典型的高功率微波源器件进行了模拟,证明了该并行算法能取 关键词: 电磁粒子模拟 时域有限差分 并行计算 高功率微波源  相似文献   

6.
CHAP3D是北京应用物理与计算数学研究所自主研发的Lagrange通用弹塑性流体力学分析程序.文章介绍了在CHAP3D程序中使用的、针对多处理器集群的、基于静态双重区域分解的两种接触并行算法.第一种是分配单个完整接触面的接触并行算法,此算法将一对完整的接触面分配到一个处理器上,并建立计算域与接触域的通信关系.此接触并行算法的优点是简单,在具有接触面的处理器上可以直接使用串行的接触搜索算法和接触力耦合计算算法.另一种是主面剖分区域分解的接触并行算法,此算法将所有接触面的主面区域分解到所有处理器上.须建立计算域与接触域以及接触域内各处理器间的两种通信关系.该接触并行算法是一个负载平衡的并行算法,具有很好的并行效率和可扩展性.数值算例显示,这两种接触并行算法都能够很好地模拟多种不同类型的接触问题.   相似文献   

7.
基于图像分离块操作的快速模板匹配跟踪算法   总被引:1,自引:1,他引:0  
强世锦  荣健 《应用光学》2009,30(2):195-198
传统的模板匹配跟踪算法存在运算量大和实时性差的缺陷,限制了它的应用范围。针对这一问题,在已有的基于位置预测相关跟踪算法的基础上,提出了利用图像分离块操作对相关跟踪算法进行改进,进一步减少相关跟踪算法的计算量,以满足系统的实时性要求。对改进算法进行了模拟仿真实验验证。仿真结果表明:该改进算法不仅在很大程度上减少了计算量,提高了跟踪系统的实时性,而且能够有效地减少随机噪声的影响,使得跟踪更加快速准确。  相似文献   

8.
史雄伟  王成  张春雷  陈乃奎 《应用声学》2017,25(10):221-223, 231
基于FPGA的核电站仪控设备中涉及大量浮点指数运算,而常用的CORDIC算法和线性逼近法等存在计算范围小、计算精度不高等问题,对FPGA硬件实现指数函数的方法进行研究,并提出一种改进的级数近似法。该方法对输入进行预处理,将输入分解后采用查找表和泰勒级数展开结合的方法,在展开很少项数的情况下快速收敛,发挥查找表法和级数近似法的优势,提高算法的运算精度和效率。在Matlab环境下对改进算法的有效性进行仿真验证,且采用Verilog语言进行编程实现,在Microsemi公司的IGLOO2系列FPGA上进行具体算法性能验证。Matlab仿真和FPGA验证结果均表明,改进的级数近似法能够大幅增大指数函数的自变量输入范围,并提高计算精度。  相似文献   

9.
曹文梁 《应用声学》2014,22(6):1676-1679
根据织物检测的实际情况需要,提出了基于差分盒算法的改进算法,在使用Brodatz纹理库样本的前提下,分别在盒子高度确定、盒子总数统计以及网格中盒子数量确定3个方面进行改进,在算法时间和精度两项上,对经典差分盒算法和改进算法进行了比较,对比得出了改进算法的时效性;还应用了改进差分盒算法对3种常见纹理的疵点织物进行了计算,以确认疵点织物,并验证了改进差分盒算法;实验通过检出率、误检率、漏检率和检测精度4个检测精度参数表明,改进的差分盒算法可以有效地区分疵点织物和正常织物,该方法具有很强的实用性。  相似文献   

10.
改进的Brenner图像清晰度评价算法   总被引:9,自引:2,他引:7  
王健  陈洪斌  周国忠  安涛 《光子学报》2012,41(7):855-858
图像清晰度评价是基于数字图像的被动式自动调焦技术的基本问题之一.传统Brenner图像清晰度评价算法具有运算速度快特点,但是其评价准确性取决于阈值选取,且其灵敏度较低.针对上述问题,本文提出了一种改进算法.改进算法采用高通和带通两个滤波器对图像进行计算,克服阈值对传统Brenner算法评价结果的影响.为了衡量改进算法的性能,将其与传统的Brenner算法比较,并对评价算法的单峰性、无偏性、灵敏度、计算量等主要衡量标准逐一分析.实验结果表明:与传统的Brenner评价算法相比,改进算法在满足评价算法单峰性和无偏性前提下,提高了灵敏度,降低了计算次数.  相似文献   

11.
并行测试以减少测试时间和降低测试成本的强大优势,已成为当前自动测试系统发展的方向。针对并行自动测试过程中,测试任务调度复杂,难以优化的问题,以PSO算法为基础,通过对问题空间编码的重新定义,并运用交叉、变异算子给出了新的粒子位置的更新公式,提出了一种改进后的DPSO算法。依据并行测试完成时间极限定理,给出了并行测试任务调度的目标函数与约束条件。以某雷达电子装备并行测试系统中三块电路板并行测试为例,对改进的DPSO算法进行了仿真验证,得到了最优调度测试序列。结果表明:与遗传算法相比,改进后的DPSO算法迭代次数更少,寻优性能更好,适用于工程应用。  相似文献   

12.
王新华  王晓坤 《中国光学》2015,8(5):785-793
为了满足工程应用对图像拼接实时性的要求,依据已设计完成的基于同心球透镜与微相机拼接阵列复合结构的十亿像素瞬态成像系统,提出一种基于统一计算设备架构(CUDA)与先验信息相结合的自适应图像拼接并行加速算法。首先,利用高精度四维标定平台对相邻微相机成像重叠区域进行预标定。接着,采用基于CUDA的快速鲁棒特征(SURF)方法检测提取重叠区域图像的候选特征点集。然后,运用基本线性代数运算子程序(CUBLAS)加速基于随机KD-Tree索引的近似最近邻搜索(ANN)算法,用于获取初始匹配点对。最后,提出一种改进的并行渐近式抽样一致性(IPROSAC)算法,用于剔除误匹配点对和空间变换矩阵的参数估计,从而得到拼接图像的空间几何变换关系。实验结果表明,该算法的图像拼接时间为287 ms,与单独采用CPU串行算法相比速度提高了近30倍。  相似文献   

13.
荧光分子断层成像正向问题的并行计算   总被引:2,自引:0,他引:2  
邹玮  王加俊  冯大淦 《光学学报》2007,27(3):443-450
针对荧光分子断层成像中相应于激发光和发射光的两个正向方程必须串行求解的实际情况,提出了一种可同时对两个扩散方程进行求解的并行算法。其思想是通过引入乘子矩阵对耦合方程进行解耦来实现并行计算,并利用有限元方法进行了二维数值模拟,将算法求解所得结果与基于串行方法,以Ralf B.Schulz等提出的并行算法所得到的数值模拟结果进行了综合比较。实验表明,该算法一方面适合于任何大小的斯托克斯频移条件,具有更广泛的适应性;另一方面提高了荧光分子断层成像正向问题的求解速度和精度,从而有利于整个荧光分子断层成像的快速精确求解。  相似文献   

14.
Particle signals are detected by two parallel measuring chains which consist of a detector and analog to digital converter. We have used OPT101 as photodiode and ADS7870 for A/D converter and the output signal from two parallel measuring chains is processed by on line correlation filter. This filter works as real time systems. A correlation algorithm has been applied for this work. The signal to noise ratio has been increased by applying correlation filter. The gain of the filter has been improved by introducing digital signal processing.  相似文献   

15.
A previously described algorithm [T.A. Brunner, T.J. Urbatsch, T.M. Evans, N.A. Gentile, Comparison of four parallel algorithms for domain decomposed implicit Monte Carlo, Journal of Computational Physics 212 (2) (2006) 527–539] for doing domain decomposed particle Monte Carlo calculations in the context of thermal radiation transport has been improved. It has been extended to support cases where the number of particles in a time step are unknown at the beginning of the time step. This situation arises when various physical processes, such as neutron transport, can generate additional particles during the time step, or when particle splitting is used for variance reduction. Additionally, several race conditions that existed in the previous algorithm and could cause code hangs have been fixed. This new algorithm is believed to be robust against all race conditions. The parallel scalability of the new algorithm remains excellent.  相似文献   

16.
The inverse compositional Gauss–Newton (IC-GN) algorithm is one of the most popular sub-pixel registration algorithms in digital image correlation (DIC). The IC-GN algorithm, compared with the traditional forward additive Newton–Raphson (FA-NR) algorithm, can achieve the same accuracy in less time. However, there are no clear results regarding the noise robustness of IC-GN algorithm and the computational efficiency is still in need of further improvements. In this paper, a theoretical model of the IC-GN algorithm was derived based on the sum of squared differences correlation criterion and linear interpolation. The model indicates that the IC-GN algorithm has better noise robustness than the FA-NR algorithm, and shows no noise-induced bias if the gray gradient operator is chosen properly. Both numerical simulations and experiments show good agreements with the theoretical predictions. Furthermore, a seed point-based parallel method is proposed to improve the calculation speed. Compared with the recently proposed path-independent method, our model is feasible and practical, and it can maximize the computing speed using an improved initial guess. Moreover, we compared the computational efficiency of our method with that of the reliability-guided method using a four-point bending experiment, and the results show that the computational efficiency is greatly improved. This proposed parallel IC-GN algorithm has good noise robustness and is expected to be a practical option for real-time DIC.  相似文献   

17.
陈升来  黄廉卿 《光学技术》2006,32(4):587-590
针对SPIHT(set partitioning in hierarchical trees)算法的编码过程具有重复运算、存储量大等问题,提出了一种适合于DSP(digital signal processors)处理的低内存并行SPIHT算法。该算法采用乒乓缓存策略,使得数据的传输和编码能够同时进行。通过引入基于行的整型提升方案,使得只需经少量行变换就能进行列变换,提高了小波的变换速度。根据DSP的并行特性和SPIHT算法的缺点,采用“改进的最大幅值求取方法”、“误差位数以及绝对零值和绝对零集合”、“最大值与零值图”和“单棵零树编码”等多种方法对其进行了改进,大大缓解了对内存的压力,减少了算法的运算量。该算法与LZC(listless zerotree coding)算法相比,重构图像的峰值信噪比相当,但速度提高了2倍,能满足一般的实时压缩要求。  相似文献   

18.
为加速基于离散纵标方法(SN)的中子输运计算,针对群内迭代进行研究并实现了分流再平衡(PCR)算法及基于区域分解的并行,并在加速方程求解时进一步耦合了算术多重网格算法。并行PCR算法已集成至JSNT软件,并针对临界和外源计算典型算例验证了算法的正确性和有效性。74亿自由度的国内某商业压水堆压力容器屏蔽计算中,JSNT迭代次数减少至原来的1/3以下,总体计算时间减少至原来的1/2以下,1024核并行效率达42.8%。  相似文献   

19.
The algorithm and optical implementation of full parallel adder using combina-torial logic architecture have been suggested in this paper.The hybrid full parallel adder,which can perform multiple bits addition simultaneously,is implemented by utilizing VLSItechnology and acoustooptic Bragg cells.The algorithm has the advantages of high parallelismand easy optical implementation.The full parallel adder finishes n-bit addition within the du-ration T_d if the pipeline architecture is employed,whose hardware complexity is O(n~2).  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号