排序方式: 共有35条查询结果,搜索用时 0 毫秒
1.
2.
分布式系统上并行矩阵乘法 总被引:9,自引:0,他引:9
1.引言矩阵乘法是最简单的数学问题,同时由于其计算量大而通常被用来对计算机的浮点运算速度进行测试,尤其是对于并行计算机,其并行效率的好坏可通过这个简单的问题反应出来,如果在这个问题上都不能取得很好的效果,对于其它问题就更不可能.此外,为了提高计算性能,对求解数值代数中的问题最终会归结到有矩阵乘法的计算,如LAPACK,ScaLAPACK等,因此有效地并行计算矩阵乘法在实际应用中是非常重要的.矩阵乘法是做C=A×B,其中A是m×k阵,B是k×n阵,C是m×n阵.设矩阵A,B可以分成p×p块矩阵,即A=(Ai,j)p×p,B=(B… 相似文献
3.
4.
羰基化合物的氟烷基化反应是把含氟基团引入有机分子中去的一个重要手段。文献报道的主要是通过氟烷基金属试剂来进行此反应。但氟烷基金属试剂不太稳定,容易分解。这就给它们的应用带来了许多不便。我们发现,氟烷基三甲基硅化合物(1)作为氟烷基阴离子前体,在比较温和的条件下,便可使醛发生氟烷基化反应。首先,参照文献方法,通过氟烷基格氏试剂与三甲基氯硅烷反应,方便地制得了两个新的氟烷基三甲基硅化合物 R_F-SiMe_3(1)。 相似文献
6.
Utilizing the Wronskian technique, a combined Wronskian condition is established for a (3+1)-dimensional generalized KP equation. The generating functions for matrix entries satisfy a linear system of new partial differential equations. Moreover, as applications, examples of Wronskian determinant solutions, including N-soliton solutions, periodic solutions and rational solutions, are computed. 相似文献
7.
8.
利用块三对角矩阵的嵌套局部块分解构造了一个不完全分解预条件子,并考虑了其修正型变种,分析了两者的存在性及若干性质.针对标准七点差分矩阵,给出了预条件后的实际条件数.结果表明,采用局部块分解预条件时条件数与矩阵阶数的2/3次幂成正比,而采用修正型预条件时条件数与矩阵阶数的立方根成正比.最后考虑了预条件的高效实现并在主频为550MHz、内存为256M的微机上作了若干数值实验,并与其它较有效的预条件方法进行了比较. 相似文献
9.
10.
混凝土细观力学分析程序中的快速算法与并行算法设计 总被引:1,自引:0,他引:1
针对一套混凝土细观力学分析程序,在分析其计算方法与计算效率的不足之后,提出了采用稀疏矩阵与稀疏向量技术来高效实现有限元刚度矩阵装配过程的算法,并采用双门槛不完全Cholesky分解预条件技术与CG法相结合来高效地求解稀疏线性方程组。之后,从整体上提出了一个将有限单元分布与未知量分布有机结合的并行算法设计方案,并分别针对刚度矩阵装配、双门槛不完全Cholesky分解、稀疏矩阵与稠密向量相乘、稀疏向量相加等核心算法,进行了相应的并行算法设计。最后,在由每节点2 CPU的8个Intel Xeon节点采用千兆以太网连成的机群上,针对两个混凝土数值试样进行了数值实验,第一个试样含44117个网格点与53200个有限单元,第二个试样含71013个网格点与78800个有限单元;对第一个试样,原串行程序进行全程567次加载计算需要984.83小时约41天,采用文中串行算法后,模拟时间减少到22531秒约6.26小时,采用并行算法在16个CPU上的模拟时间进一步降为3860秒约1.07小时。对第二个试样,原串行程序进行全程94次加载计算需要467.19小时约19.5天,采用文中串行算法后,模拟时间减少到11453秒约3.18小时,采用并行算法在16个CPU上的模拟时间进一步降为1704秒约28.4分钟。串行算法的改进与并行算法的设计大大缩短了计算时间,对加快混凝土力学性能的分析研究具有重要意义。 相似文献