期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

王林元张瀚铭蔡爱龙闫镔李磊胡国恩《物理学报》2013,62(19):198701-198701

CT (computed tomography)系统实际应用当中, 经常会出现扫描数据不满足数据完备性条件的情况. 针对不完全角度重建问题的研究, 是目前迭代型算法研究中的一个热点. 一系列基于带有约束的总变分最小化的重建算法近年来在不完全角度重建中取得了较好的效果, 这其中基于交替方向法 (alternating direction method, ADM) 的重建算法表现出更好的性能. 然而, ADM方法在求解过程中对矩阵求逆的处理效率不高, 导致极大的计算开销. 本文针对该问题, 使用非精确ADM方法, 利用线性近似的方式替换掉计算开销较大的项, 使得矩阵求逆问题可以通过快速傅里叶变换加速实现. 实验结果表明, 本文提出的非精确交替方向总变分最小化重建算法与精确ADM重建算法相比, 没有明显的精度损失, 计算时间缩减30%左右. 关键词：不完全角度重建总变分最小化非精确交替方向法相似文献

2.

基于CUDA的多GPU加速SART迭代重建算法

下载免费PDF全文

雷德川陈浩王远张成鑫陈云斌胡栋材《强激光与粒子束》2013,25(9):2418-2422

为解决SART迭代重建算法计算耗时的问题,在单GPU基础上,利用多块GPU 的并行计算能力,提出了一种多GPU加速迭代重建算法。实验结果表明,与CPU重建相比,在不影响重建图像质量的情况下,采用GPU重建速度有明显提高,且增加GPU数量可以进一步提高重建速度。相似文献

3.

基于乘性正则化的有限角度CT重建算法

《光学学报》2010,(5)

计算机层析(CT)扫描过程中,为了加快速度,同时减少X射线对人体的伤害,在有限角度下采样少量的投影数据进行不完全数据重建就显得非常重要。基于总变分最小化的图像迭代重建算法,能够较好地应用于有限角度CT重建,然而,其最小化函数的权值参数必须通过大量的实验观察比较才能被确定。即便这样,得到的参数往往也不是最优的。为此,引入了一种基于乘性正则化的迭代重建算法,将总变分函数作为最小化函数的一个因子,在具有总变分方法优点的同时,能够在迭代过程中自适应地调整正则化参数。仿真实验验证了该算法的有效性。相似文献

4.

基于总变分的湍流退化噪声图像盲反卷积复原

黄建明沈忙作《光学技术》2008,34(4)

根据总变分的噪声抑制特性和大气湍流成像过程,建立了基于总变分的大气湍流噪声图像多帧盲反卷积复原最小化模型,以基于共轭梯度数值优化方法的交替迭代算法求解,复原出了观测目标的清晰图像。在计算机上模拟了湍流退化和噪声污染图像。实验结果表明,该复原算法能有效地克服大气湍流和噪声的影响,可复原出清晰的原始目标图像。相似文献

5.

紧束缚近似含时密度泛函理论的高效OpenMP并行化和GPU加速实现

范果红韩克利何国钟《化学物理学报》2013,26(6):635-645

紧束缚近似的含时密度泛函理论在多核和GPU系统下的高效加速实现,并应用于拥有成百上千原子体系的激发态电子结构计算．程序中采用了稀疏矩阵和OpenMP并行化来加速哈密顿矩阵的构建,而最为耗时的基态对角化部分通过双精度的GPU加速来实现．基态的GPU加速能够在保持计算精度的基础上达到8.73倍的加速比．激发态计算采用了基于Krylov子空间迭代算法,OpenMP并行化和GPU加速等方法对激发态计算的大规模TDDFT矩阵进行求解,从而得到本征值和本征矢,大大减少了迭代的次数和最终的求解时间．采用GPU对矩阵矢量相乘进行加速后的Krylov算法能够很快地达到收敛,使得相比于采用常规算法和CPU并行化的程序能够加速206倍．程序在一系列的小分子体系和大分子体系上的计算表明,相比基于第一性原理的CIS方法和含时密度泛函方法,程序能够花费很少的计算量取得合理而精确结果．相似文献

6.

基于全变分最小化和快速一阶方法的低剂量CT有序子集图像重建

下载免费PDF全文

毛宝林陈晓朝孝大宇范晟昱滕月阳康雁《物理学报》2014,(13):423-429

低剂量计算机断层成像(computed tomography,CT)具有减少X射线对患者的伤害的优势.本文主要针对从不完备投影数据重建出高质量低剂量CT图像的问题.通常,这个问题可以通过统计图像重建方法来实现,而统计重建算法需要非常多的迭代次数,导致了巨大的计算时间压力,以至于很难应用在实践中.为解决此问题,本文提出一种有序子集重建算法,该算法结合了全变分最小化和快速一阶方法以减少重建的迭代次数,采用Split Bregman交替方向法求解上述优化问题,利用投影到凸集合的方法加快迭代的收敛速率.实验结果表明,在同样的迭代次数下,本文提出的方法与基于有序子集的一阶方法相比较,相对重建误差的下降速度更快. 相似文献

7.

采用字典递归更新的目标检测稀疏算法及GPU实现

《光学学报》2016,(8)

稀疏表示是一种有潜力的图像信息表示方法,已应用于图像目标检测。正交匹配追踪算法(OMP)求解稀疏系数过程计算复杂,不能满足快速处理的要求,因此引入Kalman滤波器的递归思想,提出了一种计算稀疏系数的快速OMP(FastOMP)算法。利用Hermitian引理,从上一时刻的状态更新当前信息,避免了高维矩阵数据的重复计算。为提高算法的执行效率,提出了基于GPU/CUDA(图形处理器/统一计算设备架构)的并行计算方法,充分利用GPU的并行计算能力,提高了FastOMP算法的计算速度。实验结果表明,与传统OMP算法相比,FastOMP算法可大幅度缩短计算时间并提高检测精度。相似文献

8.

基于CUDA的傅里叶变换成像光谱仪数据重建

《光学技术》2013,(2):128-132

为了达到傅里叶变换成像光谱仪(FTIS)数据快速重建的目的,使用GPU并行计算技术设计了基于CUDA(compute unified device architecture)的成像光谱仪快速数据重建优化算法。采用CUDA下的CUFFT库和CUDA并行计算内核,以达到加快成像光谱仪快速数据重建。结果表明,基于CUDA的并行计算技术能有效调动GPU的硬件资源,可大幅度提高光谱重建处理任务的计算效率。如果将该技术应用到更多核的并行计算工作站上,那么单台计算机完成干涉成像光谱仪数据的实时处理任务将成为可能。相似文献

9.

气体动力学直接模拟Monte Carlo的高效GPU并行计算

贺永翔刘昕赵海波《计算物理》2015,(2):169-176

实现了基于计算统一设备架构(CUDA)的直接模拟Monte Carlo(DSMC)并行算法,改进了原有多图形处理器(GPU)数据之间传输并行算法,数值模拟计算二维Couette流和二维顶盖驱动方腔流,定量比较了CPU、单GPU和多GPU并行计算的结果和计算时间.结果表明单GPU并行计算相对CPU计算的加速效果可以达到10~30倍,双GPU并行计算加速效果可以达到40~60倍,多GPU并行计算的加速效率接近100%,且计算精度能够得到良好保证. 相似文献

10.

KSSOLV-GPU:一款利用GPU高效求解Kohn-Sham方程的平面波基组密度泛函理论MATLAB程序包（英文）

《化学物理学报》2021,(5)

KSSO LV(Kohn-Sham Solver)是一款用于求解平面波基组下Kohn-Sham方程(KS-DFT)的MATLAB (Matrix Laboratory)工具箱.在KS-DFT的基态计算中,通常自洽场迭代中Kohn-Sham哈密顿量的对角化是最昂贵的部分.为了使得个人计算机也能够执行数百个原子的中等大小KS-DFT计算,本文提出了一种CPUGPU的混合编程方案,通过调用MATLAB内置的并行计算工具箱来加速在KSSOLV中实现的迭代对角化算法.比较了 KSSOLV-GPU在RTX3090、V100、A100三种GPU上的性能;结果表明,对于包含128个原子的块状硅体系,与串行的CPU计算相比,混合CPU-GPU的编程可以实现约10倍的加速.特别是其在最新的民用GPU显卡RTX3090上也具有优秀的表现,可以预想到在不远的将来,KSSOLV-GPU借助MATLAB强大的可视化能力与GPU的加速支持可以在一台配备了民用GPU显卡的个人电脑上实现常规的D FT计算分析与可视化,从而降低了材料模拟与计算领域的门槛. 相似文献

11.

KSSOLV-GPU：一款利用GPU高效求解Kohn-Sham方程的平面波基组密度泛函理论MATLAB程序包

张振林焦诗哲李杰岚吴文挑万凌云秦新明胡伟杨金龙《化学物理学报》2021,34(5):552-564

KSSOLV(Kohn-Sham Solver)是一款用于求解平面波基组下Kohn-Sham方程(KS-DFT)的MATLAB(Matrix Laboratory)工具箱. 在KS-DFT的基态计算中,通常自洽场迭代中Kohn-Sham哈密顿量的对角化是最昂贵的部分. 为了使得个人计算机也能够执行数百个原子的中等大小KS-DFT计算,本文提出了一种CPU-GPU的混合编程方案,通过调用MATLAB内置的并行计算工具箱来加速在KSSOLV中实现的迭代对角化算法. 比较了KSSOLV-GPU在RTX3090、V100、A100三种GPU上的性能;结果表明,对于包含128个原子的块状硅体系,与串行的CPU计算相比,混合CPU-GPU的编程可以实现约10倍的加速. 特别是其在最新的民用GPU显卡RTX3090上也具有优秀的表现,可以预想到在不远的将来,KSSOLV-GPU借助MATLAB强大的可视化能力与GPU的加速支持可以在一台配备了民用GPU显卡的个人电脑上实现常规的DFT计算分析与可视化,从而降低了材料模拟与计算领域的门槛. 相似文献

12.

结合透射CT的康普顿背散射图像重建

下载免费PDF全文

古宇飞闫镔王彪李磊韩玉《强激光与粒子束》2014,26(2):024003-254

在康普顿散射成像(CST)技术中可以结合透射成像重建出衰减系数来消除散射重建的非线性,但这样得到的投影矩阵带有误差。而CST重建问题的不适定性对噪声和投影矩阵的误差非常敏感,重建结果会有较大误差。针对此问题,基于压缩感知理论提出了一种新的CST重建算法。新方法将图像重建问题归结为一个图像的全变分(TV)最小化问题,并使用收敛速度较快的基于交替方向法的Split-Bregman方法进行求解。在仿真实验中,通过与代数重建技术(ART)进行比较,在测量数据充足和测量数据不足两种情况下,本文算法都具有更好的重建质量,证明了所提算法在重建精度和抗噪性能方面的优势。相似文献

13.

总变差约束的数据分离最小图像重建模型及其Chambolle-Pock求解算法 总被引：3，自引：0，他引：3

下载免费PDF全文

乔志伟《物理学报》2018,67(19):198701-198701

基于优化的迭代法,可以结合压缩感知和低秩矩阵等稀疏优化技术高精度地重建图像.其中,总变差最小（total variation minimization,TV）模型是一种简单有效的优化模型.传统的约束TV模型,使用数据保真项为约束项,TV正则项为目标函数.本文研究TV约束的、数据分离最小（TV constrained,data divergence minimization,TVcDM）新型TV模型及其求解算法.详细推导了TVcDM模型的Chambolle-Pock（CP）算法,验证了模型及算法的正确性;分析了算法的收敛行为;评估了模型的稀疏重建能力;分析了模型参数的选择对重建的影响及算法参数对收敛速率的影响.研究表明,TVcDM模型有高精度稀疏重建能力;TVcDM-CP算法确保收敛,但迭代过程中有振荡现象;TV限对重建有重要影响,参数值过大会引入噪声而过小会模糊图像细节;算法参数的不同选取会导致不同的收敛速率. 相似文献

14.

基于逆散射理论的地震波速度正则化反演

下载免费PDF全文

段晓亮王一博杨慧珠《物理学报》2015,64(7):78901-078901

本文基于逆散射理论利用正则化有限差分对比源反演算法对地震波传播速度进行反演, 该方法是基于波动方程的频率域波形反演算法, 利用非线性共轭梯度法, 通过最小化目标优化函数不断迭代更新速度模型. 由于地球物理反演问题的病态性和不稳定性, 通过基于反演参数总变差的正则化处理, 使反演问题变为良性问题且算法具有较强的抗噪声干扰能力. 反演过程中使用了频率-空间域9点差分正演算子以及PML吸收边界条件. 与其他反演算法相比, 由于背景模型在反演迭代过程中保持不变, 可以避免在每次迭代过程中重新构造正演算子及矩阵分解等相关计算过程, 使得该算法非常适合于大规模三维反演计算. 此外, 本文采用基于MPI的并行计算, 进一步提高了反演计算的效率. 二维CSEG模型反演结果表明该方法可以反演得到高分辨率的地震波速度重建结果, 为地震勘探数据处理及解释提供准确的速度信息. 相似文献

15.

大规模声学边界元法的GPU并行计算

张锐文立华校金友《计算物理》2015,32(3):299-309

提出一种大规模声学边界元法的高效率、高精度GPU并行计算方法.基于Burton-Miller边界积分方程,推导适于GPU的并行计算格式并实现了传统边界元法的GPU加速算法.为提高原型算法的效率,研究GPU数据缓存优化方法.由于GPU的双精度浮点运算能力较低,为了降低数值误差,研究基于单精度浮点运算实现的doublesingle精度算法.数值算例表明,改进的算法实现了最高89.8%的GPU使用效率,且数值精度与直接使用双精度数相当,而计算时间仅为其1/28,显存消耗也仅为其一半.该方法可在普通PC机(8GB内存,NVIDIA Ge Force 660 Ti显卡)上快速完成自由度超过300万的大规模声学边界元分析,计算速度和内存消耗均优于快速边界元法. 相似文献

16.

基于紧致差分的Grad-Shafranov方程快速解法

胡金迪肖炳甲罗正平黄耀《核聚变与等离子体物理》2018,(1)

在等离子体平衡重建迭代计算过程中,需要快速求解Grad-Shafranov方程(G-S方程)。构造了具有四阶精度紧致差分格式的离散方程,采用离散正弦变换技术对其进行快速求解并采用CUDATM实现GPU并行加速,将其应用到EAST等离子体平衡重建PEFIT代码中,实现基于紧致差分格式的快速G-S方程求解。结果表明,在65?65的网格下,给定方程右端项电流分布的前提下,使用GPU求解G-S方程所需时间为大约34?s。相似文献

17.

基于紧致差分的Grad-Shafranov方程快速解法

�� Ф��ƽ�� ҫ 《核聚变与等离子体物理》2018,38(1):8-14

在等离子体平衡重建迭代计算过程中,需要快速求解Grad-Shafranov方程(G-S方程)。构造了具有四阶精度紧致差分格式的离散方程,采用离散正弦变换技术对其进行快速求解并采用CUDATM实现GPU并行加速,将其应用到EAST等离子体平衡重建PEFIT代码中,实现基于紧致差分格式的快速G-S方程求解。结果表明,在65×65的网格下,给定方程右端项电流分布的前提下,使用GPU求解G-S方程所需时间为大约34μs。相似文献

18.

基于GPU求解椭圆型偏微分方程的并行算法

曹建伟徐翔王友年《计算物理》2015,32(4):475-481

针对求解椭圆型偏微分方程的雅克比迭代算法和DRM算法进行基于GPU的CUDA加速算法研究.通过两个算例在GTX570显卡上对GPU加速算法进行验证.结果表明,在保证运算精度的前提下,雅克比迭代的GPU加速效率最高,在DOUBLE类型下的加速比可达到14倍左右,效率可达到53%左右;DRM算法在DOUBLE类型下的加速比最高可达到3.8倍,效率达到15%左右. 相似文献

19.

激波与火焰面相互作用数值模拟的GPU加速 总被引：1，自引：0，他引：1

蒋华董刚陈霄《计算物理》2016,33(1):23-29

为考察计算机图形处理器（GPU）在计算流体力学中的计算能力,采用基于CPU/GPU异构并行模式的方法对激波与火焰界面相互作用的典型可压缩反应流进行数值模拟,优化并行方案,考察不同网格精度对计算结果和计算加速性能的影响.结果表明,和传统的基于信息传递的MPI 8线程并行计算相比,GPU并行模拟结果与MPI并行模拟结果相同;两种计算方法的计算时间均随网格数量的增加呈线性增长趋势,但GPU的计算时间比MPI明显降低.当网格数量较小时（1.6×10⁴）,GPU计算得到的单个时间步长平均时间的加速比为8.6;随着网格数量的增加,GPU的加速比有所下降,但对较大规模的网格数量（4.2×10⁶）,GPU的加速比仍可达到5.9.基于GPU的异构并行加速算法为可压缩反应流的高分辨率大规模计算提供了较好的解决途径. 相似文献

20.

基于图像总变分和张量字典的多能谱CT材料识别研究

《光学学报》2018,(11)

基于光子计数探测器的多能谱计算机断层成像技术(CT),能够获得多个能量段的能谱信息,在材料识别方面有着独特的优势。由于窄能谱探测及光子计数探测器存在一致性差的问题,多能谱CT图像中含有较多的噪声和伪影,这不利于材料的分解与识别。因此从重建的角度出发,改进了传统张量字典学习(TDL)方法,提出一种基于图像总变分(TV)和TDL的图像重建算法,简称TV+TDL。该算法不但继承了TDL算法在刻画各个能量通道图像之间相似性的优势,而且通过引进TV作为正则项,可进一步恢复图像微小结构和细节并有效地抑制噪声,提高材料分解精度。仿真实验结果表明,TV+TDL算法能够有效重建高质量的多能谱CT图像,并成功实现基材料模型下的材料分解与识别,从而验证了该方法的有效性和实用性。相似文献