期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

彭伊娟王振超张秋菊《应用声学》2023,42(5):984-992

超声相控阵技术是目前聚乙烯管道热熔接头内部缺陷检测的一种主流方法。提出了基于注意力机制的改进Faster-RCNN目标检测网络用于超声相控阵D扫图聚乙烯管接头内部缺陷检测。针对聚乙烯管道热熔接头内部超声相控阵D扫图小缺陷较多、特征信息容易丢失的问题,将残差网络(ResNet50)与特征金字塔网络(FPN)相结合作为骨干网络,并引入卷积注意力模块(CBAM)自适应细化特征。将SSD网络框架和Faster-RCNN网络框架用于模型训练和测试,使用VGG16、ResNet50、ResNet50+FPN、ACBM+ResNet50+FPN作为骨干网络依次对超声相控阵聚乙烯管道热熔对接接头内部缺陷样本进行训练对比。结果表明,改进的Faster-RCNN网络模型在聚乙烯管接头内部缺陷检测和分类方面有明显改进,对小缺陷的检测性能有了显著的提高。相似文献

2.

改进的YOLO V3算法及其在小目标检测中的应用

鞠默然罗海波王仲博何淼常铮惠斌《光学学报》2019,39(7):245-252

针对图像中小目标检测率低、虚警率高等问题,提出了一种YOLO V3的改进方法,并将其应用于小目标的检测。由于小目标所占的像素少、特征不明显,提出对原网络输出的8倍降采样特征图进行2倍上采样,将2倍上采样特征图与第2个残差块输出的特征图进行拼接,建立输出为4倍降采样的特征融合目标检测层。为了获取更多的小目标特征信息,在YOLO V3网络结构Darknet53的第2个残差块中增加2个残差单元。利用K-means聚类算法对目标候选框的个数和宽高比维度进行聚类分析。用改进的YOLO V3算法和原YOLO V3算法在VEDAI数据集上进行对比实验,结果表明改进后的YOLO V3算法能有效检测小目标,对小目标的召回率和检测的平均准确率均值都有明显的提升。相似文献

3.

基于长短期记忆网络与特征融合的微表情识别算法

《光学技术》2021,47(1):113-119

为了提高视频识别领域中微表情识别的准确率,提出了一种基于长短期记忆网络与特征融合的微表情识别算法。提取微表情图像的颜色特征和纹理特征,将所提取的空间特征传入卷积神经网络进行融合。设计了学习时域相关性的长短期记忆网络结构,将融合的特征集传入长短期记忆网络学习微表情的时域特征,将长短期记忆网络接入分类器网络识别出微表情的类标签。在两个公开的微表情识别数据集上完成了验证实验,结果显示算法实现了较好的微表情识别性能,在SMIC数据集和CASMEⅡ数据集上的准确率分别达到64.7%和65.8%. 相似文献

4.

特征增强SSD算法及其在遥感目标检测中的应用

史文旭谭代伦鲍胜利《光子学报》2020,49(1):148-157

为了提高对复杂场景下多尺度遥感目标的检测精度,提出了基于多尺度单发射击检测(SSD)的特征增强目标检测算法.首先对SSD的金字塔特征层中的浅层网络设计浅层特征增强模块,以提高浅层网络对小目标物体的特征提取能力;然后设计深层特征融合模块,替换SSD金字塔特征层中的深层网络,提高深层网络的特征提取能力;最后将提取的图像特征与不同纵横比的候选框进行匹配以执行不同尺度遥感图像目标检测与定位.在光学遥感图像数据集上的实验结果表明,该算法能够适应不同背景下的遥感目标检测,有效地提高了复杂场景下的遥感目标的检测精度.此外,在拓展实验中,文中算法对图像中的模糊目标的检测效果也优于SSD. 相似文献

5.

改进的SSD算法及其对遥感影像小目标检测性能的分析

王俊强李建胜周学文张旭《光学学报》2019,39(6):365-374

针对以Faster R-CNN为代表的基于候选框方式的遥感影像目标检测方法检测速度慢,而现有SSD算法在小目标检测中性能低的问题,提出一种改进的SSD算法,综合利用现有基于候选框方式和一体化检测方式的优势,提升检测性能。该算法利用密集连接网络替换原有的VGGNet作为骨干网络,并且在密集连接模块之间构建特征金字塔,代替原有多尺度特征图。为验证所提算法的精度及性能,设计样本数据在线采集系统,并采集飞机及运动场目标样本集作为实验样本,通过对改进SSD算法的训练,验证了其网络结构的稳定性,在无迁移学习支持下依然能够达到良好效果,且训练过程不易发散。通过对比以101层的残差网络(ResNet101)作为基础网络的Faster R-CNN算法和R-FCN算法可知,改进SSD算法较Faster R-CNN算法和R-FCN算法的MAP在测试集上分别提升了9.13%和8.48%,小目标检测的MAP分别提升了14.46%和13.92%,检测单张影像耗时71.8 ms,较Faster R-CNN和R-FCN算法分别减少45.7 ms和7.5 ms。相似文献

6.

基于量子长短期记忆网络的量子图像混沌加密方案

下载免费PDF全文

王伟杰姜美美王淑梅曲英杰马鸿洋邱田会《物理学报》2023,(12):21-32

近年来,图像信息的传输安全性已经成为互联网领域的重要研究方向.本文提出了一种基于量子长短期记忆(quantum long-short term memory, QLSTM)网络的量子图像混沌加密方案.结果发现,因为QLSTM网络具有复杂的结构和较多的参数,应用QLSTM网络对Lorenz混沌序列进行改进,其最大Lyapunov指数比原序列提高2.5465%,比经典长短期记忆(long-short term memory, LSTM)网络改进的序列提高0.2844%,同时在0—1测试中结果更接近1且更稳定,因此QLSTM网络改进的序列具备更优异的混沌性能,更难以被预测,提高了单一混沌系统加密的安全性.运用NCQI (novel quantum representation of color digital images)量子图像表示模型,将原始图像存储为量子态形式,利用QLSTM网络改进的序列分别控制三级径向扩散、量子广义Arnold变换和量子W变换,改变量子图像的灰度值与像素位置,生成最终的加密图像.本文提出的加密方案在统计学特性测试中,实现了RGB三通道平均信息熵均大于7.999,像... 相似文献

7.

水下目标多模态深度学习分类识别研究 总被引：2，自引：0，他引：2

下载免费PDF全文

曾赛杜选民《应用声学》2019,38(4):589-595

水下目标的分类识别对于水声探测具有重要意义。提出一种水下目标多模态深度学习分类识别方法。针对水声信号的一维时域模态和二维频域模态特征建立一种多模态特征融合的深度学习结构,结合长短时记忆网络和卷积神经网络的优点,对一维时域信号和二维频谱信号分别进行并行处理,对输出进行典型相关分析,形成特征融合表示,并利用相邻帧的相关性进行参数优化。利用实测水声信号对算法进行了验证。结果表明：提出的算法对于水下目标识别的精度有显著的提高。相似文献

8.

结合注意力机制的改进U-Net网络在端到端语音增强中的应用

下载免费PDF全文

武瑞沁陈雪勤俞杰王丽荣赵鹤鸣《声学学报》2022,47(2):266-275

设计了一个适用于端到端语音增强的改进的U-Net (Attention Dilated Convolution U-Net,ADC-U-Net)网络模型.与基线U-Net网络相比,一方面通过加入空洞卷积减小由采样带来的信息损失;另一方面引入了注意力机制结构,结合了含噪语音更多的上下文信息,提取更深层次和更丰富的特征信息... 相似文献

9.

结合深度学习的非下采样剪切波遥感图像融合

下载免费PDF全文

陈清江李毅柴昱洲《应用光学》2018,39(5):655-666

遥感图像融合是指将不同传感器得到的具有不同观测特性的图像信息有选择、有策略地结合起来,以得到具有更优观测特性的新图像的方法。提出一种深度学习结合非下采样剪切波变换(NSST)的遥感图像融合算法,利用改进的超分辨率重建网络对多光谱图像(MS)进行空间分辨率增强,全色图像(PAN)参考重建后的多光谱图像的每个分量进行直方图匹配。将对应通道的图像进行NSST变换,分别得到低频子带和若干高频子带。低频子带通过使用基于梯度域的自适应加权平均规则来获得低频融合系数,高频子带采用局部空间频率最大值规则来获得高频融合系数,最后经逆NSST变换重构获得融合图像。对不同数据集中的City和Inland多光谱图像采用双三次插值方法进行上采样,作者提出算法的通用图像质量指数(UIQI)分别为0.988 6和0.932 1,光谱角映射(SAM)分别为1.872 1和2.143 2。实验结果表明,图像结构更加清晰,保存的光谱信息更加完整,融合图像质量优于对比算法,融合图像更利于人类视觉观察。相似文献

10.

基于Mask RCNN的桥梁裂缝检测方法设计及研究北大核心CSCD

廖延娜豆丹阳《应用光学》2022,43(1):100-105

裂缝是桥梁道路上常见的一种病害,针对其检测准确率有待提高的问题,提出了基于Mask RCNN(region-based convolutional neural networks)的桥梁裂缝检测算法,设计了语义增强模块(semantic enhancement module,SEM),将该模块与特征金字塔网络(feature pyramid network,FPN)相结合,通过特征融合Add计算得到新的多尺度特征图feature maps。针对裂缝形态复杂多样存在识别困难的问题,将裂缝做了两类划分进行检测,并制定了两种策略进行对比实验。实验结果表明:该文中改进的方法可以得到更好的检测结果,检测准确率Accuracy可达99.8%,平均检测精度(mean average precision,mAP)提高了12.6%。相似文献

11.

基于密集梯度生成对抗网络的偏振图像融合算法北大核心CSCD

张昊段锦刘举高美玲郝有菲陈广秋《光学技术》2023,(3):354-360

针对单幅偏振图像在一定场景下无法提供充足信息的问题,结合强度图像和线偏振度图像的优势特征,提出一种基于密集梯度生成对抗网络的偏振图像融合算法。利用密集连接卷积网络和梯度算子构建密集梯度卷积模块,并将该模块应用在生成器中,用以增强融合图像的纹理细节;构造多尺度结构相似度和L1范数相结合的损失函数,用以提高网络的整体性能。在ZJU-RGB-P数据集进行定性比较和定量分析,实验结果表明,所提算法具有更好的主观视觉感受,同时各项评价指标均得到明显提升。相似文献

12.

基于双通道残差密集网络的红外与可见光图像融合

冯鑫杨杰铭张鸿德邱国航《光子学报》2023,(11):285-296

为改善红外与可见光融合结果与源图像间的部分细节特征丢失问题,充分提取红外与可见光图像中的特征信息,提出了一种改进的双通道深度学习自编码网络进行红外与可见光图像融合。其中,双通道结构由密集连接和残差连接模块级联构成,并设置一种综合像素、结构相似度和梯度特征保留的损失函数,使该编码器结构可以充分提取红外与可见光图像的多层次特征,在融合层采用空间L1范数和注意力机制对级联双通道特征分别进行融合,最后设计对应的解码器对融合特征图像进行重构,获取最终的融合结果。通过与传统算法以及近年最新的深度学习算法进行实验对比,结果表明该方法在主观和客观上都具有优秀的综合性能。相似文献

13.

基于改进二阶段检测网络的长时跟踪重检测方法

下载免费PDF全文

赵年甫王霖王向军陈文亮《应用光学》2023,(4):768-776

为构建适用于长时跟踪的重检测模块,受改进二阶段检测网络的GlobalTrack方法的启发,提出了一种高效的对特定模板目标进行端到端重检测的深度网络：首先,为了在大尺度图像上更高效地融合模板特征,通过构造交叉信息增强模块改进深度互相关方法,利用交叉通道注意力信息编码搜索特征和模板特征;此外,采用动态实例交互模块替代传统二阶段网络的RPN(region proposal network)和RCNN(region-based convolutional neural networks)结构,根据模板信息指导检测网络的分类和回归阶段,构建了端到端的稀疏重检测结构。在LaSOT和OxUva长时跟踪数据集上进行对比实验,本文方法相较于原始方法性能提升3%,实时帧率提升173%。实验结果表明,改进后的方法可以在全图范围内更准确、快速地重新检测模板目标。相似文献

14.

基于改进SSD的车辆小目标检测方法

李小宁雷涛钟剑丹唐自力蒋平《应用光学》2020,41(1):150-155

地面车辆目标检测问题中由于目标尺寸较小,目标外观信息较少,且易受背景干扰等的原因,较难精确检测到目标。围绕地面小尺寸目标精准检测的问题,从目标特征提取的角度提出了一种特征融合的子网络。该子网络引入了重要的局部细节信息,有效地提升了小目标检测效果。针对尺度、角度等的变换问题,设计了基于融合层的扩展层预测子网络,在扩展层的多个尺度空间内匹配目标,生成目标预测框对目标定位。在车辆小目标VEDAI(vehicle detection in aerial imagery)数据集上的实验表明,算法保留传统SSD(single-shot multibox detector)检测速度优势的同时,在精度方面有了明显提升,大幅提升了算法的实用性。相似文献

15.

基于双模态融合网络的目标检测算法

孙颖侯志强杨晨马素刚范九伦《光子学报》2023,(1):203-215

针对红外图像和可见光图像的融合目标检测问题,提出一种基于双模态融合网络的目标检测算法。在同时输入红外和可见光图像对后,利用设计的红外编码器提取红外图像空间特征信息;通过设计的可见光编码器将可见光图像从垂直和水平两个空间方向聚合特征,通过精确的位置信息对通道关系进行编码;最后,采用提出的门控融合网络自适应调节两路特征的权重分配,实现跨模态特征融合。在KAIST行人数据集上,与基准算法YOLOv5-n单独检测可见光图像和红外图像的结果相比,所提算法检测精度分别提升15.1%和2.8%;与基准算法YOLOv5-s相比,检测精度分别提升14.7%和3%;同时,检测速度在两个不同基准算法模型上分别达到117.6 FPS和102 FPS。在自建的GIR数据集上,所提算法的检测精度和速度也同样具有明显优势。此外,该算法还能对单独输入的可见光或红外图像进行目标检测,且检测性能与基准算法相比有明显提升。相似文献

16.

基于注意力融合的目标跟踪算法

蒋汇丰王栋高山《光学与光电技术》2024,(2):83-91

针对基于孪生网络的目标跟踪算法存在抗干扰能力弱、鲁棒性差等问题,在SiamCAR基础上提出通道和空间注意力融合的目标跟踪算法。在特征提取子网络和分类回归子网络之间级联改进后的高效通道注意力和空间注意力模块,加强网络对互相关后响应图中重要通道特征和位置特征的关注,同时抑制不重要的特征信息。在OTB100上,所提算法在背景杂乱挑战下成功率和精度相比SiamCAR分别提高了3.1%和2.8%;在VOT2018上,所提算法的鲁棒性和期望平均重叠率相比SiamCAR分别提高了4.9%和2.2%。实验结果表明,所提算法增强了跟踪器的鲁棒性,提升了跟踪器在复杂场景下的跟踪效果。相似文献

17.

基于稀疏原子融合的RGB-D场景图像融合算法

刘帆刘鹏远张峻宁徐彬彬《光学学报》2018,(1)

针对当前彩色图像和深度图像(RGB-D)特征融合困难、联合识别效率不高的问题,提出了一种结合K奇异值分解(KSVD)和最大相关最小冗余准则(mRMR)的RGB-D场景图像融合算法。该算法首先采用KSVD稀疏图像的特征,将稀疏系数对应的字典原子作为特征融合的参数,以完整地表达图像的全部信息;之后采用互信息的mRMR原则求取维度最小且各维度之间相关性最小的特征原子组合;最后通过最大化原则融合特征原子对应的稀疏系数,从而完成了两种图像之间的有效信息融合。实验结果表明,该算法在信息熵、互信息和边缘保持度等方面比主成分分析-K奇异值分解和非下采样轮廓变换-K奇异值分解融合算法更有优势,有效提高了图像目标的识别准确率和成功率。相似文献

18.

结合图像语义分割的增强现实型平视显示系统设计与研究

安喆徐熙平杨进华乔杨刘洋《光学学报》2018,(7)

为了提高驾驶员在车辆行驶过程中的安全性,设计了一种结合图像语义分割的增强现实型平视显示(ARHUD)系统。首先,提出一种改进的单发多框检测器网络对道路场景图像进行语义分割,网络前端采用VGG-16提取图像特征,网络后端对获取的特征图进行上采样,从而对特征图进行像素分割。通过对网络的训练,得到场景目标的像素级分类结果,即环境的语义内容信息。随后,通过分析真实场景、光学显示系统、驾驶员之间的关系,将计算机产生的虚拟信息叠加到真实场景,并将显示内容注册到驾驶员视野中,从而提高行车安全。实验结果表明,语义分割算法的准确率能达到77.8%,虚实注册算法处理每帧图像的时间平均为45ms,约22frame·s-1。相似文献

19.

注意力机制融合前端网络中间层的语声情感识别

下载免费PDF全文

朱应俊周文君朱川马建敏《应用声学》2023,42(5):1090-1098

为了使机器能够更好地理解人的情感并改善人机交互体验,可对语声特征及分类网络进行融合以提升情感识别性能。本文从网络融合的角度,把基于梅尔倒谱系数和逆梅尔倒谱系数的二维卷积神经网络和基于散射卷积网络系数的长短期记忆网络作为前端网络,提取前端网络的中间层作为话语级的特征表示,利用压缩-激励(SE)通道注意力机制对前端网络的中间层的权重进行调整并融合,然后由深度神经网络后端分类器输出情感分类结果。在汉语情感数据集中进行五折交叉验证的对比实验,实验结果表明,基于SE通道注意力机制的网络融合方式可以有效地利用不同前端网络在语声情感识别任务中的优势,提高语声情感识别的准确率。相似文献

20.

非下采样变换的红外与可见光图像融合 总被引：1，自引：0，他引：1

陈小林王延杰《中国光学与应用光学文摘》2011,(5)

基于非下采样Contourlet变换(NSCT),提出了一种红外和可见光图像融合算法。针对低频子带系数和各带通方向子带系数分别提出了基于图像物理特征的系数加权选择方式与基于区域能量匹配的系数选择方式,即低频基于区域梯度信息、高频基于区域特征因子的加权与选择结合的图像融合算法。实验结果表明:非下采样Contourlet变换具有较快的运算速度,且经非下采样变换后能量更加集中,可提供更多的图像信息。相对于基于像素的图像融合算法,本文的图像融合算法具有更高的融合性能,是一种更适合图像融合的多尺度几何分析(MGA)工具。相似文献