期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

基于扩张卷积注意力神经网络的高光谱图像分类 总被引：1，自引：0，他引：1

《光学学报》2021,41(3):43-53

为了解决训练样本有限情况下高光谱图像分类精度低的问题,提出了一种结合扩张卷积与注意力机制的三维-二维串联卷积神经网络模型。首先,该模型以串联的三维-二维卷积神经网络作为基础结构,利用三维卷积同时提取高光谱图像的空谱特征,并采用二维卷积进一步提取高级空间语义信息;然后,通过引入扩张卷积增大卷积核感受野,构建了多尺度特征提取结构,实现了多尺度特征的融合;最后,利用注意力机制使网络关注重要的空谱特征,并抑制噪声和冗余信息。在两个常用数据集上对本文算法和四种基于深度学习的分类算法进行对比实验,结果表明,所提模型取得了最准确的分类结果,有效提高了训练样本有限条件下的分类精度。相似文献

2.

融合全局和局部深度特征的高分辨率遥感影像场景分类方法

龚希吴亮谢忠陈占龙刘袁缘俞侃《光学学报》2019,39(3):11-21

提出了一种融合全局和局部深度特征(GLDFB)的视觉词袋模型。通过视觉词袋模型将深度卷积神经网络提取的多个层次的高层特征进行重组编码并融合,利用支持向量机对融合特征进行分类。充分利用包含场景局部细节信息的卷积层特征和包含场景全局信息的全连接层特征,完成对遥感影像场景的高效表达。通过对两个不同规模的遥感图像场景数据集的实验研究表明,相比现有方法,所提方法在高层特征表达能力和分类精度方面具有显著优势。相似文献

3.

语音情感识别中的特征选择方法

褚钰李田港叶硕叶光明《应用声学》2020,39(2):223-230

为了解决传统卷积神经网络在识别中文语音时预测错误率较高、泛化性能弱的问题,首先以深度卷积神经网络(DCNN)-连接时序分类(CTC)为研究对象,深入分析了不同卷积层、池化层以及全连接层的组合对其性能的影响;其次,在上述模型的基础上,提出了多路卷积神经网络(MCNN)-连接时序分类(CTC),并联合SENet提出了深度SE-MCNN-CTC声学模型,该模型融合了MCNN与SENet的优势,既能加强卷积神经网络的深层信息的传递、避免梯度问题,又可以对提取的特征图进行自适应重标定。最终实验结果表明:SE-MCNN-CTC相较于DCNN-CTC错误率相对降低13.51%,模型最终的错误率达22.21%;算法改进后的声学模型可以有效地提升泛化性能。相似文献

4.

采用GAF-D3Net深度学习网络的水下目标有源识别方法

周天司吉坤杜伟东于晓阳《声学学报》2023,(5):950-958

提出一种基于格拉姆角场(GAF)和卷积神经网络(CNN)的水下目标有源识别方法。该方法利用GAF将目标回波信号编码为二维图像,使用空洞卷积构建轻量级的卷积神经网络GAF-D3Net实现对目标的特征提取与分类识别。实验表明,与基于传统图像特征的分类方法相比,所提方法的分类精度有显著提高,达到99.65%。在泛化性测试中,对比了经典CNN使用声呐图像的迁移学习方法,本文方法的曲线下面积(AUC)达到89%,具有更好的泛化性能以及抗干扰能力,为实现水下目标有源识别提供了一种可靠方法。相似文献

5.

基于可见/近红外光谱和深度学习的早期鸭胚雌雄信息无损检测 总被引：1，自引：0，他引：1

LI Qing-xu WANG Qiao-hua MA Mei-hu XIAO Shi-jie SHI Hang 《光谱学与光谱分析》2021,41(6):1800-1805

胚蛋雌雄识别一直是家禽业发展的瓶颈问题,在禽肉生产过程中倾向于养殖雄性个体,而禽蛋生产产业倾向于养殖雌性家禽。若能在孵化过程中较早鉴别出种蛋的雌雄,不仅能够降低家禽孵化产业的成本,还能够提高禽蛋和禽肉生产行业的经济效益。该文以种鸭蛋为研究对象,为了在种鸭蛋孵化早期实现对种蛋的雌雄识别,构建了可见/近红外透射光谱信息采集系统,在200～1 100 nm的波长范围内采集了345枚孵化了0~8 d的种鸭蛋光谱数据。搭建了适用于种鸭蛋光谱信息的6层卷积神经网络（convolutional neural network, CNN）,其中包括输入层、3个卷积层、全连接层与输出分类层。卷积层可以提取光谱中的有效信息,全连接层通过对卷积层提取的局部特征进行整合供输出层分类决策。另外在卷积神经网络中引入局部响应归一化和dropout操作能够加快网络的收敛速度。利用该卷积神经网络构建鸭胚雌雄信息识别网络,通过对比与分析不同孵化天数的识别效果,发现孵化7d的识别效果最佳。随后将孵化7 d的种鸭蛋原始光谱数据进行噪声去除,选取500~900 nm波段用于后续的特征波长选取和建模。分别运用了竞争性自适应重加权算法(CARS)、连续投影算法( SPA)与遗传算法(GA)选择能够区分鸭胚性别的波长点,将选取的特征波长转换为二维的光谱信息矩阵,二维光谱信息矩阵保留了一维光谱的有效信息,同时极大地方便了与卷积神经网络的结合。利用二维光谱信息矩阵和卷积神经网络相结合,实现孵化早期阶段鸭胚的雌雄识别。经检验,基于 SPA算法和CNN网络建立的模型效果较佳,其中训练集、开发集及测试集的准确率分别为93.36%,93.12%和93.83%;基于GA算法和CNN网络建立的模型效果次之,训练集、开发集及测试集的准确率分别为90.87%,93.12%和86.42%;基于CARS算法和CNN网络建立的模型的训练集、开发集及测试集的准确率分别为84.65%,83.75%和77.78%。研究结果表明基于可见/近红外光谱技术和卷积神经网络可以实现孵化早期鸭胚胎雌雄的无损鉴别,为后续相关自动化检测装置的研发提供了技术支撑。相似文献

6.

基于特征重聚焦网络的多尺度近岸舰船检测

刘荻张焱赵琰石志广张景华张宇《光学学报》2021,41(22):129-141

针对监控视频中的多尺度近岸舰船检测问题,提出了一种基于特征重聚焦网络的舰船目标检测算法,设计了由多维特征聚合模块(MFAM)与注意力特征重构模块(AFRM)组成的特征重聚焦策略.其中,MFAM基于输入的特征金字塔构建特征聚合块,进一步融合多尺度舰船不同层次特征的语义信息.AFRM基于多分支空洞卷积以及通道与空间注意力机制提升网络对目标非局部信息的表征和对背景干扰的抑制,并构建了用于目标检测的特征重聚焦金字塔.在Seaships7000舰船公开数据集上的实验结果表明,相比其他算法,本算法对监控视频中多尺度近岸舰船的检测效果更好. 相似文献

7.

一维空洞卷积神经网络的矿物光谱分类

田青林郭帮杰叶发旺李瑶刘鹏飞陈雪娇《光谱学与光谱分析》2022,42(3):873-877

矿物光谱综合反映了岩矿的物理化学特性、组分和内部结构特征,已被应用于岩矿识别研究。传统的矿物光谱分类方法需要先对矿物光谱进行预处理,再采用不同方法分析光谱特征,从而实现分类目的。但同时也会造成部分光谱信息丢失,导致最终分类精度不高且操作过程繁琐、效率低下,难以应对日益增长的大数据处理需求。因此,建立一个准确、高效的矿物光谱自动分类模型意义重大。卷积神经网络是应用最广泛的深度学习模型之一,它通过逐层抽取数据特征并组合形成高层语义信息,具有极强的模型表达能力,在光谱数据分析方面应用潜力巨大。针对矿物光谱数据的特点,提出了基于一维空洞卷积神经网络（1D-DCNN）的矿物光谱分类方法,利用空洞卷积神经网络提取光谱特征,采用反向传播算法结合随机梯度下降优化器调整模型参数,输出光谱分类结果,实现了矿物类别的端到端检测。该网络包含1个输入层、3个空洞卷积层、2个池化层、2个全连接层和1个输出层,采用交叉熵为损失函数,引入空洞卷积扩大滤波器感受野,有效避免光谱细节特征丢失。实验采集了白云母、白云石、方解石、高岭石四种矿物光谱,并通过添加噪声的方式进行数据增强,构建数量充足的矿物光谱样本用于神经网络模型训练与测试;探讨了卷积类型、迭代次数对模型分类结果的影响,并与多种传统矿物光谱分类方法进行对比,评价模型性能。实验结果表明,提出的1D-DCNN模型可实现矿物光谱快速准确分类,分类准确率达到99.32%,优于反向传播算法（BP）和支持向量机（SVM）,说明所提方法能够充分学习矿物光谱特征并有效分类,且模型具有良好的鲁棒性和可扩展性。该方法也可推广到煤炭、油气、月壤等其他领域光谱分类应用中。相似文献

8.

基于一维卷积神经网络的光纤周界入侵模式识别

《光子学报》2021,50(9)

针对干涉型分布式光纤传感系统,在通过Mel倒谱系数方法提取扰动信号频域特征进行模式识别的研究基础上,提出了一种基于一维卷积神经网络的光纤入侵模式识别方法。利用还原信号的分级阈值判断并提取入侵信号,有效减少了分帧方法导致的计算时间;构建了基于入侵信号傅里叶变换后的频域信息的一维卷积神经网络,自适应地提取扰动的信号频域特征。搭建了基于直线型Sagnac干涉结构的入侵检测系统,利用大量实验采集的样本数据集对网络进行训练,得到了较好的分类识别结果,测试集的平均识别率达到了96.5%,并对训练后网络的卷积核以及经过卷积核后的入侵信号进行了分析。zscore标准化后,一维卷积神经网络能够识别信号频域中的部分特征,对频率成分复杂的树枝拍打信号识别效果提升较大。相似文献

9.

自适应尺度信息的U型视网膜血管分割算法

梁礼明盛校棋蓝智敏杨国亮陈新建《光学学报》2019,39(8):118-132

针对视网膜血管形态结构和尺度信息复杂多变的特点,提出一种自适应血管形态结构和尺度信息的U型视网膜血管分割算法。首先采用二维K-L(Karhunen-Loeve)变换(即霍特林变换)综合分析彩色图像三通道的频带信息,从而得到视网膜灰度图像以及多尺度形态学滤波增强血管与背景的对比度信息。然后将预处理图像经U型分割模型对图像进行端对端训练,并利用局部信息熵采样进行数据增强。该网络编码部分的密集可变形卷积结构根据上下特征层信息有效地捕捉图像中多种尺度信息和形状结构,底部金字塔型的多尺度空洞卷积扩大局部感受野,同时解码阶段带有Attention机制的反卷积网络将底层与高层特征映射有效结合,解决权重分散和图像纹理损失的问题。最后通过SoftMax激活函数得到最终的分割结果。在DRIVE(Digital Retinal Images for Vessel Extraction)与STARE(Structured Analysis of the Retina)数据集上对该算法进行了仿真,准确率分别达到97.48%与96.83%,特异性分别达到98.83%与97.75%,总体性能优于现有算法。相似文献

10.

基于编码-解码卷积神经网络的遥感图像语义分割

《光学学报》2020,(3)

农村地区遥感图像语义分割是进行城乡规划、植被以及农用地检测的基础。农村地区高分辨率遥感图像含有较为复杂的地物信息,对其进行语义分割难度较大。基于此,提出一种改进的对称编码-解码网络结构SegProNet,利用池化索引与卷积融合语义信息及图像特征,通过1×1卷积构建Bottleneck层进一步提取细节、减少参数量,逐步加深过滤器深度以构建端到端的语义分割网络,改进激活函数进一步提升网络性能。实验结果表明,在CCF卫星数据集上,所提方法及经典语义分割网络U-Net、SegNet的准确率分别为98.4%,80.3%,98.1%,所提方法较其他方法更优。相似文献

11.

基于3D Octave卷积和Bi-RNN注意力网络的高光谱图像分类方法

《光子学报》2021,50(9)

传统卷积神经网络模型在高光谱图像分类生成特征图的空间维度中存在大量的空间特征信息冗余,而且把高光谱图像单个像元上的光谱带数据看作是无序高维向量进行数据处理,并不符合光谱数据的特性,极大影响了模型的运行效率和分类性能。针对该问题,提出一种三维Octave卷积和双向循环神经网络注意力网络相结合的高光谱图像分类方法。首先,利用三维Octave卷积获取高光谱图像的空间特征的同时减少空间特征冗余信息。其次,利用Bi-RNN光谱注意力网络将光谱带数据视为有序序列以获取高光谱图像的光谱信息。然后,通过全连接层将空间和光谱特征图连接起来实现特征融合。最后,经过softmax输出分类结果。实验结果表明,所提方法在Pavia University和Botswana两个数据集上的分类精度分别达到了99.97%和99.79%,与其他主流算法相比,该方法可以充分利用空间和光谱特征信息,具有更佳的分类性能。相似文献

12.

基于卷积神经网络的混合颗粒分类法研究

蔡杨苏明旭蔡小舒《光学学报》2019,39(7):115-124

针对混合颗粒的分类问题,传统算法多利用颗粒的二值化图像提取其特征,并通过精细的特征设计结合BP神经网络、支持向量机(SVM)等分类器进行分类,但颗粒粘连以及不精确的特征设计都会严重影响分类的准确率。利用卷积神经网络提取颗粒的特征,通过区域建议网络(RPN)搜索颗粒的位置,同时建立分类器,并结合全卷积网络实现像素级的颗粒分割。对由球形、长条形及非规则形颗粒组成的混合流动颗粒体系进行实验研究,结果表明:利用人工特征设计的SVM法可以达到87%的分类精确率和召回率,而基于卷积神经网络的方法则可以达到97%的分类精确率和93%的召回率,并且对于非规则颗粒的数目中位径,该方法不仅可以将分析误差降低11%以上,还避免了传统方法需要精确设计人工特征等的不足,更易形成一个端对端的混合颗粒分类体系,为流动混合颗粒的图像在线分析提供了更加有效的思路。相似文献

13.

视频监控下利用改进型C3D-RF的人群异常行为检测

《光学技术》2021,47(2):187-195

传统基于卷积神经网络(CNN)算法的人群异常行为检测方法由于采用二维卷积核提取图像特征,故无法准确捕捉视频流在时序上的动态特征。为此,提出一种基于改进C3D网络与随机森林(RF)算法相结合的检测方法。利用具有时间特征捕捉能力的C3D网络进行视频流梯度方向直方图(HOG)特征提取,并作为三维卷积核输入以实现对视频时空特征的提取;使用随机森林分类器替代softmax全连接层以避免训练过程中繁琐的梯度计算操作,并降低对训练数据集样本规模的要求;基于基准数据集的算例结果表明,所提出的改进C3D-RF方案对人群异常行为的检测准确率保持在90%以上,且与传统C3D网络、支持向量数据描述模型(SVDD)、编码深度卷积神经网络(CAE)等方法相比,其训练时间缩短了15.34%以上。相似文献

14.

基于卷积神经网络和高光谱成像技术的多宝鱼新鲜度鉴别

章海亮周孝文刘雪梅罗微詹白勺潘璠《光谱学与光谱分析》2024,(2):367-371

鱼类产品新鲜度鉴别一直是重要的研究课题,相较于目前常规鱼类品质检测方法存在的成本高、检测时间长等问题,高光谱成像技术(HSI)因其无损、快速等优势得到了学者的广泛研究。卷积神经网络是深度学习中应用较为广泛的模型,表达能力强,模型效率高。因此,使用卷积神经网络(CNN)结合高光谱成像技术建立多宝鱼新鲜度鉴别模型。采集160个多宝鱼样本感兴趣区域(ROI)光谱,并根据样本不同冻融次数和冷冻时间分为5类新鲜度。以VGG11网络为基础,针对光谱数据特点对网络结构进行调整,减少全连接层数量,降低模型的复杂度,分别对比不同卷积核个数、激活函数对分类性能造成的影响,确定最佳CNN网络结构。由于高光谱数据量大同时存在的冗余信息较多,分别采用无信息变量消除算法(UVE)和随机青蛙算法(RF)对高光谱数据进行波长筛选,将波长筛选后的高光谱数据分别输入卷积神经网络(CNN)、最小二乘支持向量机(LS-SVM)、 K最近邻算法(KNN)建立模型。采用无信息变量消除(UVE)提取的165个特征波长建立的UVE-CNN模型鉴别效果最佳,分类模型在测试集上的精度达到了100%。结果表明,利用卷积神经网络与高光谱成像... 相似文献

15.

高光谱成像的图谱特征与卷积神经网络的名优大米无损鉴别 总被引：1，自引：0，他引：1

《光谱学与光谱分析》2020,(9)

名优大米含有更多的营养价值与更高的经济价值,不法商家为赚取更多利益,对优质大米掺假甚至以次充好,损害了消费者利益和大米贸易,打击了生产者的生产积极性。希望发展一种基于高光谱成像的图谱特征与深度学习网络的名优大米无损鉴别方法。首先,采集了全国具有代表性的七种名优大米400～1 000 nm范围高光谱图像,并提取了每种大米的光谱、纹理与形态特征。使用多元散射校正算法做光谱预处理消除光谱散射。连续投影算法(SPA)、竞争自适应重加权算法(CARS)以及两者级联方法(CARS-SPA)被用来选取光谱特征的重要波长;用SPA选择形态、纹理特征的重要变量。最后,使用深度学习网络-卷积神经网络(CNN)融合各类特征构建大米种类识别模型,而K-近邻(KNN)、随机森林(RF)用于与CNN模型相对比。实验结果显示,根据全光谱构建的模型的分类准确度达到80%以上;其中, KNN建模效果最差; RF的效果较好; CNN网络的模型性能最优,训练集的分类准确度(ACC_T)为92.96%,预测集的分类准确度(ACC_P)为89.71%。而重要波长光谱与全光谱相比,分类准确度相差较多。为进一步提升大米种类鉴别的准确度,选用纹理、形态两种图像特征与光谱特征进行融合,最优结果来自光谱与形态特征重要变量所构建的模型。其中, KNN的ACC_T和ACC_P分别为69%和67%; RF模型的ACC_T=99.98%和ACC_P=89.10%; CNN模型的效果最佳, ACC_T和ACC_P为97.19%和94.55%。此外,光谱与纹理融合的分类效果差于光谱,说明纹理特征弱化了分类结果。对于分类模型来说, CNN的性能明显优于两种机器学习方法,可以提供更好的分类效果。总而言之, CNN融合光谱与形态特征重要变量可实现对名优大米种类的准确鉴别,这种方法有望拓展到其他农产品的分级,种类区分和产地鉴别。相似文献

16.

融合多尺度局部特征与深度特征的双目立体匹配 总被引：2，自引：0，他引：2

王旭初刘辉煌牛彦敏《光学学报》2020,(2):113-125

针对立体匹配中不适定区域难以找到精确匹配点的问题,提出一种融合多尺度局部特征与深度特征的立体匹配方法。特征融合阶段包括两部分,其一是融合不同尺度下Log-Gabor特征和局部二值模式特征组合的浅层次特征,其二是将多尺度浅层融合特征和卷积神经网络提取的深度特征进行级联,形成既包含语义信息又包含结构化信息的特征图像。通过在极线垂直方向添加不同强度的噪声来构造正负样本,减小图像中极线对齐欠准带来的误差。将该方法与两种变体方法(改变或舍弃部分模块)在KITTI数据集进行对比实验,结果表明各模块设置具有合理性;与一些经典方法相比,所提方法取得了有竞争力的匹配性能。相似文献

17.

全卷积网络多层特征融合的飞机快速检测 总被引：1，自引：0，他引：1

辛鹏许悦雷唐红马时平李帅吕超《光学学报》2018,(3)

针对传统飞机检测方法准确率低、虚警率高、速度慢等问题,提出一种全卷积神经网络多层特征融合的飞机快速检测方法。将浅层和深层的特征经过采样后在同一尺度进行融合,以缓解由于深层特征图维度过低造成的对小目标表达不足的问题;修改区域提取时的选框尺寸以适应实际图像中飞机的尺寸特征;用卷积层代替全连接层以减少网络参数并适应不同大小的输入图像;复用区域提取网络和检测网络的卷积层和学习的特征参数以保证检测的高效性。仿真结果表明,与典型的飞机检测方法相比,所提方法在测试集上取得了更高的准确率和更低的虚警率,同时大大加快了检测速度。相似文献

18.

基于磁共振图像和改进的UNet++模型区分阿尔茨海默症患者和健康人群

赵尚义王远军《波谱学杂志》2020,37(3):321-331

阿尔茨海默症（Alzheimer's Disease，AD）是一种神经退行性疾病，高效准确的早期诊断对其治疗至关重要．本文提出了一种融合多语义级别的深度卷积神经网络结构，基于磁共振图像，用于区分AD患者与正常受试者的方法．首先，在传统UNet++网络的基础上改进了深度监督整合算法；然后，构建了一种新的特征融合结构，进一步细化了不同语义级别的特征；最后，基于不同组织区域（白质、灰质和脑脊液）的磁共振图像，使用本文所提出的方法区分AD患者和正常受试者，并探究了从不同组织获得的信息对分类准确率的影响．实验结果表明，使用本文提出的方法区分两类人群的最高准确率为98.74%，平均准确率为98.47%，高于目前文献报道的其他方法．相似文献

19.

基于GADF变换和多尺度CNN的哈密瓜表面农药残留可见-近红外光谱判别方法

YU Guo-wei MA Ben-xue CHEN Jin-cheng DANG Fu-min LI Xiao-zhan LI Cong WANG Gang 《光谱学与光谱分析》2021,41(12):3701-3707

针对哈密瓜表面农药残留化学检测方法成本高且具有破坏性等问题,探索了可见-近红外（Vis-NIR）光谱技术对农药残留定性判别的可行性。以哈密瓜为载体,百菌清和吡虫啉农药为研究对象,采集哈密瓜表面无残留、百菌清和吡虫啉残留的可见-近红外漫反射光谱,利用格拉姆角场（GAF）将一维光谱数据转换为二维彩色图像,构建GAF图像数据集。设计一种包含Inception结构的多尺度卷积神经网络模型用于哈密瓜表面农药残留种类判别,包括1层输入层、3层卷积层、1层融合层、1层平坦层、2层全连接层和1层输出层。模型测试混淆矩阵结果表明,格拉姆角差场（GADF）变换对哈密瓜表面农药残留的可见-近红外光谱表达能力较强。此外,构建AlexNet、VGG-16卷积神经网络（CNN）模型和支持向量机（SVM）、极限学习机（ELM）机器学习模型与提出的多尺度CNN模型进行性能对比。结果表明,3种CNN模型对哈密瓜表面有无农药残留的判别效果较好,综合判别准确率均高于SVM和ELM模型。对比3种CNN模型性能,多尺度CNN模型的性能最佳,训练耗时为14 s,综合判别准确率为98.33%。多尺度CNN模型结构利用多种小尺寸滤波器组合（1×1,3×3和5×5）和并行卷积模块,能够捕获不同层次和尺度的特征,通过级联融合模式进行深度特征融合,提高了模型的特征提取能力。与传统深度CNN模型相比,在保证计算复杂度不变的情况下,多尺度CNN模型的精度得到了有效提高。实验结果表明,GADF变换结合多尺度CNN模型可以有效进行光谱数据解析,利用可见-近红外光谱技术可以实现哈密瓜表面农药残留的定性判别。研究结果为大型瓜果表面农药残留的快速无损检测技术的研发提供了理论参考。相似文献

20.

基于深度学习的铸件X射线图像分割研究

下载免费PDF全文

曹富强王明泉张俊生邵亚璐张雪洋《应用光学》2021,42(6):1025-1033

针对当前图像分割算法在实现工业铸件内部缺陷分割上精度低且算法不够轻量化的问题,提出一种基于改进DeepLabv3+的工业铸件内部缺陷检测算法Effi-DeepLab。该方法采用EfficientNet中的MBConv来代替原有的Xception模块进行特征提取,使特征提取网络更加高效与轻量化;针对工业铸件内部缺陷尺寸小的问题,重新设计空洞空间金字塔池化（ASPP）层中空洞卷积的扩张率,使得卷积块对小目标具有更高的鲁棒性;在解码端充分利用特征提取阶段的低阶语义信息进行多尺度特征融合,以提高小目标缺陷分割的精度。实验结果表明,在本文使用的汽车轮毂内部缺陷图像数据集中,Effi-DeepLab模型对缺陷的分割准确率和平均交并比（mIoU）分别为93.58%和89.39%,相比DeepLabv3+分别提升了2.65%和2.24%,具有更好的分割效果;此外,还通过实验验证了本文提出算法具有良好的泛化性。相似文献