期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

郑雯沈琪浩任佳《光学学报》2021,41(22):64-75

针对糖尿病性视网膜图像数据集的不均衡、组织形态的特征提取不充分、分级准确率不高等问题,本文提出一种基于DR-Net模型的改进识别算法,即Improved DR-Net.选用Kaggle失明检测竞赛数据集APTOS 2019 Dataset,采用多种数据增强策略扩充数据集,并引入Eye-PACS数据集进行无偏修正,同时采用高斯滤波等形态学方法增强眼底图像特征;对ResNext50聚合残差结构进行预训练,通过迁移学习对基线模型进行参数及结构微调;引入空洞卷积代替普通卷积,融合注意力机制进一步优化模型性能.测试结果表明,本文所提的Improved DR-Net模型大大提高了糖尿病视网膜病变分级的准确率:阳性预测值97.9％,阴性预测值98.03％,准确率达到98.04％,远高于同类算法.结合深度学习技术辅助视网膜病变的筛查,对于视网膜病变的早期自动筛查具有一定的指导意义. 相似文献

2.

基于深度迁移学习的脉冲涡流热成像裂纹缺陷检测

郝柏桥范玉刚宋执环《光学学报》2023,(4):146-154

提出一种迁移学习与深度学习相结合的钢板裂纹缺陷检测方法。首先,通过非负矩阵分解（NMF）建立红外缺陷数据集的目标域特征空间,以余弦相似度为衡量指标选取可见光缺陷数据集的源域样本,对深度学习模型进行预训练,并将模型权重参数迁移至目标域,实现相似领域的知识迁移;然后,在YOLO v5算法基础上引入自适应空间特征融合（ASFF）模块,提高缺陷检测精度。实验结果表明：所提方法对钢板脉冲涡流热成像裂纹缺陷的检测精度达到98.6%,可实现不同长度裂纹的准确识别与定位。相似文献

3.

基于深度注意力机制的多尺度红外行人检测

《光学学报》2020,(5)

针对多尺度目标检测问题,提出一种基于深度注意力机制的多尺度红外行人检测方法。首先,选取较为轻量级的Darknet53作为深度卷积特征提取的主干网络,设计四尺度的特征金字塔网络负责目标的定位和分类,通过引入更低层高分辨率的特征图来改善对小尺度行人目标的检测性能。其次,利用注意力模块替代特征金字塔网络中传统的上采样模块,生成基于卷积特征的局部显著图,可以有效抑制不相关区域的特征响应,突出图像局部特性。最后,利用Caltech行人数据集和U-FOV红外行人数据集进行两次迁移训练,以提高模型的泛化能力,丰富行人的样本特征。实验结果表明,所提方法在U-FOV数据集上的识别平均准确率达到了93.45%,比YOLOv3高26.74个百分点,能检测到的最小行人像素为6×13。在LTIR数据集上的定性实验结果验证,所提模型具有良好的泛化能力,适用于多尺度红外行人的检测。相似文献

4.

基于改进深度残差网络的计算断层扫描图像分类算法

《光学学报》2020,(3)

基于改进的深度残差网络(ResNet),提出更加适合肺部组织的计算断层扫描(CT)图像模式分类模型。为克服医学图像分析中可用数据集稀少的困难,采用迁移学习方法来减小神经网络模型对数据量大的需求,以减小过拟合。迁移学习的策略是将肺内大量可用的无标签区域作为预训练的数据,使用深度互信息最大化和先验分布匹配的方法进行无监督表征学习。通过对比实验发现,改进的深度ResNet可以得到更高的分类精度,迁移学习算法可以有效地利用肺内无标签区域的数据,从而提升网络模型的分类表现。相似文献

5.

基于拓展型特征金字塔的OLED像素缺陷检测方法

刘兰叶芸郭太良《光学学报》2023,(2):115-123

针对传统方式检测有机发光二极管（OLED）像素缺陷精度低以及成本高的问题,提出了一种基于拓展型特征金字塔网络（FPN）的喷墨打印OLED像素缺陷检测方法。首先对数据进行处理,获得喷墨打印OLED像素图像数据集,随后利用预训练模型ResNet18作为主干,选取其底层模块作为特征提取器,制定出更加适合打印像素缺陷的训练网络。通过将FPN进行拓展,使用具有丰富区域细节的大规模超分辨率特征来解耦像素缺陷检测,实现缺陷区域信息的获取与缺陷的像素级分割。实验中对比了不同方法在OLED像素数据集上的检测效果并评估了不同方法在几个缺陷类型上的性能。结果表明：所提出的方法对喷墨打印OLED像素缺陷的识别精度比直接使用FPN提升了5.5%（达到99.8%）,对缺陷区域的分割平均精度提升3.7%（达到88.8%）,且所提模型适用于小样本缺陷数据检测,具有研究价值和实践意义。相似文献

6.

类别非均衡遥感图像语义分割的全卷积网络方法

吴止锾高永明李磊薛俊诗《光学学报》2019,39(4):393-404

基于U-Net模型,提出了一个全卷积网络(FCN)模型,用于高分辨率遥感图像语义分割,其中数据预处理采用了数据标准化和数据增强,模型训练过程采用Adam优化器,模型性能评估采用平均Jaccard指数。为提高小类预测的准确率,模型中采用了加权交叉熵损失函数和自适应阈值方法。在DSTL数据集上进行了实验,结果表明所提方法将预测结果的平均Jaccard指数从0.611提升到0.636,可实现对高分辨率遥感图像端到端的精确分类。相似文献

7.

基于可见光谱的鱼苗体长估测方法研究

《光谱学与光谱分析》2020,(4)

在鱼苗养殖过程中,同一养殖池会出现个体大的鱼苗攻击个体小的鱼苗,个体小的鱼苗会出现伤病甚至死亡,造成经济损失,鱼苗分塘和售卖价格主要与其体长参数相关,因此需要对不同大小的鱼苗进行分离。鱼苗分类主要依赖于不同大小的网筛,费时费力,且容易对鱼苗造成损伤。针对传统人工分离方法效率低下并且缺乏科学指导的问题,本文提出了基于可见光谱的鱼苗体长估测方法研究,能够根据鱼苗图像计算鱼苗长度并进行分类。为了精确无损的获取鱼苗的体长,提出了基于迁移学习ResNet50模型的鱼苗体长估测方法。首先采集在同等高度条件下拍摄的不同长度鱼苗图像,同时手工测量鱼苗的实际长度作为数据集的标签,用四种迁移学习模型AlexNet, VGG16, GoogLeNet, ResNet50对鱼苗体长进行估算,通过验证集准确率,测试集准确率,以及不同方法的运行时间三个指标进行分析, AlexNet模型验证集准确率90.04%,测试集准确率89.82%,运行时间52 min 3 s; VGG16模型验证集准确率91.01%,测试集准确率91.17%,运行时间131 min 37 s; GoogLeNet模型验证集准确率88.02%,测试集准确率88.39%,运行时间45 min 2 s; ResNet50模型验证集准确率91.92%,测试集准确率91.09%,运行时间99 min 17 s;确定方法ResNet50。该模型具有50层的Residual Network架构,用迁移学习的方法将在ImageNet上训练得到的卷积层的参数传递到训练所使用的模型上,并调整softmax层适应本文问题。对来自10种不同长度的6 677个样本的鱼苗数据集上的实验结果表明该方法可以有效地用于鱼苗分类,通过对模型ResNet50的迁移学习的层数,迭代次数,学习率,最小批处理尺寸(Mini Batch Size)进行微调以优化模型。实验结果表明,当迁移学习模型的迁移层数为30,迭代次数为6,学习率为0.001, Mini Batch Size为10时,方法效果达到最优,模型的验证集准确率94.31%,测试集的准确率达到93.93%。该算法与传统的图像处理方法相比估算鱼苗体长准确率提高2%左右。在未来实际生产场景中,可以将该方法嵌套入鱼苗体长分离装置之中,真正的做到将科研落地,投入到实际的生产之中,减少鱼苗损伤,为未来的无人渔场奠定基础。相似文献

8.

基于生成对抗式神经网络的红外目标仿真方法

谢江荣李范鸣卫红李冰《光学学报》2019,39(3):142-148

提出了一种应用于红外目标仿真的模型。利用训练后的条件深度卷积生成对抗网络,只需输入随机噪声和类别标签,便能够自动产生预期类别的红外目标仿真图像。在手写数字数据集(MNIST)和红外数据集上分别训练模型参数,再进行自动生成实验,均可以产生高真实度的样本图像;将判别网络提取的特征用于分类实验,并将所提方法合成的图像用于数据增强,以提升分类器性能。研究结果表明,所提方法能够有效模仿红外辐射特征。相似文献

9.

视频监控下利用改进型YOLOv3的弱监督式异常行为检测

《光学技术》2021,47(1):120-128

为了对监控视频中的异常行为进行准确高效地检测,提出了一种利用改进型YOLOv3的弱监督式异常行为检测。采用多尺度融合的方式改进YOLOv3网络,利用改进型YOLOv3完成视频中的目标检测,提高计算效率与方法的通用性;利用光流可有效捕捉运动信息这一特性,提出大尺度光流直方图描述符(LSOFH)描述目标行为,以更好地提取异常行为特征;训练最小二乘支持向量机(LSSVM),用于识别监控视频中的异常行为。基于MATLAB仿真平台对所提方法进行实验论证,结果表明,相比于其他方法,所提方法在UCSD数据集、UMN数据集和地铁出口数据集上的表现最佳,曲线下面积(AUC)最大、等错误率(EER)最小且检测率最高,具有较好的应用前景。相似文献

10.

基于T分布混合模型的多光谱人脸图像配准

李巍董明利吕乃光娄小平《光学学报》2019,39(7):56-66

为了降低多光谱人脸图像中出现的非刚性形变、噪声和离群点等因素对配准结果的准确性和稳健性的影响,提出一种综合考虑特征点的空间几何结构和局部形状特征两方面信息的多光谱人脸图像配准方法。所提方法首先通过基于内部距离的形状上下文描述子来表述点集的局部特征信息,建立可见光和红外图像相似性测度函数。然后利用Student′s-T分布混合模型来表示图像特征点集配准过程中变换模型估计问题,并采用期望最大化算法对模型进行求解。仿真数据表明在点集存在非刚性形变、噪声和离群点的情况下,所提方法仍可以实现点集间的精确配准。可见光和红外人脸真实图像数据表明所提方法的平均匹配误差和运算效率都优于对比算法,配准融合后的多光谱人脸图像可以提高后续的人脸检测和识别性能。相似文献

11.

基于Encoder-CNN的土壤氮含量光谱预测模型研究

冀荣华赵迎迎李民赞郑立华《光谱学与光谱分析》2022,42(5):1372-1377

基于光谱的土壤氮含量预测模型泛化能力弱是制约其推广应用的瓶颈。鉴于特征提取及非线性表达能力方面的优势,深度学习模型具有较强的泛化能力。提出一种融合自动编码器和卷积神经网络(Encoder-CNN)的土壤氮含量光谱预测模型,探索模型结构和参数对模型性能的影响。根据以往研究成果和相关性分析,获得180个与氮含量强相关的波长,将其作为Encoder-CNN模型输入,而将土壤氮含量作为模型输出。Encoder-CNN模型利用自动编码器的编码部分进行光谱数据降维,然后输入到卷积神经网络进行土壤氮含量预测。设计2种网络结构,每种网络结构包含2种不同参数设置,共4个模型,用以探索Encoder-CNN土壤氮含量光谱预测模型结构和参数对模型性能的影响。利用公开数据集LUCAS对模型进行训练。按3σ原则对公开数据集LUCAS进行异常值检测与处理,获得20 791个数据,其中18 711个样本作为训练集,2 080个样本作为测试集,对Encoder-CNN模型进行训练。结果表明：对于自动编码器,在相同隐含层数下,最后的隐含层神经元个数为30时,复现效果最优。增加隐含层数,会提升复现效果。增加卷积核数量,特别是尺寸为1×1卷积核,能够提高模型的预测性能与可靠性。增加池化层的网络结构,模型预测精度提升至0.90以上。增加全连接层神经元数量也会提升模型性能。利用自采集的黑龙江黑土实时光谱数据集进行模型迁移,观察模型泛化能力。当模型迭代100次后,在黑龙江数据集上的预测精度即可达到0.90以上;当迭代次数为900时,模型在训练集和测试集上的预测精度可以达到0.98。结果表明,所构建的Encoder-CNN土壤氮含量光谱预测模型具有较好的泛化能力。相似文献

12.

基于深度可分离卷积的轻量化残差网络高光谱影像分类

程镕杰杨耘李龙威王燕婷王家禹《光学学报》2023,(12):311-320

针对传统深度残差网络在对高光谱图像进行特征提取和分类过程中因参数量大导致的训练时间长的问题,提出一种基于深度可分离卷积的轻量化残差网络模型（DSC-Res14）。该模型首先基于一层三维卷积层对经主成分分析方法降维后的高光谱影像进行光谱特征和空间特征初提取;其次,引入3个不同尺度的三维深度可分离卷积残差层对影像的深层语义特征进行提取,减少了网络训练参数量,增强了网络对高维、多尺度空间特征信息的表达能力。经在公开的Indian Pines和Pavia University标准数据集上进行实验验证,结果表明：所提模型在两个数据集上的分类精度分别为99.46%和99.65%;对比同类模型,所提模型在保证较高分类精度的同时,参数量和计算量小,训练时间短,并具有良好的鲁棒性。相似文献

13.

基于有监督对比学习的遥感图像场景分类

《光子学报》2021,50(7)

针对遥感场景图像中复杂背景以及类内多样性和类间相似性影响场景分类性能的问题,提出一种基于有监督对比学习的遥感场景分类方法。该方法包含判别性特征学习和线性分类两个阶段。在判别性特征学习阶段,引入有监督对比损失以拉近同类场景间的距离并增大不同类场景间的距离,提高类内多样性和类间相似性场景的判别能力;然后引入门控自注意模块对无用的背景信息进行过滤且聚焦关键场景区域,提高复杂背景的场景识别;最后引入一个预训练的Inception V3语义分支,把语义分支和原始模型提取的特征进行融合增强特征判别能力,以提高场景分类的整体性能。线性分类阶段通过对特征学习阶段训练的模型进行微调获得分类结果。在AID和NWPU-RESISC45数据集上的综合实验证明了所提方法的有效性。相似文献

14.

基于荧光光谱的水体分类与荧光组分识别方法

陈庆汤斌缪俊锋周彦龙邹荣张金富王建旭周密叶彬强赵明富钟年丙《光学学报》2023,(6):326-336

提出了一种基于MobileNetV2和VGG11组分拟合（CF-VGG11）卷积神经网络（CNN）与平行因子分析（PARAFAC）结合的水样分类和荧光组分拟合方法，通过输入单个三维荧光光谱（3D-EEM）数据来预测水样类别、溶解性有机物（DOM）质量浓度等级和荧光组分。算法以PARAFAC结果为基础建立荧光光谱数据集，分两步完成类别与组分的预测：第一步使用MobileNetV2算法对不同水样进行类别预测和DOM质量浓度分级；第二步使用CF-VGG11网络拟合荧光组分。采集地表水、工业废水处理水、污水处理厂进出口水和乡村饮用水4种类型的水样构建数据集，获得了95.83%的分类精度和98.11%的组分拟合精度。实验结果表明，所提方法可对不同水样和DOM质量浓度等级进行准确分类，拟合特定荧光组分，精确定位污染源，并能进行超标预警。相似文献

15.

基于条件生成对抗网络的图像去雾算法

梁毓明张路遥卢明建杨国亮《光子学报》2019,48(5)

为了提高雾天图像的去雾效果,提出了一种基于条件生成对抗网络的图像去雾算法.通过端到端可训练的神经网络对合成的室内和室外数据集进行训练,为了捕捉图像中更多的有用信息,在生成网络中设计了生成器和判别器架构,利用预训练的视觉几何组特征模型和L_1-正则化梯度对损失函数进行修正,并在判别器的最后一层引入Sigmoid函数用于特征映射,以便进行概率分析可归一化.利用合成数据集对损失函数进行训练,得到新的损失函数的参数,然后利用室外自然有雾图像数据集对训练得到的新的损失函数进行测试.实验结果表明:所提算法有效解决了去雾图像的颜色失真、过饱和、视觉伪像等问题,生成效果更好的去雾图像. 相似文献

16.

视频监控下利用改进型C3D-RF的人群异常行为检测

《光学技术》2021,47(2):187-195

传统基于卷积神经网络(CNN)算法的人群异常行为检测方法由于采用二维卷积核提取图像特征,故无法准确捕捉视频流在时序上的动态特征。为此,提出一种基于改进C3D网络与随机森林(RF)算法相结合的检测方法。利用具有时间特征捕捉能力的C3D网络进行视频流梯度方向直方图(HOG)特征提取,并作为三维卷积核输入以实现对视频时空特征的提取;使用随机森林分类器替代softmax全连接层以避免训练过程中繁琐的梯度计算操作,并降低对训练数据集样本规模的要求;基于基准数据集的算例结果表明,所提出的改进C3D-RF方案对人群异常行为的检测准确率保持在90%以上,且与传统C3D网络、支持向量数据描述模型(SVDD)、编码深度卷积神经网络(CAE)等方法相比,其训练时间缩短了15.34%以上。相似文献

17.

一种基于GAN和自适应迁移学习的样本生成方法

下载免费PDF全文

周立君刘宇白璐茹志兵于帅《应用光学》2020,41(1):120-126

研究了基于生成式对抗网络(GAN)和跨域自适应迁移学习的样本生成和自动标注方法。该方法利用自适应迁移学习网络，基于已有的少量可见光图像样本集，挖掘目标在红外和可见光图像中特征内在相关性，构建自适应的转换迁移学习网络模型，生成标注好的目标图像。提出的方法解决了红外图像样本数量少且标注费时的问题，为后续多频段协同目标检测和识别获得了足够的样本数据。实验结果表明:自动标注算法对实际采集的装甲目标图像和生成的装甲目标图像各1 000张进行自动标注测试，对实际装甲目标图像的标注准确率达到95%以上，对生成的装甲目标标注准确率达到83%以上；利用真实图像和生成图像的混合数据集训练的分类器的性能和使用纯真实图像时基本一致。相似文献

18.

一种基于无监督主动学习的苹果品质光谱无损检测模型构建方法

赵小康赵鑫朱启兵黄敏《光谱学与光谱分析》2022,42(1):282-291

利用光谱技术实现农产品、食品品质无损检测的实质是建立样本光谱信息与样本品质参数之间的机器学习模型。为了获得具有良好泛化性能的机器学习模型,通常需要大量的标记样本,然而,获取样本的光谱信息相对容易,但标注样本品质参数的过程往往涉及到大量的时间和经济成本,并且具有破坏性。主动学习是一种减少训练集有标记样本数量的方法,通过选择最有价值的样本进行标记,而不是随机选择。因此,主动学习能够控制向训练集添加哪些样本,模型不再是被动地接受用于建模的样本。在分类任务中已经提出较多关于主动学习的算法,但回归任务中的研究却相对较少,且现有的用于回归任务的主动学习算法大多是有监督的,即需要少量有标记样本训练初始模型。本文提出了一种基于无监督主动学习方法的训练样本选择策略。该方法首先通过层次凝聚聚类对无标记（标准值）光谱数据集进行多样性划分,获得不同的聚类簇;然后通过局部线性重建算法在每个聚类簇中选择最具代表性的样本构成训练样本集,最后基于训练集构建模型。利用两个年份三个品种苹果的近红外光谱数据,构建了其可溶性固形物含量和硬度的偏最小二乘预测模型,用于验证所提出方法的有效性。实验结果表明：所提出的方法要优于已有的样本选择策略,可以有效地提高模型精度,减少在模型训练中的破坏性理化实验。同时,与随机采样（RS）、Kennard-Stone算法（KS）、光谱-理化值共生距离算法（SPXY）这三种光谱领域常用的样本选择算法相比,该研究所提出的方法表现出了最佳的性能, 基于所提出的无监督主动学习算法选取200个样本作为训练集所建立的可溶性固形物含量预测模型的预测均方根误差相对于其他三种算法降低了2.0%~13.2%,硬度预测模型的预测均方根误差相对降低了1.2%~15.7%。相似文献

19.

基于高光谱图像技术与迁移学习的水晶梨早期损伤检测

王广来王恩凤王聪聪刘大洋《光谱学与光谱分析》2022,42(11):3626-3630

梨在储藏、包装和运输等过程中均可能发生不同程度的机械损伤,若不及时剔除损伤梨,损伤可能会逐渐严重而演变成腐烂,造成严重的经济损失。为建立一种梨早期损伤检测及损伤时间评估的快速、无损检测方法,采用高光谱图像结合迁移学习模型对损伤早期水晶梨进行识别。以无损伤、挤压损伤24 h和挤压损伤48 h的水晶梨为研究对象,应用高光谱成像系统采集样品的高光谱图像,共获取无损伤、挤压损伤24 h和挤压损伤48 h的水晶梨高光谱图像各80帧。对高光谱图像进行主成分分析,选择主成分图像4,5,6（PC4,PC5,PC6）作为检测水晶梨损伤的特征图像,将3个主成分图像拼接后进行数据扩充共得到无损伤、挤压损伤24 h和挤压损伤48 h的特征图像各160帧。按照9∶1比例划分样本训练集和测试集后,分别建立了支持向量机（SVM）、k-近邻（k-NN）和基于ResNet50网络的迁移学习损伤识别模型。SVM、k-NN和基于ResNet50网络的迁移学习模型对测试集样本总体识别准确率分别为83.33%,85.42%和93.75%,基于ResNet50网络的迁移学习模型识别效果最佳,其对测试集中无损伤、挤压损伤24 h和挤压损伤48 h的样本正确识别率分别达到100%,83%和95%。该研究结果表明,高光谱图像技术结合基于ResNet50网络的迁移学习模型可实现水晶梨早期损伤检测,并对损伤时间有较好的预测效果,且损伤时间越长,识别准确率越高。相似文献

20.

基于中心点的遥感图像多方向舰船目标检测

张筱晗姚力波吕亚飞韩鹏李健伟《光子学报》2020,49(4):205-213

针对目前基于深度学习的舰船目标斜框检测方法存在计算量大、效率低的问题,提出一种基于目标中心点的单阶段检测模型.由于舰船中心点不受舰船分布方向影响,模型主要思想是以目标中心点检测为基础,回归中心点处目标斜框的尺度和方向.首先设计特征提取网络,将卷积神经网络细节信息丰富的底层特征与语义信息丰富的高层特征融合起来形成特征图;然后将特征图输入到三个检测分支,分别预测目标中心点、中心点偏移值以及斜框的尺度与方向;设计组合损失函数对网络进行训练,并改进非极大值抑制算法以适应目标斜框检测的需要.在公开的SAR图像舰船目标检测数据集与光学遥感图像上进行了实验,实验结果表明,测试集平均准确率达0.906,检测精度与速度均优于其它检测模型,充分验证了所提算法的有效性. 相似文献