首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
郑雯  沈琪浩  任佳 《光学学报》2021,41(22):64-75
针对糖尿病性视网膜图像数据集的不均衡、组织形态的特征提取不充分、分级准确率不高等问题,本文提出一种基于DR-Net模型的改进识别算法,即Improved DR-Net.选用Kaggle失明检测竞赛数据集APTOS 2019 Dataset,采用多种数据增强策略扩充数据集,并引入Eye-PACS数据集进行无偏修正,同时采用高斯滤波等形态学方法增强眼底图像特征;对ResNext50聚合残差结构进行预训练,通过迁移学习对基线模型进行参数及结构微调;引入空洞卷积代替普通卷积,融合注意力机制进一步优化模型性能.测试结果表明,本文所提的Improved DR-Net模型大大提高了糖尿病视网膜病变分级的准确率:阳性预测值97.9%,阴性预测值98.03%,准确率达到98.04%,远高于同类算法.结合深度学习技术辅助视网膜病变的筛查,对于视网膜病变的早期自动筛查具有一定的指导意义.  相似文献   

2.
光学相干层析成像(OCT)广泛应用于眼科,用于观察视网膜的形态,对病变区域的检测和诊断评估具有重要意义。由于液体的积聚引发的一系列视网膜疾病,针对视网膜OCT图像中的液体检测和分割问题,设计了一种具有全局上下文特征信息的神经网络,利用多尺度的特征提取与融合的方法,提出了一种多尺度的并行提取与高度融合的U型网络模型PH-UNet,这是一种新的用于视网膜OCT图像液体区域分割的深度卷积神经网络。PH-UNet网络通过捕获多尺度的上下文信息,更好地利用信息提取和融合的方法对视网膜OCT图像中液体区域进行端到端的分割。将提出的模型对MICCAI RETOUCH数据集中三种视网膜液体视网膜内液体(IRF)、视网膜下液体(SRF)和色素上皮脱离(PED)进行分割并与其他经典的分割网络模型进行了比较,在precision精确率、dice相似系数、mIoU平均交并比三种指标上取得了最佳效果证明了其优越性。  相似文献   

3.
针对卷积神经网络在步态识别时准确率易饱和现象,以及Vision Transformer(ViT)对步态数据集拟合效率较低的问题,提出构建一个对称双重注意力机制模型,保留行走姿态的时间顺序,用若干独立特征子空间有针对性地拟合步态图像块;同时,采用对称架构的方式,增强注意力模块在拟合步态特征时的作用,并利用异类迁移学习进一步提升特征拟合效率。将该模型运用在中科院CASIA C红外人体步态库中进行多次仿真实验,平均识别准确率达到96.8%。结果表明,本文模型在稳定性、数据拟合速度以及识别准确率3方面皆优于传统ViT模型和CNN对比模型。  相似文献   

4.
利用光学相干断层技术(OCT)产生的视网膜疾病图像是分类眼科疾病的重要措施。目的是利用四种不同分类模型的迁移学习方法对糖尿病黄斑水肿、老年性黄斑变性、玻璃疣三种病变的OCT视网膜图像进行自动分类,实现迁移学习在OCT图像分类上的应用。将VGG-16、Inception V3、MobileNet V2、ShuffleNet-V2这四种神经网络模型在大规模图像分类数据集预训练好后,进行模型微调和训练参数更新,进而找到实现上述三种眼科疾病自动分类的最优模型,达到高效的OCT视网膜病变自动分类效果。实验结果表明,四种模型中轻量型MobileNet V2经模型微调后的评价指标优于其他模型。  相似文献   

5.
针对主动视觉安检方法准确率低、速度慢,不适用于实时交通安检的问题,提出了八度卷积(OctConv)和注意力机制双向门控循环单元(GRU)神经网络相结合的X光安检图像分类方法。首先,利用八度卷积代替传统卷积,对输入的特征向量进行高低分频,并降低低频特征的分辨率,在有效提取X光安检图像特征的同时,减少了空间冗余。其次,通过注意力机制双向GRU,动态学习调整特征权重,提高危险品分类准确率。最后,在通用SIXRay数据集上的实验表明,对8 000幅测试样本的整体分类准确率(ACC)、特征曲线下方面积(AUC)、正类分类准确率(PRE)分别为98.73%、91.39%、85.44%,检测时间为36.80 s。相对于目前主流模型,本文方法有效提高了X光安检图像危险品分类的准确率和速度。  相似文献   

6.
针对脑肿瘤良恶性分类过程复杂、分类准确率不高等问题,提出了一种基于多尺度特征与通道特征融合的分类模型。该模型以ResNeXt网络为主干网络,首先,将基于空洞卷积的多尺度特征提取模块代替第一层卷积层,利用膨胀率获取不同感受野的图像信息,将全局特征与局部显著特征相结合;其次,添加通道注意力机制模块,融合特征通道信息,提高对肿瘤区域的关注度,降低对冗余信息的关注度;最后,采用学习率的线性衰减策略、图像的标签平滑策略以及基于医学图像的迁移学习策略的组合优化提高模型的学习能力和泛化能力。在BraTS2017和BraTS2019数据集中进行实验,准确率分别达到98.11%和98.72%。与经典模型和其他先进方法相比,该分类模型能够有效地减少分类过程的复杂度,提高脑肿瘤良恶性分类的准确率。  相似文献   

7.
提出了一种基于集成卷积神经网络(CNN)的遥感影像场景分类算法。通过构建反向传播网络实现了场景图像的复杂度度量;根据图像的复杂度级别,选择CNN对图像进行分类,完成了遥感影像的场景分类。使用所提出的算法对NWPU-RESISC45公开数据集进行了实验验证,取得了89.33%(第一类实验)和92.53%(第二类实验)的分类准确率,平均运行时间为0.41 s。相比于精调训练的VGG-16模型,所提算法的分类准确率分别提升了2.19%和2.17%,预测速率提升了33%,证明了其有效性和实用性。  相似文献   

8.
目前卷积神经网络(CNN)在物体种类识别方面取得突破性进展。贝类作为农业经济的重要组成部分,种类繁多,特点复杂,大多贝类存在着相似度高,各类样本分布不均衡情况,以致CNN对贝类分类的准确率偏低。针对这一情况,提出了基于可见光谱和CNN的贝类识别方法,旨在提取更有效的贝类特征,从而提高贝类分类的准确率。首先,提出了一种包含输出熵度量和正交性度量的滤波器信息度量与特征选择方法,重新初始化修剪掉的滤波器并使其正交,捕获网络激活空间中的不同方向,使神经网络模型学习到更多有用的贝类特征信息,提升模型分类准确率;其次,提出了一种包含正则化项和焦点损失项的贝类分类目标函数,通过控制各类别样本对总损失的共享权重,来减少易分类样本的权重,以使模型注意力向预测不准的样本倾斜,均衡样本分布和样本分类难度,进一步提高贝类分类的准确率。贝类图像数据集由74类贝类组成,共11 803张图像。获取原始数据集后,对数据集图像进行水平翻转、垂直翻转、随机旋转、在[0, 30°]范围内旋转、在[0, 20%]范围内缩放和移动等数据增强操作,将图像数量从11 803张增加到119 964张。整个图像数据集按8∶1∶1的比例随机分为训练集95 947张图片、验证集11 996张图片和测试集12 021张图片。在建立贝类图像数据集的基础上进行了实验验证,达到了93.38%的分类准确率,将基准网络(Resnest)的准确率提高了1.18%,相较网络SN_Net和MutualNet,准确率分别提升了4.34%和0.85% ,并且训练时长为22 320 s,将基准网络(Resnest)的训练时长缩短了960 s,训练时长分别比SN_Net和MutualNet短3 180和2 460 s。实验结果证明了该方法的有效性。  相似文献   

9.
针对普通卷积神经网络在遥感图像分割中林地边界区域识别不完整、小片林地分割精度低的问题,提出一种基于transformer与注意力机制的DeeplabV3+网络改进方法。在编码阶段引入transformer机制,将原池化金字塔部分中的空洞卷积操作替换为可获取更多上下文信息的transformer操作,从而提高网络对林地边界信息的提取能力;将注意力机制引入到网络的解码部分,提升模型对小片林地的检测能力。实验表明,采用改进后的方法平均交并比(MIou)可达到81.83%,对比原DeepLabV3+网络模型提升了1.25%。该方法充分考虑了卫星遥感图像分割中林地边缘信息的提取以及对小目标的关注度,提出的改进方法可提升遥感图像中对林地提取的精度。  相似文献   

10.
提出一种基于格拉姆角场(GAF)和卷积神经网络(CNN)的水下目标有源识别方法。该方法利用GAF将目标回波信号编码为二维图像,使用空洞卷积构建轻量级的卷积神经网络GAF-D3Net实现对目标的特征提取与分类识别。实验表明,与基于传统图像特征的分类方法相比,所提方法的分类精度有显著提高,达到99.65%。在泛化性测试中,对比了经典CNN使用声呐图像的迁移学习方法,本文方法的曲线下面积(AUC)达到89%,具有更好的泛化性能以及抗干扰能力,为实现水下目标有源识别提供了一种可靠方法。  相似文献   

11.
为了提高基于近红外光谱的土地覆盖分类模型的准确率,以欧盟统计局发布的土壤近红外光谱数据为研究对象,研究基于短时傅里叶变换(STFT)预处理方法和不同卷积尺度融合的土地覆盖分类模型,实现耕地、林地和草地的快速区分。为适应二维卷积要求,将一维光谱的400~2 500 nm波段的4 200个波长进行短时傅里叶变换,转换成二维图像同时提取光谱数据的频谱信息。将样本按6∶2∶2的比例随机划分为训练集、验证集和测试集。建立单一尺寸卷积核卷积神经网络(CNN)以及多尺寸卷积核融合的卷积神经网络土地覆盖分类模型,为了防止模型出现梯度消失现象,网络采用ReLU激活函数以及批标准化(BN)、 Dropout等方法。并采用早停法(early stopping)训练网络,防止模型出现过拟合风险。首先,探讨了不同STFT窗口长度(64, 100和128)、不同卷积核尺寸(3×3, 5×5和7×7)等对模型分类效果的影响规律。实验结果显示:当STFT窗口长度为100、窗口重叠长度为50%时,模型总体分类准确率均最高;模型的分类准确率随卷积核尺寸的增大而降低,较小尺寸卷积核模型准确率更高,卷积核尺寸为3×3的CNN...  相似文献   

12.
卷积神经网络(CNN)在图像分类识别领域应用广泛,但其在近红外光谱分类中的研究还未见报道,对基于CNN的近红外光谱分类建模方法进行了研究。针对近红外光谱数据的特点,提出了一种改进的卷积神经网络建模方法,对CNN经典模型LeNet-5所做改进:①将方形矩阵卷积核改为适用于一维近红外光谱的向量卷积核;②简化网络结构,将LeNet-5结构中C5,F6及输出层改为单层感知机。同时,采用隔点采样的方法对近红外光谱降维,加快收敛速度;并对卷积核尺寸对建模结果的影响进行了研究。以我国东北、黄淮、西南三大烤烟产区的600个中部烟叶样本的近红外光谱为实验对象,建立烟叶产区分类NIR-CNN模型。该模型对训练集和测试集的判别准确率为98.2%和95%。实验结果表明,应用卷积神经网络可对近红外光谱数据准确、可靠地判别分类;烟叶产区NIR-CNN建模方法可为卷烟企业烟叶原料科学合理利用提供指导,为维护卷烟产品的质量稳定有重要意义;基于卷积神经网络的近红外光谱判别方法也可推广到其他农产品的分类应用中。  相似文献   

13.
针对半月板计算机辅助诊断(CAD)系统中半月板撕裂形态各异带来的分类准确率低的问题,提出一种多维度信息融合网络(Multi-Dimensional Information Fusion Network,MDIFNet)模型的半月板撕裂分类方法.首先,使用由四个子网络所构成的卷积神经网络(Convolutional Neural Network,CNN)架构以获取不同视角、不同维度的半月板特征信息;同时,提出了多尺度注意力机制,丰富细粒度特征;最后,构建了基于支持向量机(Support Vector Machines,SVM)的多核模型作为最终的分类器.在MRNet数据集上的实验结果表明,本文提出方法的分类准确率达0.782,较现有先进的基于深度学习的半月板撕裂分类方法有一定提升.  相似文献   

14.
胚蛋雌雄识别一直是家禽业发展的瓶颈问题,在禽肉生产过程中倾向于养殖雄性个体,而禽蛋生产产业倾向于养殖雌性家禽。若能在孵化过程中较早鉴别出种蛋的雌雄,不仅能够降低家禽孵化产业的成本,还能够提高禽蛋和禽肉生产行业的经济效益。该文以种鸭蛋为研究对象,为了在种鸭蛋孵化早期实现对种蛋的雌雄识别,构建了可见/近红外透射光谱信息采集系统,在200~1 100 nm的波长范围内采集了345枚孵化了0~8 d的种鸭蛋光谱数据。搭建了适用于种鸭蛋光谱信息的6层卷积神经网络(convolutional neural network, CNN),其中包括输入层、3个卷积层、全连接层与输出分类层。卷积层可以提取光谱中的有效信息,全连接层通过对卷积层提取的局部特征进行整合供输出层分类决策。另外在卷积神经网络中引入局部响应归一化和dropout操作能够加快网络的收敛速度。利用该卷积神经网络构建鸭胚雌雄信息识别网络,通过对比与分析不同孵化天数的识别效果,发现孵化7d的识别效果最佳。随后将孵化7 d的种鸭蛋原始光谱数据进行噪声去除,选取500~900 nm波段用于后续的特征波长选取和建模。分别运用了竞争性自适应重加权算法(CARS)、连续投影算法( SPA)与遗传算法(GA)选择能够区分鸭胚性别的波长点,将选取的特征波长转换为二维的光谱信息矩阵,二维光谱信息矩阵保留了一维光谱的有效信息,同时极大地方便了与卷积神经网络的结合。利用二维光谱信息矩阵和卷积神经网络相结合,实现孵化早期阶段鸭胚的雌雄识别。经检验,基于 SPA算法和CNN网络建立的模型效果较佳,其中训练集、开发集及测试集的准确率分别为93.36%,93.12%和93.83%;基于GA算法和CNN网络建立的模型效果次之,训练集、开发集及测试集的准确率分别为90.87%,93.12%和86.42%;基于CARS算法和CNN网络建立的模型的训练集、开发集及测试集的准确率分别为84.65%,83.75%和77.78%。研究结果表明基于可见/近红外光谱技术和卷积神经网络可以实现孵化早期鸭胚胎雌雄的无损鉴别,为后续相关自动化检测装置的研发提供了技术支撑。  相似文献   

15.
针对太阳能电池组件中电池片出现隐裂导致整片电池破碎,最终影响整个组件发电量的问题,在对电池组件光致发光(PL)图像待检测区域筛选定位的基础上,提出了一种利用卷积神经网络(CNN)进行电池组件隐裂缺陷检测的方法。首先利用PL成像方法获取电池组件图像,然后对图像进行预处理,基于聚类的方法对待检测目标区域进行筛选定位,最后利用3种不同结构的卷积神经网络模型对电池片进行缺陷检测,并进行准确率对比,使最优识别准确率达到99.25%。实验结果验证了该方法能准确地检测出太阳能电池组件的隐裂缺陷。  相似文献   

16.
杨壮  颜永红  黄志华 《应用声学》2024,43(3):498-504
口音识别是指在同一语种下识别不同的区域口音的过程。为了提高口音识别的准确率,我们采用了多种方法,取得了明显的效果。首先,为了解决声学特征中关键特征权重不突出的问题,引入了有效的注意力机制,并对多种注意力机制进行了比较和分析。通过模型自适应学习通道和空间维度的不同权重,提高了口音识别的性能。在Common Voice英语口音数据集上的实验结果表明,引入CBAM注意力模块是有效的,识别准确率相对提升了12.7%,精确度和F1分数相对提升了17.9%。之后,我们提出了一种树形分类方法来缓解数据集中的长尾效应,识别准确率最多相对提升了5.2%。受域对抗训练(DAT)的启发,我们尝试通过对抗学习方法剔除口音特征中的冗余信息,使得准确率最多相对提升了3.4%,召回率最多相对提升了16.9%。  相似文献   

17.
针对红外船只图像较模糊导致的识别率低、识别速度慢等问题,提出了一种基于深度卷积神经网络(CNN)的检测算法。首先采用标记分水岭分割算法提取红外船只图像中的连通区域,并对原图相应的目标位置进行标记和归一化处理,提取候选区域。采用改进的AlexNet(一种深度CNN模型)进行船只目标识别,将提取的候选区域送入改进的AlexNet进行特征提取和预测,得到最终检测结果。分水岭方法可大大减少候选区域检测时间,以及减少深度CNN识别时间。利用实验室自制的红外成像系统获取近千张红外船只图像数据,并对其平移缩放形成的数据集进行仿真实验。结果表明,标记分水岭与深度CNN的结合,可有效识别船只目标,所提方法具有良好的性能,能够更加快速准确地识别红外船只目标。  相似文献   

18.
《光学技术》2021,47(1):72-79
糖尿病性黄斑水肿(DME)是导致失明的主要原因之一,由专业的医生通过检查光学相干扫描(OCT)图像是主要的诊断方法,但这一过程不仅耗时而且容易误判,提出一种辅助诊断模型来区分DME和正常黄斑。对原始OCT图像进行降噪、展平、裁剪预处理,得到易于分类的病灶区图像,在小波分解金字塔模型的基础上用局部二值模式方法对原图和低频子图像提取纹理特征;与提取细节图像的灰度-梯度共生矩阵特征融合形成最终的全局特征,并对其进行降维;用weka平台的序列最小优化模型进行分类。在杜克大学数据集和临床数据集上的试验结果表明,算法在两个数据集上验证的准确率分别为95.7%、95.3%,灵敏性分别为95.3%、95.5%,特异度分别为96.0%、95.1%。因此,所提方法能有效对OCT图像分类,为临床上视网膜疾病辅助诊断提供技术支撑。  相似文献   

19.
随着人口老龄化的加深,阿尔兹海默疾病更加大众化地出现在我们生活中,而早期精准诊断阿尔兹海默疾病并进行正向干预可有效延缓阿尔兹海默疾病的进程.基于磁共振图像的阿尔兹海默疾病的精准诊断需要综合利用多个感兴趣区域(ROIs)的信息,而单个ROI无法体现不同ROIs之间存在的联系与影响.本文首先提出三输入3D卷积神经网络(CNN),综合利用大脑3D磁共振图像中海马体、灰质(无海马体)和白质3个ROIs的信息.此外,随着神经网络的加深,原始图像的重要特征信息会部分丢失,因此我们又提出一种多输出3D CNN,通过增加中间层的连接和输出,缩短输入和输出之间的距离,增强特征传播,减少特征信息的丢失.结果显示采用多输出3DCNN模型实现整个测试集三分类的准确率为90.5%、精确率为91.0%、灵敏度为90.4%、特异性为95.2%、F1-score为90.5%,诊断性能优于单输出3D CNN模型.  相似文献   

20.
高光谱图像具有较高的空间分辨率,蕴含着丰富的空间光谱信息,近年来被广泛用于城市地物分类中。在高光谱图像分类过程中,空间光谱特征的提取直接影响着分类精度;传统的高光谱图像特征提取方法只利用了4或8邻域的像素进行简单卷积处理,因而丢失了大量的复杂、有效信息;卷积神经网络(CNN)虽然可以自动提取空间光谱特征,在保留图像空间信息的同时,简化网络模型,但是,随着网络深度增加,网络分类产生退化现象,而且网络间缺乏相关信息的互补性,从而影响分类精度。该工作引入CNN自动提取空间光谱特征,并且针对CNN深度增加所导致的退化问题,设计了面向地物分类的高光谱特征融合残差网络。首先,为了降低高光谱图像的光谱冗余度,利用PCA提取主要光谱波段;然后,为了逐级提取光谱图像的空间光谱特征,定义了卷积核为16,32,64的低、中、高3层残差网络模块,并利用64个1×1的卷积核对3层特征输出进行卷积,完成维度匹配与特征图融合;接着,对融合后的特征图进行全局平均池化(GAP)生成用于分类的特征向量;最后,引入具有可调节机制的Large-Margin Softmax损失函数,监督模型完成训练过程,实现高光谱图像分类。实验采用Indian Pines,University of Pavia和Salinas地区的高光谱图像来验证方法有效性,设置批次训练的样本集为100,网络训练的初始学习率为0.1,当损失函数稳定后学习率降低为0.001,动量为0.9,权重延迟为0.000 1,最大训练迭代次数为2×104,当3个数据集的样本块像素分别设置为25×25,23×23,27×27,网络深度分别为28,32和28时,3个数据集的分类准确率最高,其平均总体准确率(OA)为98.75%、平均准确率(AA)的评价值为98.1%,平均Kappa系数为0.98。实验结果表明,基于残差网络的分类方法能够自动学习更丰富的空间光谱特征,残差网络层数的增加和不同网络层融合可以提高高光谱分类精度;Large-Margin Softmax实现了类内紧凑和类间分离,可以进一步提高高光谱图像分类精度。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号