首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
孙兴伟  李军锋  颜永红 《声学学报》2021,46(6):1234-1241
提出一种结合卷积神经网络的编解码器模型和混响时间注意力机制的混响抑制算法,该算法通过编解码器模型实现混响抑制,并利用混响时间注意力机制克服混响环境变化对混响抑制效果的影响。该算法在编码器中使用具有不同大小的卷积核来处理混响语音幅度谱,从而获得包含多尺度上下文信息的编码特征;通过引入注意力模块,实现在不同的混响时间环境中选择性地使用不同权重的编码特征生成加权特征;最后,在解码器中使用加权特征来重建混响抑制后的语音信号幅度谱。在模拟和真实的混响环境下,该算法相对于基线系统在语音混响调制能量比上分别取得了0.36 dB和0.66 dB的提升。实验结果表明,该算法可以适应不同混响环境的变化,相对基线系统在真实混响环境下具有更高的鲁棒性。   相似文献   

2.
针对视网膜血管形态结构和尺度信息复杂多变的特点,提出一种自适应血管形态结构和尺度信息的U型视网膜血管分割算法。首先采用二维K-L(Karhunen-Loeve)变换(即霍特林变换)综合分析彩色图像三通道的频带信息,从而得到视网膜灰度图像以及多尺度形态学滤波增强血管与背景的对比度信息。然后将预处理图像经U型分割模型对图像进行端对端训练,并利用局部信息熵采样进行数据增强。该网络编码部分的密集可变形卷积结构根据上下特征层信息有效地捕捉图像中多种尺度信息和形状结构,底部金字塔型的多尺度空洞卷积扩大局部感受野,同时解码阶段带有Attention机制的反卷积网络将底层与高层特征映射有效结合,解决权重分散和图像纹理损失的问题。最后通过SoftMax激活函数得到最终的分割结果。在DRIVE(Digital Retinal Images for Vessel Extraction)与STARE(Structured Analysis of the Retina)数据集上对该算法进行了仿真,准确率分别达到97.48%与96.83%,特异性分别达到98.83%与97.75%,总体性能优于现有算法。  相似文献   

3.
提出了一种基于稀疏编码和卷积神经网络的地貌场景图像分类算法;利用非下采样Contourlet变换对训练样本进行多尺度分解;在训练样本中选择图像,利用稀疏编码学习局部特征,对特征向量进行排序;选择灰度平均梯度较大的特征向量对卷积神经网络卷积核进行初始化。结果表明:所提算法可以获得比传统底层视觉特征更好的分类结果,有效避免了网络训练陷入局部最优的问题,提高了自然场景下无人机着陆地貌的分类准确率。  相似文献   

4.
基于扩张卷积注意力神经网络的高光谱图像分类   总被引:1,自引:0,他引:1  
《光学学报》2021,41(3):43-53
为了解决训练样本有限情况下高光谱图像分类精度低的问题,提出了一种结合扩张卷积与注意力机制的三维-二维串联卷积神经网络模型。首先,该模型以串联的三维-二维卷积神经网络作为基础结构,利用三维卷积同时提取高光谱图像的空谱特征,并采用二维卷积进一步提取高级空间语义信息;然后,通过引入扩张卷积增大卷积核感受野,构建了多尺度特征提取结构,实现了多尺度特征的融合;最后,利用注意力机制使网络关注重要的空谱特征,并抑制噪声和冗余信息。在两个常用数据集上对本文算法和四种基于深度学习的分类算法进行对比实验,结果表明,所提模型取得了最准确的分类结果,有效提高了训练样本有限条件下的分类精度。  相似文献   

5.
针对复杂跟踪条件下目标的稳健跟踪和精确尺度估计问题,提出了一种基于多层卷积特征融合的目标尺度自适应稳健跟踪算法。算法首先利用VGG-Net-19深层卷积网络架构提取目标候选区域的多层卷积特征,通过相关滤波算法构建二维定位滤波器,得到多层卷积特征并进行加权融合,从而确定目标的中心位置;然后通过对目标区域进行多尺度采样,提取其梯度方向直方图特征构建一维尺度相关滤波器,确定目标的最佳尺度。实验结果表明,与6种当前主流跟踪算法相比,该算法取得了最好的跟踪成功率与精度,同时在跟踪过程中较好地实现了对目标快速尺度变化的自适应跟踪,且具有较快的跟踪速率。  相似文献   

6.
针对复杂跟踪条件下目标的鲁棒跟踪和精确尺度估计问题,提出了一种基于多层卷积特征融合的目标尺度自适应鲁棒跟踪算法。算法首先利用VGG-Net-19深层卷积网络架构提取目标候选区域的多层卷积特征,通过相关滤波算法构建二维定位滤波器,得到多层卷积特征并进行加权融合,从而确定目标的中心位置;然后通过对目标区域进行多尺度采样,提取其HOG特征构建一维尺度相关滤波器,确定目标的最佳尺度。在复杂跟踪条件下的实验结果表明,与6种当前主流跟踪算法相比,该算法取得了最好的跟踪成功率与精度,同时在跟踪过程中较好地实现了对目标快速尺度变化的自适应跟踪,且具有较快的跟踪速率。  相似文献   

7.
为提升分层卷积相关滤波跟踪算法的速度和精度,减少无效卷积通道特征对跟踪精度的影响,提出一种自适应特征选择的分层卷积相关滤波跟踪方法.该方法选取能表征目标的双层卷积特征,将相关滤波训练与预测合并,在视频序列的每一帧计算上一帧目标区域与非目标区域的卷积特征均值比,选取满足特征均值比要求的卷积通道特征训练相关滤波分类器,根据分类器与目标特征的最大响应值预测目标位置;最后根据预测结果稀疏更新目标初始帧特征,作为后续帧训练分类器的依据.在OTB-100标准数据集上对算法进行测试,实验结果表明本文算法的平均距离精度为91%,平均重叠率精度为64.4%,平均速度为21.7帧/秒,比原分层卷积相关滤波跟踪算法分别高出7.3、8.2个百分点和11.3帧/秒,该算法的平均距离精度比高精度的连续卷积跟踪算法(CCOT)高1.2个百分点,跟踪速度是CCOT的近20倍.本文算法可以有效提升分层卷积跟踪算法的速度和精度,在目标发生遮挡、快速运动等干扰时能稳定跟踪到目标.  相似文献   

8.
为了提升经配准高分辨率遥感影像对变化检测的精度,基于ChangeFormer提出了一种将移动卷积与相对注意力相结合的孪生网络(mobile convolution and relative attention Siamese network,MCRASN)。该网络以垂直布局结合移动卷积和相对注意力,构建多阶段组合编码器替换原网络编码器,高效地捕捉所需的多尺度细节特征和像素间相互关系信息,改进差异模块为1个可学习的距离度量模块进行距离计算,同时通过引入EFL(equalized focal loss)损失函数解决数据集正负样本失衡的问题以实现精确的变化检测。实验结果表明,所提出的MCRASN算法在LEVIRCD数据集上具有更好的变化检测性能,其精确率、召回率、F1得分和总体精度分别为93.94%、89.26%、91.54%和99.18%,优于先前的多种检测方法。  相似文献   

9.
针对近红外图像彩色化过程中存在近红外与可见光图像间模态差异较大、图像域样式不佳而导致其彩色化结果出现色彩纹理不吻合的问题,提出一种基于空洞循环卷积的近红外图像彩色化方法。改进CycleGAN网络,利用级联结构和空洞卷积块的优势设计了一种名为空洞级联模块,该模块采用编解码级联结构,代替原模型残差网络中的单向连接结构,进行特征通道的级联。在编解码级联层中引入空洞卷积模块,利用空洞卷积不损失图像纹理细节的优势,进一步提取不同尺度的近红外图像特征信息,最后通过解码将近红外灰度图像上色成彩色近红外图像。算法在生成网络中采用空洞级联方式改善误着色问题;在判别网络中引用感知损失函数改善网络收敛速度慢的问题。并且在NIR_VIS数据集上开展验证和分析。实验结果表明,所提方法提升效果明显,更好地保持了原目标的结构及色彩纹理特征,有效地提升了近红外图像的可视化效果。  相似文献   

10.
《光学学报》2021,41(9):53-62
针对目前磁共振脑影像上脑白质高信号区域的自动分割存在分割精度较低和细小病灶易漏识等问题,提出一种融合注意力和Inception的U-Net分割模型。在U-Net的编码阶段加入Inception模块以增加网络宽度,使其具有多尺度特征的提取能力,并加入注意力模块以增强网络对分割目标的关注度,两者的加入和融合可以有效提升网络的特征提取和表达能力。同时,在解码阶段的每一个卷积层上增加残差连接,可以提高网络的优化速度。此外,针对样本不均衡易导致分割结果中假阴性过多的问题,采用具有均衡调节能力的Tversky损失函数优化网络训练。实验结果表明,所提方法能够较好地分割脑白质的高信号区域,特别是小病灶区,且各项分割指标优于多个对比方法。  相似文献   

11.
针对传统深度残差网络在对高光谱图像进行特征提取和分类过程中因参数量大导致的训练时间长的问题,提出一种基于深度可分离卷积的轻量化残差网络模型(DSC-Res14)。该模型首先基于一层三维卷积层对经主成分分析方法降维后的高光谱影像进行光谱特征和空间特征初提取;其次,引入3个不同尺度的三维深度可分离卷积残差层对影像的深层语义特征进行提取,减少了网络训练参数量,增强了网络对高维、多尺度空间特征信息的表达能力。经在公开的Indian Pines和Pavia University标准数据集上进行实验验证,结果表明:所提模型在两个数据集上的分类精度分别为99.46%和99.65%;对比同类模型,所提模型在保证较高分类精度的同时,参数量和计算量小,训练时间短,并具有良好的鲁棒性。  相似文献   

12.
针对单幅偏振图像在一定场景下无法提供充足信息的问题,结合强度图像和线偏振度图像的优势特征,提出一种基于密集梯度生成对抗网络的偏振图像融合算法。利用密集连接卷积网络和梯度算子构建密集梯度卷积模块,并将该模块应用在生成器中,用以增强融合图像的纹理细节;构造多尺度结构相似度和L1范数相结合的损失函数,用以提高网络的整体性能。在ZJU-RGB-P数据集进行定性比较和定量分析,实验结果表明,所提算法具有更好的主观视觉感受,同时各项评价指标均得到明显提升。  相似文献   

13.
杨俊杰  丁家辉  杨柳  冯丽  杨超 《应用声学》2024,43(3):513-524
环境声分类技术在家居安全监测、人机语音交互等领域具有关键作用。然而,声源的多样性与混合性给环境声分类方法设计带来了重大挑战。为提高分类准确率与节约计算资源,本文提出一种基于多尺度通道注意力机制下的深度学习分类模型。所提模型由特征提取模块、多尺度卷积模块、高效通道注意力模块、输出层四部分组成。首先,通过引入加权型梅尔Gammatone频率倒谱系数挖掘环境声频谱幅值与相位结构信息;其次,融合多尺度卷积核与高效通道注意力机制优选出音频关键局部细节和通道特征;最后,在全连接层采用softmax函数映射特征并输出环境声类型的概率值。所提模型在6种环境声的iFLYTEK、10种环境声的Urbansound8k数据集上开展测试验证,分别取得了94%、76.52%、79.24%(iFLYTEK+Urbansound8k)的分类准确率。消融实验结果进一步表明:引入的多尺度卷积模块、通道注意力机制模块对分类准确率的提升贡献率分别接近于3.77%和1.89%。实验还详细对比了7种现有的深度学习分类方法,所提算法在分类准确率上排名第二;另外, 在同级别算法中如ResNet18、GoogLeNet,所提算法在模型参数量和计算复杂度方面上实现了进一步的约减。  相似文献   

14.
刘荻  张焱  赵琰  石志广  张景华  张宇 《光学学报》2021,41(22):129-141
针对监控视频中的多尺度近岸舰船检测问题,提出了一种基于特征重聚焦网络的舰船目标检测算法,设计了由多维特征聚合模块(MFAM)与注意力特征重构模块(AFRM)组成的特征重聚焦策略.其中,MFAM基于输入的特征金字塔构建特征聚合块,进一步融合多尺度舰船不同层次特征的语义信息.AFRM基于多分支空洞卷积以及通道与空间注意力机制提升网络对目标非局部信息的表征和对背景干扰的抑制,并构建了用于目标检测的特征重聚焦金字塔.在Seaships7000舰船公开数据集上的实验结果表明,相比其他算法,本算法对监控视频中多尺度近岸舰船的检测效果更好.  相似文献   

15.
为了提高对复杂场景下多尺度遥感目标的检测精度,提出了基于多尺度单发射击检测(SSD)的特征增强目标检测算法.首先对SSD的金字塔特征层中的浅层网络设计浅层特征增强模块,以提高浅层网络对小目标物体的特征提取能力;然后设计深层特征融合模块,替换SSD金字塔特征层中的深层网络,提高深层网络的特征提取能力;最后将提取的图像特征与不同纵横比的候选框进行匹配以执行不同尺度遥感图像目标检测与定位.在光学遥感图像数据集上的实验结果表明,该算法能够适应不同背景下的遥感目标检测,有效地提高了复杂场景下的遥感目标的检测精度.此外,在拓展实验中,文中算法对图像中的模糊目标的检测效果也优于SSD.  相似文献   

16.
《光学学报》2021,41(9):96-107
CT扫描中潜在的辐射伤害已越来越受到人们的重视,然而降低扫描剂量会导致成像质量退化,从而影响诊断结果。针对上述问题,提出一种联合卷积稀疏编码与梯度L_0范数的三维重建算法。该算法通过频率分解的重建形式对高频成分进行无监督的多尺度在线卷积稀疏编码约束,对低频成分进行梯度L_0范数约束,从而实现低剂量CT图像中噪声伪影的抑制与组织细节的保持。此外,卷积稀疏编码中使用三种不同尺度的三维滤波器,可有效适应不同尺度下的特征信息,提高编码能力。腹部CT仿真数据和真实扫描数据的实验结果表明,所提算法在25%常规剂量的重建过程中可以获得噪声伪影少、结构细节对比度高和质量更好的成像效果。  相似文献   

17.
谷静  张可帅  朱漪曼 《应用光学》2020,41(3):531-537
为有效地对焊缝缺陷进行分类,从而判断焊接质量的等级,对传统卷积神经网络进行改进,提出一种多尺度压缩激励网络模型(SINet)。将4组两两串联的3×3卷积模块与Inception模块、压缩激励模块(SE block)相结合。通过多尺度压缩激励模块(SI module)将卷积层中的特征进行多尺度融合和特征重标定以提高分类准确率,并用全局平均池化层代替全连接层减少模型参数。此外考虑到焊接缺陷数量不平衡对准确率的影响,采用深度卷积对抗生成网络(DCGAN)进行数据集的平衡处理,并在该数据集上验证模型的有效性。与传统卷积神经网络相比,该模型具有良好的性能,在测试集上准确率达到96.77%,同时模型的参数个数也明显减少。结果表明该方法对焊缝缺陷图像能进行有效地分类。  相似文献   

18.
曾宇  户文成 《应用声学》2020,39(3):409-416
针对公共场所异常声的感知和识别问题,提出一种基于贝叶斯优化卷积神经网络的识别方法。提取声信号的Gammatone倒谱系数、倍频程功率谱、短时能量和谱质心,组合成声信号的特征图。构建卷积神经网络作为分类器,利用递增的卷积核设置和池化操作处理不同尺度的特征。基于贝叶斯优化算法优化卷积神经网络的模型参数,对包括火苗噼啪声、婴儿啼哭声、烟花燃放声、玻璃破碎声和警报声的5种公共场所异常声进行识别。该方法的识别结果与基于不同的特征提取和分类器方案得到的识别结果进行比较,结果表明该方法的识别效果优于其他特征提取和分类器方案的识别效果。最后分析了该方法在不同信噪比噪声干扰下的识别结果,验证了该方法的有效性。  相似文献   

19.
针对当前图像分割算法在实现工业铸件内部缺陷分割上精度低且算法不够轻量化的问题,提出一种基于改进DeepLabv3+的工业铸件内部缺陷检测算法Effi-DeepLab。该方法采用EfficientNet中的MBConv来代替原有的Xception模块进行特征提取,使特征提取网络更加高效与轻量化;针对工业铸件内部缺陷尺寸小的问题,重新设计空洞空间金字塔池化(ASPP)层中空洞卷积的扩张率,使得卷积块对小目标具有更高的鲁棒性;在解码端充分利用特征提取阶段的低阶语义信息进行多尺度特征融合,以提高小目标缺陷分割的精度。实验结果表明,在本文使用的汽车轮毂内部缺陷图像数据集中,Effi-DeepLab模型对缺陷的分割准确率和平均交并比(mIoU)分别为93.58%和89.39%,相比DeepLabv3+分别提升了2.65%和2.24%,具有更好的分割效果;此外,还通过实验验证了本文提出算法具有良好的泛化性。  相似文献   

20.
脑胶质瘤的磁共振图像分割对于脑肿瘤的诊断、手术规划以及放疗等治疗方案的确定具有非常重要的意义.针对现有脑肿瘤分割算法分割精度不高边缘分割不精确,易出现假阳性的问题,本文提出一种基于多重自注意力和可变形卷积的Unet改进模型.模型将原始Unet框架的标准卷积替换为残差模块,以防止模型训练过程中出现梯度消失;通过在瓶颈层加入基于Transformer的多重自注意力模块来提取局部特征和全局上下文信息,以更好地挖掘像素间的相关性;在跨层连接处采用可变形卷积来增强模型对形状感知的敏感性,以提升肿瘤边缘特征的提取能力.实验结果表明,所提算法的分割结果评价指标高于使用同样数据集的其他对比模型,而且对肿瘤边缘的分割更加精确.这表明本文算法是一种有效的脑胶质瘤自动分割算法.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号