首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 218 毫秒
1.
在增材制造技术中,树枝晶的表征对于分析激光熔覆层的机械性能至关重要,但目前树枝晶的标记主要由人工完成,耗时长且容易引入人为误差,而深度学习可提高目标识别准确度。基于U-net网络提出了适于识别分割树枝晶的BNC-Unet网络,将串行注意力机制和Batch Normalization层有效地部署在上采样和下采样区域,调整图像特征的权重信息。选取交并比作为分割结果的评价指标,并对比了原Unet以及不同的改进方法在该指标下的结果。在测试集中,BNCUnet网络分割树枝晶准确率指标为84.2%,比原U-net网络结果提升了8.97%。该指标表明网络能准确地从激光熔覆层金相图中识别出树枝晶形貌,且识别树枝晶的准确率显著提高,便于在激光熔覆试验后评估熔覆层性能。  相似文献   

2.
针对主动视觉安检方法准确率低、速度慢,不适用于实时交通安检的问题,提出了八度卷积(OctConv)和注意力机制双向门控循环单元(GRU)神经网络相结合的X光安检图像分类方法。首先,利用八度卷积代替传统卷积,对输入的特征向量进行高低分频,并降低低频特征的分辨率,在有效提取X光安检图像特征的同时,减少了空间冗余。其次,通过注意力机制双向GRU,动态学习调整特征权重,提高危险品分类准确率。最后,在通用SIXRay数据集上的实验表明,对8 000幅测试样本的整体分类准确率(ACC)、特征曲线下方面积(AUC)、正类分类准确率(PRE)分别为98.73%、91.39%、85.44%,检测时间为36.80 s。相对于目前主流模型,本文方法有效提高了X光安检图像危险品分类的准确率和速度。  相似文献   

3.
针对卷积神经网络在步态识别时准确率易饱和现象,以及Vision Transformer(ViT)对步态数据集拟合效率较低的问题,提出构建一个对称双重注意力机制模型,保留行走姿态的时间顺序,用若干独立特征子空间有针对性地拟合步态图像块;同时,采用对称架构的方式,增强注意力模块在拟合步态特征时的作用,并利用异类迁移学习进一步提升特征拟合效率。将该模型运用在中科院CASIA C红外人体步态库中进行多次仿真实验,平均识别准确率达到96.8%。结果表明,本文模型在稳定性、数据拟合速度以及识别准确率3方面皆优于传统ViT模型和CNN对比模型。  相似文献   

4.
说话人识别技术是一项重要的生物特征识别技术。近年来,使用深度神经网络提取发声特征的说话人识别算法取得了突出成果。时延神经网络作为其中的典型代表之一已被证明具有出色的特征提取能力。为进一步提升识别准确率并节约计算资源,通过对现有的说话人识别算法进行研究,提出一种带有注意力机制的密集连接时延神经网络用于说话人识别。密集连接的网络结构在增强不同网络层之间的信息复用的同时能有效控制模型体积。通道注意力机制和帧注意力机制帮助网络聚焦于更关键的细节特征,使得通过统计池化提取出的说话人特征更具有代表性。实验结果表明,在VoxCeleb1测试数据集上取得了1.40%的等错误率(EER)和0.15的最小检测代价标准(DCF),证明了在说话人识别任务上的有效性。  相似文献   

5.
郑一臻  戴键  张天  徐坤 《中国光学》2023,(6):1343-1355
当前光子神经网络的研究主要集中在单一模态网络的性能提升上,而缺少对多模态信息处理的研究。与单一模态网络相比,多模态学习可以利用不同模态信息之间的互补性,因此,多模态学习可以使得模型学习到的表示更加完备。本文提出了将光子神经网络和多模态融合技术相结合的方法。首先,利用光子卷积神经网络和光子人工神经网络相结合构建异构光子神经网络,并通过异构光子神经网络处理多模态数据。其次,在融合阶段通过引入注意力机制提升融合效果,最终提高任务分类的准确率。在多模态手写数字数据集分类任务上,使用拼接方法融合的异构光子神经网络的分类准确率为95.75%;引入注意力机制融合的异构光子神经网络的分类准确率为98.31%,并且优于当前众多先进单一模态的光子神经网络。结果显示:与电子异构神经网络相比,该模型训练速度提升了1.7倍。与单一模态的光子神经网络模型相比,异构光子神经网络可以使得模型学习到的表示更加完备,从而有效地提高多模态手写数字数据集分类的准确率。  相似文献   

6.
朱应俊  周文君  朱川  马建敏 《应用声学》2023,42(5):1090-1098
为了使机器能够更好地理解人的情感并改善人机交互体验,可对语声特征及分类网络进行融合以提升情感识别性能。本文从网络融合的角度,把基于梅尔倒谱系数和逆梅尔倒谱系数的二维卷积神经网络和基于散射卷积网络系数的长短期记忆网络作为前端网络,提取前端网络的中间层作为话语级的特征表示,利用压缩-激励(SE)通道注意力机制对前端网络的中间层的权重进行调整并融合,然后由深度神经网络后端分类器输出情感分类结果。在汉语情感数据集中进行五折交叉验证的对比实验,实验结果表明,基于SE通道注意力机制的网络融合方式可以有效地利用不同前端网络在语声情感识别任务中的优势,提高语声情感识别的准确率。  相似文献   

7.
针对声纹识别领域不匹配,且目标领域缺少标注数据的难题,提出在对抗学习基础上融合分布对齐的无监督领域自适应方法,通过训练过程中统计分布的对齐,以减小领域差异,从而提取声音中更有声纹鉴别性的特征,取得了稳定的性能提升。在文本相关的声纹识别任务中,对抗学习和分布对齐的方法能协同发挥作用,等错率相对降低11%;在文本无关的任务中,对抗学习效果不稳定,而分布对齐的方法依然有相对8%的性能提升。实验结果证明该方法在领域不匹配且目标领域缺少标注数据时,能有效提取语音中声纹鉴别信息,稳定提升识别性能。   相似文献   

8.
郑雯  沈琪浩  任佳 《光学学报》2021,41(22):64-75
针对糖尿病性视网膜图像数据集的不均衡、组织形态的特征提取不充分、分级准确率不高等问题,本文提出一种基于DR-Net模型的改进识别算法,即Improved DR-Net.选用Kaggle失明检测竞赛数据集APTOS 2019 Dataset,采用多种数据增强策略扩充数据集,并引入Eye-PACS数据集进行无偏修正,同时采用高斯滤波等形态学方法增强眼底图像特征;对ResNext50聚合残差结构进行预训练,通过迁移学习对基线模型进行参数及结构微调;引入空洞卷积代替普通卷积,融合注意力机制进一步优化模型性能.测试结果表明,本文所提的Improved DR-Net模型大大提高了糖尿病视网膜病变分级的准确率:阳性预测值97.9%,阴性预测值98.03%,准确率达到98.04%,远高于同类算法.结合深度学习技术辅助视网膜病变的筛查,对于视网膜病变的早期自动筛查具有一定的指导意义.  相似文献   

9.
张志浩  王坤侠 《应用声学》2022,41(5):843-850
语声情感识别对人机交互和情感计算研究领域具有重要作用,各类研究方法层出不穷。近期研究学者应用卷积神经网络和长短期记忆网络方法提取对数Mel谱图空间特征和时间特征,取得了一定的成果。然而不论是卷积神经网络还是长短期记忆网络提取特征时,都会产生特征冗余,导致语声情感识别效果下降。针对这一问题,该文提出了一种基于时空注意力机制的卷积-递归神经网络模型,采用对数Mel谱图和其一阶差分、二阶差分作为特征输入,在使用卷积神经网络提取空间特征和长短期记忆网络提取时间特征时,加入空间注意力和时间注意力机制,从而使上述网络能够更好地提取到对数Mel谱图中有效表征情感的空间特征和时间特征。该模型在Emo-DB和IEMOCAP语声数据集上的加权准确率分别达到86.8%、69.4%,未加权准确率分别达到84.7%、65.5%,优于当前大多数先进方法。  相似文献   

10.
杨俊杰  丁家辉  杨柳  冯丽  杨超 《应用声学》2024,43(3):513-524
环境声分类技术在家居安全监测、人机语音交互等领域具有关键作用。然而,声源的多样性与混合性给环境声分类方法设计带来了重大挑战。为提高分类准确率与节约计算资源,本文提出一种基于多尺度通道注意力机制下的深度学习分类模型。所提模型由特征提取模块、多尺度卷积模块、高效通道注意力模块、输出层四部分组成。首先,通过引入加权型梅尔Gammatone频率倒谱系数挖掘环境声频谱幅值与相位结构信息;其次,融合多尺度卷积核与高效通道注意力机制优选出音频关键局部细节和通道特征;最后,在全连接层采用softmax函数映射特征并输出环境声类型的概率值。所提模型在6种环境声的iFLYTEK、10种环境声的Urbansound8k数据集上开展测试验证,分别取得了94%、76.52%、79.24%(iFLYTEK+Urbansound8k)的分类准确率。消融实验结果进一步表明:引入的多尺度卷积模块、通道注意力机制模块对分类准确率的提升贡献率分别接近于3.77%和1.89%。实验还详细对比了7种现有的深度学习分类方法,所提算法在分类准确率上排名第二;另外, 在同级别算法中如ResNet18、GoogLeNet,所提算法在模型参数量和计算复杂度方面上实现了进一步的约减。  相似文献   

11.
A robust vehicle speed measurement system based on feature information fusion for vehicle multi-characteristic detection is proposed in this paper. A vehicle multi-characteristic dataset is constructed. With this dataset, seven CNN-based modern object detection algorithms are trained for vehicle multi-characteristic detection. The FPN-based YOLOv4 is selected as the best vehicle multi-characteristic detection algorithm, which applies feature information fusion of different scales with both rich high-level semantic information and detailed low-level location information. The YOLOv4 algorithm is improved by combing with the attention mechanism, in which the residual module in YOLOv4 is replaced by the ECA channel attention module with cross channel interaction. An improved ECA-YOLOv4 object detection algorithm based on both feature information fusion and cross channel interaction is proposed, which improves the performance of YOLOv4 for vehicle multi-characteristic detection and reduces the model parameter size and FLOPs as well. A multi-characteristic fused speed measurement system based on license plate, logo, and light is designed accordingly. The system performance is verified by experiments. The experimental results show that the speed measurement error rate of the proposed system meets the requirement of the China national standard GB/T 21555-2007 in which the speed measurement error rate should be less than 6%. The proposed system can efficiently enhance the vehicle speed measurement accuracy and effectively improve the vehicle speed measurement robustness.  相似文献   

12.
倪崇嘉  刘文举  徐波 《声学学报》2012,37(5):553-560
虽然汉语和英语的重音自动标注被广泛的研究,但是关于汉语和英语的重音自动标注之间对比的研究还鲜有报道。基于汉语韵律标注库ASCCD和英语韵律标注库Boston University Radio News Corpus,对汉语和英语的重音自动标注的异同进行对比,考察不同的特征在不同语言的语料库上的泛化性能。通过基于集成分类回归树的重音自动标注实验、特征分析及基于互信息的重音自动标注的声学对比,得到如下结论:在相同的条件下,汉语重音自动标注的正确率比英语重音自动标注的正确率要低;在重音自动标注中,词典语法相关特征比声学相关的特征更重要;不同的声学信息源在重音自动标注中所起的作用不同,时长相关的特征对汉语和英语重音自动标注都很重要;英语中大部分特征提供的互信息要比汉语相应的特征提供的互信息要高。   相似文献   

13.
针对当前行人检测方法计算量大、检测精度低的问题,基于YOLOv4-tiny提出一种改进的行人检测算法.引入通道注意力和空间注意力模块(CBAM)至CSPDarknet53-tiny网络中,通过学习图像的位置信息和通道信息得到更加丰富的特征;在骨干网络CSPDarknet53-tiny之后引入空间金字塔池化模块,能够极大...  相似文献   

14.
The detection of rail surface defects is an important tool to ensure the safe operation of rail transit. Due to the complex diversity of track surface defect features and the small size of the defect area, it is difficult to obtain satisfying detection results by traditional machine vision methods. The existing deep learning-based methods have the problems of large model sizes, excessive parameters, low accuracy and slow speed. Therefore, this paper proposes a new method based on an improved YOLOv4 (You Only Look Once, YOLO) for railway surface defect detection. In this method, MobileNetv3 is used as the backbone network of YOLOv4 to extract image features, and at the same time, deep separable convolution is applied on the PANet layer in YOLOv4, which realizes the lightweight network and real-time detection of the railway surface. The test results show that, compared with YOLOv4, the study can reduce the amount of the parameters by 78.04%, speed up the detection by 10.36 frames per second and decrease the model volume by 78%. Compared with other methods, the proposed method can achieve a higher detection accuracy, making it suitable for the fast and accurate detection of railway surface defects.  相似文献   

15.
作为煤质评价的重要指标之一,热值的快速、准确测量对电厂燃煤锅炉的优化燃烧和经济运行至关重要。采用激光诱导击穿光谱(LIBS)技术结合BP神经网络定量分析模型和聚类分析,以35个煤粉样品作为研究对象进行热值的定量分析。基体效应对LIBS光谱数据的显著影响,针对基于某类煤粉样品所建立的定标曲线不能直接用于不同煤种的定量分析,采用K-means聚类方法根据热值、灰分、挥发分把样品分为三类对训练集和预测集样品进行优化选择。通过谱线强度和热值变量相关性分析,同时考虑特征谱线的物理意义,最终提取12条元素谱线的峰值强度作为输入参数,建立BP神经网络模型对燃煤热值进行预测。定标结果表明,建立的神经网络模型具有良好的定量分析能力,定标曲线拟合度R2为0.996,热值预测值的相对误差低于3.42%,多次重复测量的相对标准偏差在4.23%以内。对聚类分析中3类样品具有不同的预测能力,采用峰值强度作为输入参数时,能够在一定程度上减弱试验参数波动和基体效应造成的影响。定量分析结果的重复性和准确性可以通过对不同类别的煤种分别建立BP神经网络模型来进一步改善。LIBS技术结合BP神经网络可以对煤粉热值进行定量分析,在现场在线/快速检测领域具有很好的应用价值和潜力。  相似文献   

16.
杨棣  王元美  李军刚 《物理学报》2018,67(6):60301-060301
在贝叶斯参数估计理论框架下,研究了被测参数的先验分布对有色噪声的抑制作用.选择一个受1/f~α型谱密度有色噪声影响的自旋1/2量子比特作为量子探测系统来估计一个磁场强度的大小,利用贝叶斯代价函数的动力学演化来评判估计的精度,重点研究先验概率分布对噪声非高斯性的限制作用.研究发现:当先验概率的不确定度比较大时,有色噪声的非高斯性对频率估计精度的影响比较小;当先验概率的不确定度比较小时,有色噪声的非高斯性对频率估计精度的影响比较大.  相似文献   

17.
基于神经网络的叶绿素含量精细测量建模方法研究   总被引:3,自引:0,他引:3  
活体植物叶片叶绿素含量SPAD值易受叶片厚度、水分等影响,提出了基于多参数神经网络建模的叶绿素含量精细反演方法。通过测量叶片在中心波长分别为650,940和1 450 nm光照射下的透过率,获得叶片的SPAD值和水分指数WI(water index),同时用数字螺旋测微仪测量相应的叶片厚度并用分光光度法测得其叶绿素含量。利用建模集样本分别建立SPAD值与实测叶绿素含量之间的单参数模型和基于BP神经网络的WI、厚度及SPAD值与实测叶绿素含量之间的非线性模型。利用这两种模型分别计算获得验证集样本的叶绿素含量预测值,对预测值和实测值进行了相关分析和相对误差的分析。实验以340个三种不同植物叶片为样本,用以上方法进行了分析。结果表明,利用BP神经网络建模后,每种植物样本的叶绿素含量预测精度都有不同程度的提高,尤其对于叶片厚度值较大的样本,效果更为明显。数据显示所有混合样本平均相对误差绝对值由单参数模型的7.55%降低到5.22%,实测值与预测值的拟合决定系数由0.83提高到0.93。验证了利用多参数BP神经网络模型可以有效地提高活体植物叶绿素含量预测精度的可行性。  相似文献   

18.
研究韵律特征在说话人确认中的应用。将整个韵律轨迹以固定段长和段移进行片段划分,并对其进行勒让德多项式拟合从而获取连续性的韵律特征,将特征映射到总变化因子空间,并用概率线性判别分析来补偿说话人和场景的差异。在美国国家标准技术研究院2010年说话人识别评测扩展核心测试集5的基础上加入噪声构造测试集,并分别对韵律特征和传统Mel频率倒谱系数进行测试。结果显示,随着信噪比的逐渐减小,Mel频率倒谱系数性能出现大幅度下降,而韵律特征性能相对比较稳定,两种特征融合后能使系统性能得到进一步提升,等错率和最小检测错误代价相对于Mel频率倒谱系数单系统最多能分别下降9%和11%。实验表明,韵律特征应用于说话人识别中具有较强的噪声鲁棒性,且与传统的Mel频率倒谱系数存在较强的互补性。   相似文献   

19.
In view of the low accuracy of the current bridge disease detection algorithm based on convolutional neural network, an improved YOLOX algorithm was proposed to improve the detection accuracy. By using the feature information of the shallow layer of the backbone network, the feature extraction enhancement network was improved, and the feature information of the same layer was added for fusion. An improved coordinate attention mechanism was introduced to combine the position information and the channel information to enhance the network recognition of bridge diseases. At the same time, the localization loss function was improved. The experimental results show that the accuracy of the improved YOLOX network structure for bridge disease detection reaches 92.11%, which is 4.40% higher than the original network. © 2023 Editorial office of Journal of Applied Optics. All rights reserved.  相似文献   

20.
为了提高目标检测的准确度和精确度,提出了一种新的基于特征提取和脉冲耦合神经网络(Pulse-coupled neural network,PCNN)模型的融合算法。该算法的原理是:首先对原图像进行特征提取,然后分别建立基于处理后的图像及原图像的PCNN。融合的作用是通过PCNN的链接输入得以体现的。融合图像综合了各个侧重于原图像不同特征的滤波器的选择性。仿真结果证明,所提出的算法在增加图像目标的可识别程度方面效果明显。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号