首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 139 毫秒
1.
黄宇琛  罗坚  阳强 《光学技术》2023,(1):97-104
通过研究一种基于多尺度卷积神经网络和人体姿态估计模型相结合的多任务步态识别方法,对神经网络识别结果做出一定的解释说明,同时提高其在面对协变量改变场景下的识别效果。该方法将卷积神经网络提取的步态空间特征和人体姿态估计模型得到人体关节时序特征融合,进行身份的识别。使用步态数据集CASIA-B中的正常行走序列和合成行走序列数据以及TUM-GAID步态数据集进行实验。结果表明,该方法在TUM-GAID步态数据集实验中,三种场景T1、T2和T3下的识别率分别达到95.2%、72.4%和84.5%。在CASIA-B步态数据集实验中,对于正常行走序列以及两种合成行走序列,该方法在识别精度上均有较好的表现,体现该模型有较强的鲁棒性。  相似文献   

2.
张江梅  季海波  冯兴华  王坤朋 《强激光与粒子束》2018,30(4):046003-1-046003-5
提出了一种基于稀疏表示的核素能谱特征提取方法,其实质是将核素能谱在区分性最好的稀疏原子上进行投影。利用稀疏分解方法对核素能谱进行稀疏分解,提取分解系数向量作为表征核素的特征向量,通过模式识别分类方法建立分类模型实现核素识别。与传统稀疏分解方法的区别在于:在能谱稀疏分解过程中按照稀疏字典中的原子排列顺序顺次进行分解;其次,分解目的在于特征提取,即最终提取到的特征对不同核素具有可区分性,并不要求核素能谱的重构精度。在241Am, 133Ba, 60Co, 137Cs, 131I和152Eu共6种核素1200个能谱数据上进行了核素识别实验,7种不同分类算法的平均识别率达到91.71%,实验结果的统计分析表明,本文提出的特征提取方法识别准确率显著地高于两种传统核素能谱特征提取方法准确率。  相似文献   

3.
针对红外视频人体行为识别问题,提出了一种基于时空双流卷积神经网络的红外人体行为识别方法。通过将整个红外视频进行平均分段,然后将每一段视频中随机抽取的红外图像和对应的光流图像输入空间卷积神经网络,空间卷积神经网络通过融合光流信息可以有效地学习到红外图像中真正发生运动的空间信息,再将每一小段的识别结果进行融合得到空间网络结果。同时将每一段视频中随机抽取的光流图像序列输入时间卷积神经网络,融合每一小段的结果后得到时间网络结果。最后再将空间网络结果和时间网络结果进行加权求和,从而得到最终的视频分类结果。实验中,采用此方法对包含23种红外行为动作类别的红外视频数据集上的动作进行识别,正确识别率为92.0%。结果表明,该算法可以有效地对红外视频行为进行准确识别。  相似文献   

4.
为解决低信噪比条件下水下目标识别率低的问题,提出一种适用于多通道水听器阵列的深度学习水下目标识别方法。首先是采用子通道特征级联的方法利用多通道信息;在特征提取方面,采用对信号的不同频率区间进行加权的特征提取器,并对提取的特征进行正则规整;最后采用深度神经网络(Deep Neural Network,DNN)实现目标识别。实验首先在仿真条件下对所提出方法的有效性进行验证,结果表明在-15 dB信噪比条件下的五目标识别任务中,使用多通道级联特征的深度神经网络的识别正确率达到96.7%,显著高于基于支持向量机(Support Vector Machine,SVM)的方法。在后续的湖上试验中,深度神经网络的平均正确率达到96.0%,进一步验证了所提出方法的有效性。   相似文献   

5.
基于深度学习的方法,在HL-2A装置上开发出了一套边缘局域模(ELM)实时识别算法。算法使用5200次放电数据(约24.19万数据切片)进行学习,得到一个深度为22层的卷积神经网络。为衡量算法的识别能力,识别了HL-2A装置自2009年实现稳定ELMy H模放电以来所有历史数据(约26000次放电数据),共识别出1665次H模放电,其中误识别35次,误报率为2.10%。在实际的1634次H模放电中,漏识别4次,漏识别率为0.24%。该误报率和漏报率可以满足ELM实时识别的精度要求。识别算法在实时控制环境下,对单个时间点的平均计算时间为0.46ms,可以满足实时控制的计算速度要求。  相似文献   

6.
特征提取是太赫兹光谱识别的关键处理步骤,通常利用降维方法作为特征提取手段。然而,当一些化合物的太赫兹光谱曲线整体差异度较小时,降维方法往往会缺失样本差异的重要特征信息,从而导致分类错误。如果不采用降维方法提取特征,传统机器学习分类算法对维数较高的原始太赫兹光谱数据又不能很好的分类。针对此问题,提出了一种基于双向长短期记忆网络(BLSTM-RNN)自动提取太赫兹光谱特征的识别方法。BLSTM-RNN作为一种特殊的循环神经网络,利用其LSTM单元可以有效解决原始太赫兹光谱数据维数较高使得模型难以训练问题。再结合模型的双向频谱信息利用架构模式,可以增强模型对复杂光谱数据自动提取有效特征信息的能力。采用三类、15种化合物太赫兹透射光谱作为测试对象,首先利用S-G滤波和三次样条插值对Anthraquinone,Benomyl和Carbazole等十五种化合物在0.9~6 THz内的太赫兹透射光谱数据进行归一化处理,然后通过构建一个具有双向长短期记忆的循环神经网络对太赫兹光谱的全频谱信息进行自动特征提取并利用Softmax分类器进行分类。通过试验优化网络结构和各项参数,最终获得了针对复杂太赫兹透射光谱数据的预测模型,并与传统机器学习算法SVM,KNN及神经网络算法MLP,CNN进行对比实验。结果表明,dataset-1和dataset-2分别作为差异度较大和无明显峰值特征的五种化合物太赫兹透射光谱数据集,其平均识别率分别为100%和98.51%,与其他方法相比识别率有所提高;最重要的是,dataset-3作为5种化合物谱线极为相似的太赫兹透射光谱数据集,其平均识别率为96.56%,与其他方法相比识别率提高显著;dataset-4作为dataset-1,dataset-2和dataset-3的透射光谱数据集集合,其平均识别率为98.87%。从而验证了BLSTM-RNN模型能自动提取有效的太赫兹光谱特征,同时又能保证复杂太赫兹光谱的预测精度。在选择模型训练优化算法方面,使用Adam优化算法要好于RMSProp,SGD和AdaGrad,其模型的目标函数损失值收敛速度最快。同时随着模型训练迭代次数增加,相似太赫兹透射光谱数据集的预测准确率也不断提升。可为复杂太赫兹光谱数据库的光谱识别检索提供一种新的识别方法。  相似文献   

7.
常用的梅尔倒谱系数结合高斯混合模型(MFCC+GMM)方法的鸟鸣声识别技术难适应噪声环境,模型难以收敛,且计算复杂度高。该文提出一种融合声纹信息的能量谱图的鸟类识别方法(VPS-BR),该方法利用鸟类鸣声在能量谱图上所表现的多维差异性,定量识别鸣声声纹特征。通过对分贝能量进行颜色映射得到能量谱图,提取其视觉特征所表达的声学特征,分析归纳得到鸟类特有鸣声模式。在特征提取步骤中,选用识别速度快的局部二值模式、识别鲁棒性高的方向梯度直方图两个参数表征鸟鸣声谱图的边缘声纹;在识别步骤中,用局部二值模式和方向梯度直方图两种特征分别与支持向量机、K最近邻和随机森林3种分类器算法进行两两组合构建识别模型测试。对15种原始带噪鸟类鸣声数据集进行交叉验证,VPS-BR模型的平均识别率比MFCC+GMM组合模型高出11.3%,方向梯度直方图特征与K最近邻分类器的组合模型识别率达90.5%,表现出较好的抗噪性能和识别性能。最后针对样本数据集缺乏问题,使用生成对抗网络进行图像增强,进一步将识别率提升1.48%。  相似文献   

8.
《光学学报》2021,41(7):10-20
提出一种新型智能化长距离光纤预警系统,研究了该系统在真实工作环境下的预测准确性。该预警系统主要分为分布式传感和信号识别两个部分,其中相位敏感光时域反射(Φ-OTDR)技术用于系统的分布式传感部分,而神经网络技术用于信号识别部分,以对入侵事件进行识别和分类。在信号识别部分创新地提出了一种改进型神经网络结构,并使用基于小波包分解的神经网络和具有三个隐藏层的神经网络等其他两种方法进行效果对比。最后,通过三次不同的实验,探究了系统的识别准确性。结果表明,基于改进型神经网络的光纤预警系统在入侵事件识别方面具有优良的分类效果,平均识别率达到95%以上。  相似文献   

9.
为提高混沌时间序列的预测精度,提出一种基于混合神经网络和注意力机制的预测模型(Att-CNNLSTM),首先对混沌时间序列进行相空间重构和数据归一化,然后利用卷积神经网络(CNN)对时间序列的重构相空间进行空间特征提取,再将CNN提取的特征和原时间序列组合,用长短期记忆网络(LSTM)根据空间特征提取时间特征,最后通过注意力机制捕获时间序列的关键时空特征,给出最终预测结果.将该模型对Logistic,Lorenz和太阳黑子混沌时间序列进行预测实验,并与未引入注意力机制的CNN-LSTM模型、单一的CNN和LSTM网络模型、以及传统的机器学习算法最小二乘支持向量机(LSSVM)的预测性能进行比较.实验结果显示本文提出的预测模型预测误差低于其他模型,预测精度更高.  相似文献   

10.
为改善集输立管系统流型识别实时性,本文初步提出了一种基于非完整周期信号的识别方法。从严重段塞流过程中液塞生长、液塞流出、气液喷发、液塞回落的某一阶段或相邻两阶段选取较短时长的压力、压差波动信号序列,采用计算速度较快的方法进行特征提取。通过自组织神经网络融合局部流动特征,描述集输立管系统空间流动特性,实现流型识别。本文实验流速范围内,该方法对稳定流型与不稳定流型的平均识别率达到90%以上,初步验证了该方法的可行性。  相似文献   

11.
现在樱桃市场上存在着大量以次充好的不良现象,严重损害了名牌樱桃的品牌经济效益,所以亟需一种能对不同产地樱桃实现快速无损鉴别的技术。拉曼光谱溯源技术作为光谱溯源技术的一种,由于具有快速、高效、无污染、无损分析等优点,逐渐得到相关研究者的重视。长短期记忆(LSTM)网络是一种具有记忆性的反馈神经网络,它是循环神经网络的一种变体。LSTM网络克服了循环神经网络中梯度消失的缺点,适合处理序列敏感的问题和任务,目前被广泛应用在语音识别、图像识别和手写识别等领域,但LSTM网络在产地溯源方面的应用还有待研究。基于此,提出了一种LSTM网络与拉曼光谱技术结合的能对不同产地樱桃实现快速无损鉴别的技术。将来自美国、山东和四川的369个樱桃作为研究样本,用拉曼光谱仪在785 nm激光下获得了不同产地樱桃的光谱数据。并且以每条经过基线校正后的拉曼光谱数据作为网络输入数据,基于LSTM网络构建了能对不同产地樱桃实现快速鉴别的判别模型,并且以样本判别准确率A、样本精确率P、样本召回率R和样本F值作为评价指标,探究了不同预处理方法对LSTM网络判别模型性能的影响。结果表明:当样本训练集和测试集的比例为85∶38时,直接采用原始拉曼光谱数据的LSTM网络模型的产地鉴别能力不高,鉴别准确率为79.87%。但当使用预处理过后的拉曼光谱数据,模型的鉴别准确率维持在92%以上。并且光谱经过SG+MSC预处理后模型的鉴别准确度最好,鉴别准确率达99.12%。同时在采用SG+MSC预处理的方法下,LSTM网络鉴别模型的精确率、召回率、F值均较高,表明了所提出的LSTM网络模型有较好的性能可实现对不同产地樱桃的鉴别,为樱桃的产地溯源提供了一种新的思路。  相似文献   

12.
矿井水害对煤矿安全生产存在巨大威胁,所以快速识别矿井突水水源,对煤矿水灾预警及灾后救援工作开展都有重大意义。激光诱导荧光(LIF)技术具有快速、高效、灵敏度高等特点,克服了传统水化学方法识别时间长的缺点。循环神经网络(RNN)在解决长序列训练过程中产生的梯度消失、梯度爆炸等问题上存在明显不足,而特殊变体RNN即长短期记忆(LSTM)神经网络很好地弥补了RNN的短板及缺陷。提出了将LIF技术与LSTM算法相结合,应用在矿井突水水源快速识别中。实验样本采自淮南矿区,以砂岩水和老空水为原始样本,并将砂岩水和老空水按照不同比例混合配置成5种混合水样,共7种待测水样进行实验。首先采用最大最小值归一化(MinMaxScaler)、平滑滤波(SG)以及标准正态变量变换(SNV)三种预处理方法对原始光谱数据进行预处理,减少原始光谱数据存在的噪声和干扰信息。之后为防止数据量过大,维度过高,将包括原始光谱数据在内的四组数据再进行LDA降维至3维。最后分别搭建LSTM识别模型,从测试集预测准确率、训练集准确率变化趋势以及训练集损失函数变化趋势三个方面进行比较,选择最优模型。其中SG+LDA+LSTM和Original+LDA+LSTM在测试集预测准确率上都能达到100%,MinMaxScaler+LDA+LSTM测试集预测准确率在98.57%,SNV+LDA+LSTM准确率最低,只有87.14%;在训练集准确率变化趋势表现上,SG+LDA+LSTM能够保持良好的学习,很快达到100%,Original+LDA+LSTM和MinMaxScaler+LDA+LSTM也能达到100%的准确率,但在前几次训练过程中会有准确率下降的情况出现,SNV+LDA+LSTM训练集准确率在训练次数内并未达到100%;SG+LDA+LSTM损失函数变化趋势也具有很好的收敛性和稳定性,Original+LDA+LSTM,MinMaxScaler+LDA+LSTM以及SNV+LDA+LSTM在损失函数变化趋势上表现并不出色。结果表明,4组模型中,SG+LDA+LSTM模型是最适合应用于矿井突水识别,该方法补充了矿井突水水源识别工作的内容,为矿井突水识别提供了新的思路。  相似文献   

13.
张志浩  王坤侠 《应用声学》2022,41(5):843-850
语声情感识别对人机交互和情感计算研究领域具有重要作用,各类研究方法层出不穷。近期研究学者应用卷积神经网络和长短期记忆网络方法提取对数Mel谱图空间特征和时间特征,取得了一定的成果。然而不论是卷积神经网络还是长短期记忆网络提取特征时,都会产生特征冗余,导致语声情感识别效果下降。针对这一问题,该文提出了一种基于时空注意力机制的卷积-递归神经网络模型,采用对数Mel谱图和其一阶差分、二阶差分作为特征输入,在使用卷积神经网络提取空间特征和长短期记忆网络提取时间特征时,加入空间注意力和时间注意力机制,从而使上述网络能够更好地提取到对数Mel谱图中有效表征情感的空间特征和时间特征。该模型在Emo-DB和IEMOCAP语声数据集上的加权准确率分别达到86.8%、69.4%,未加权准确率分别达到84.7%、65.5%,优于当前大多数先进方法。  相似文献   

14.
煤矿突水类型的快速识别在矿井安全生产中意义重大,煤矿突水激光诱导荧光(LIF)光谱的识别方法,需要对光谱曲线进行预处理和特征提取,其过程较复杂,对此,提出了一种卷积神经网络(CNN)快速识别矿井突水类别的方法。根据煤矿矿井水层的分布特点和最常见煤矿突水类型,选取三种原始水样以及由原始水样混合的两种混合水为实验材料,利用LIF技术快速获取五种水样的200组荧光光谱曲线图,灰度化后输入CNN算法,其中150组光谱曲线图用于CNN的训练,剩余50组用于训练好的模型测试。模型测试中,CNN算法对实验水样光谱曲线图的识别率为100%,实验结果表明,CNN算法不仅能省去煤矿突水光谱图像识别中的数据处理和特征提取工作,而且还能快速有效的识别矿井突水类型。  相似文献   

15.
对船舶柴油机而言,润滑油常受到冷却液的污染,引起润滑油劣化变质,从而导致其功能失效。冷却液的主要成分是水、乙二醇及少量的防腐蚀、抗穴蚀、消泡沫等添加剂。将拉曼光谱用于检测润滑油被冷却液污染的浓度,是一种针对复杂混合物的拉曼光谱检测问题,单个拉曼峰强度的定量分析方法无法满足浓度的定量检测。为此,将拉曼光谱分析和LSTM神经网络数据挖掘方法应用于检测润滑油冷却液污染的浓度。在实验室条件下,配制了冷却液污染浓度为2%,1.5%,1%,0.5%,0.25%和0%的柴油机润滑油油样,对每个油样取样50次,并进行拉曼光谱分析,共获得300个拉曼光谱数据,随机抽取其中80%的数据作为神经网络训练样本,剩余20%的数据作为测试样本,拉曼光谱样本数据的光谱范围为300~2 000 cm-1;对数据进行预处理,包括采样、拟合、离散点平均梯度估计等;构建训练样本集,将LSTM神经网络和多层全连接层(FC)结合,建立4种不同的神经网络模型结构;得到其在训练集和测试集上的平均误差曲线、测试集上的检测准确率曲线。分析结果表明,FCs,LSTM-FCs-1,LSTM-FCs-2和LSTM-FCs-3等4种神经网络模型,检测准确率分别为96.7%,93.3%,98.3%和83.3%。选取任意1%的波数点,加入幅值随机正负变化1%的噪声之后,4种神经网络模型的检测准确率分别为88.3%,90.0%,96.7%和78.3%。可见,相比于其他3种神经网络结构模型,LSTM-FCs-2模型更适用于进行润滑油冷却液污染的定量估计,加噪后最高准确率仍可以达到96.7%,鲁棒性优于其他三种模型。拉曼光谱结合LSTM网络中的LSTM-FCs-2模型,应用于冷却液污染浓度分别为0.2%和0.4%的实际油样检测,相对误差分别为5.0%和7.5%,结果表明该方法可用于在用润滑油冷却液污染浓度的检测。  相似文献   

16.
胚蛋雌雄识别一直是家禽业发展的瓶颈问题,在禽肉生产过程中倾向于养殖雄性个体,而禽蛋生产产业倾向于养殖雌性家禽。若能在孵化过程中较早鉴别出种蛋的雌雄,不仅能够降低家禽孵化产业的成本,还能够提高禽蛋和禽肉生产行业的经济效益。该文以种鸭蛋为研究对象,为了在种鸭蛋孵化早期实现对种蛋的雌雄识别,构建了可见/近红外透射光谱信息采集系统,在200~1 100 nm的波长范围内采集了345枚孵化了0~8 d的种鸭蛋光谱数据。搭建了适用于种鸭蛋光谱信息的6层卷积神经网络(convolutional neural network, CNN),其中包括输入层、3个卷积层、全连接层与输出分类层。卷积层可以提取光谱中的有效信息,全连接层通过对卷积层提取的局部特征进行整合供输出层分类决策。另外在卷积神经网络中引入局部响应归一化和dropout操作能够加快网络的收敛速度。利用该卷积神经网络构建鸭胚雌雄信息识别网络,通过对比与分析不同孵化天数的识别效果,发现孵化7d的识别效果最佳。随后将孵化7 d的种鸭蛋原始光谱数据进行噪声去除,选取500~900 nm波段用于后续的特征波长选取和建模。分别运用了竞争性自适应重加权算法(CARS)、连续投影算法( SPA)与遗传算法(GA)选择能够区分鸭胚性别的波长点,将选取的特征波长转换为二维的光谱信息矩阵,二维光谱信息矩阵保留了一维光谱的有效信息,同时极大地方便了与卷积神经网络的结合。利用二维光谱信息矩阵和卷积神经网络相结合,实现孵化早期阶段鸭胚的雌雄识别。经检验,基于 SPA算法和CNN网络建立的模型效果较佳,其中训练集、开发集及测试集的准确率分别为93.36%,93.12%和93.83%;基于GA算法和CNN网络建立的模型效果次之,训练集、开发集及测试集的准确率分别为90.87%,93.12%和86.42%;基于CARS算法和CNN网络建立的模型的训练集、开发集及测试集的准确率分别为84.65%,83.75%和77.78%。研究结果表明基于可见/近红外光谱技术和卷积神经网络可以实现孵化早期鸭胚胎雌雄的无损鉴别,为后续相关自动化检测装置的研发提供了技术支撑。  相似文献   

17.
采用静态迈克尔逊干涉仪对待测目标进行光谱识别,在空间干涉长度不变的条件下,应用BP神经网络算法对混合光谱分离过程进行优化,从而达到提高伪装目标识别概率的目的。由干涉仪及线阵CCD记录视场内所有位置上的光谱信息,构成混合光谱数据集合,以已知材料的标准吸收光谱作为隐含层的规则依据,将BP神经网络应用于混合光谱的分离。实验采用不同距离、不同背景组合的混合光谱作为初始数据,以1.5 m×1.5 m钢板做成四种待测目标,由静态迈克尔逊干涉仪得到混合光谱,BP神经网络算法与传统光谱吸收算法对无伪装目标的识别率都在90%以上,对具有伪装效果的待测目标识别概率分别为75.5%和31.7%,所以采用BP神经网络可有效地提高伪装目标的识别概率。  相似文献   

18.
恒星光谱数据的分类是天体光谱自动识别的最基本任务之一,光谱分类的研究能够为恒星的演化提供线索。随着科技的发展,天文数据也向大数据时代迈进,需要处理的恒星光谱数量越来越多,如何对其进行自动而精准地分类成为了天文学家要解决的难题之一。当前恒星光谱自动分类问题的解决方法相对较少,为此本文使用了一种基于卷积神经网络的方法对恒星光谱MK系统进行分类。该网络由数据输入层、四个卷积层、四个池化层、全连接层、输出层构成,与传统网络相比具有局部感知、参数共享等优点实验。在Python3.5的环境下编程,利用Tensorflow构建了一个简单高效的具有四个卷积层的卷积神经网络,并将Dropout作用于全连接层之后以防止过度拟合。Dropout的基本思想:当网络模型进行训练时,把一些神经网络节点按一定的比例丢弃,使其暂时不发挥作用。Dropout可以理解成是一种十分高效的神经网络模型平均方法,由于它不依赖于某些局部特征所以能够让网络模型更加鲁棒。实验中使用的一维恒星光谱图是取自LAMOST DR3数据库,首先进行预处理截取光谱3 600~7 300 Å的部分,均匀采样后使用min-max标准化法对其进行初始化。实验包括两部分:第一部分为依据恒星光谱MK系统对光谱进行分类,每一类的训练样本包含1 000条光谱数据,测试样本为400条光谱数据,首先通过训练样本对CNN网络进行训练,进行3 000次的迭代,用训练后的网络将测试样本进行分类以验证网络的准确性;第二部分为相邻两类的恒星光谱的分类,其中O型星数据集样本为250条光谱,其余类别恒星样本数据集均为4 000条光谱,将数据5等分,每次选取当中的一份当作测试集,其余部分当作训练集,采用5折交叉验证法求得模型准确率,用BP神经网络进行对比实验。选择对网络模型进行评估的指标包括精确率P、召回率R、F-score、准确率A。实验结果显示CNN在对六类恒星光谱进行分类时其准确率都在95%以上,在对相邻类别的恒星进行分类时,由于O型星样本量较少,所以得到的分类结果不太理想,对其余类别的恒星分类准确率都高于98%,以上结果都证明了CNN算法能够很好地解决恒星光谱的分类问题。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号