首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 250 毫秒
1.
特征提取和分类是太赫兹光谱识别的关键。部分物质在太赫兹波段内没有明显的吸收峰,难以人工定义、提取特征及分类识别,为此,结合深度信念网络(deep belief network,DBN)和K-Nearest Neighbors (KNN)分类器的优点,提出了一种基于DBN的太赫兹光谱识别方法。首先利用S-G滤波和三次样条插值对ATP,acetylcholine_bromide,bifenthrin,buprofezin,carbazole,bleomycin,buckminster和cylotriphosphazene在0.9~6 THz内的太赫兹透射光谱进行归一化处理;然后由两层受限波尔兹曼机(restricted Boltzmann machine, RBM)构建DBN模型,并采用逐层无监督的方法训练模型,以自动提取太赫兹光谱特征;最后用KNN分类器对8种物质的太赫兹透射光谱进行分类。结果表明,使用DBN自动提取的光谱特征,KNN分类器、BP神经网络、SOM神经网络和RBF神经网络的分类准确率达到了90%以上,且KNN分类器的识别率优于其他三种分类器;采用DBN自动提取物质的太赫兹光谱特征大大减少了工作量,在海量光谱数据识别中具有广阔的应用前景。  相似文献   

2.
许多太赫兹光谱物质识别方法依靠寻找该物质在太赫兹波段范围内不同光谱表现出的不同特征来识别特定物质。吸收峰提取法是常用的光谱特征提取算法,但当光谱无明显特征吸收峰或峰位、峰值相近或难以识别时,难以利用吸收峰特征辨别物质。将机器学习和统计学习技术用于太赫兹光谱的识别中虽减少了吸收峰的干扰,但常常需要人为定义特征而导致分类误差。深度学习法能自动提取特征,但在识别前往往需要进行复杂的预处理操作,并且在特征提取的过程中容易丢失部分特征从而导致分类误差。针对以上问题,提出了一种基于小波系数图和卷积神经网络的太赫兹光谱识别方法。利用太赫兹光谱信号进行小波变换时,由于小波系数矩阵的每一行系数与原始光谱信号存在着对应关系,因此将太赫兹光谱的吸收系数通过小波变换在频率域上展开,能得到不同的二维的频率-尺度分布图,又称小波系数图。然后构造一个卷积神经网络(CNN)对小波系数图进行分类,可得到太赫兹光谱物质的分类结果。为了验证所提出算法的有效性,将三组小波系数图数据与原始光谱数据分别输入CNN、Support Vector Machin (SVM)、Multilayer Perceptron (MLP)三种不同的分类器作对比,从实验结果可以发现本文算法在三组数据中的识别率均达到了100%,说明相比于传统方法,本文方法能准确分类没有明显特征吸收峰的光谱,证明了使用卷积神经网络识别小波系数图的有效性。为了体现本文算法的优势,与小波脊线寻峰识别算法作对比,实验结果表明本文算法几乎不受峰频、峰位、峰值的影响,无论是识别不存在吸收峰的淀粉,还是识别相似度高的蔗糖和葡萄糖,都具有较高的识别率,分类准确率达97.62%,证明了所提算法的优越性。该算法为太赫兹光谱数据识别提供了一种新思路,同时也可以推广运用到其他谱图物质的识别中。  相似文献   

3.
基于扩散映射的太赫兹光谱识别   总被引:1,自引:0,他引:1  
特征提取对于太赫兹光谱识别来说至关重要。传统方法是通过人工选取太赫兹光谱中差异性较大的吸收峰作为特征进行光谱识别,但当部分物质在太赫兹波段没有明显波峰、波谷等光谱图形特征时,这种方式便不再适用。为此,研究人员利用统计学习与机器学习方法对高维太赫兹光谱数据进行降维和特征提取。由于物质的太赫兹光谱数据各维度呈现非线性,尤其是当不同物质的太赫兹光谱曲线整体非常相似时,线性处理方法易产生较大误差。针对这一问题,提出了一种基于扩散映射(DM)的太赫兹光谱识别方法。扩散映射能在保持数据内在几何结构的同时对其进行非线性降维,提取的流形特征区分度较高,对数据还有聚类效果。首先用S-G滤波器对Alloxazine等10种物质的太赫兹光谱样本进行滤波,并用三次样条插值法对截取相同频段后的光谱样本进行统一分辨率处理;然后利用DM将高维太赫兹光谱数据映射到低维特征空间并提取太赫兹光谱的流形特征;最后用多分类支持向量机(M-SVM)对十种物质的太赫兹透射光谱进行分类。实验结果表明,相比于主成分分析(PCA)和等距映射(ISOMAP),使用DM提取的太赫兹光谱流形特征具有更高的区分度,而且DM可以直接得到太赫兹光谱数据本征维数的估计值,这为相似太赫兹光谱的快速精准识别提供了一条新的途径。  相似文献   

4.
针对太赫兹光谱线性不可分的情况,提出结合径向基函数和核主成分分析(KPCA)的方法进行食用油太赫兹光谱特征提取。该方法所提取到的特征类内距离小,类间距离大,在大多数支持向量机(SVM)分类器可以建立准确的分类模型。太赫兹光谱是检测食用油种类和品质的一种重要手段,研究针对食用油太赫兹光谱的特征提取技术对于食用油种类和品质快速检测具有重要意义。虽然利用太赫兹光谱检测食用油种类和品质已经具备理论基础,但是如何准确提取食用油太赫兹光谱的特征,从而建立更加准确的分类模型依然是一个难点。目前研究人员常常采用化学计量学中的主成分分析法(PCA)提取特征,结合机器学习的方法建立物质分类模型。然而,食用油的太赫兹光谱的线性可分情况在不同频段有不同的特性。当食用油的太赫兹光谱线性可分时,使用PCA提取特征是可行的,容易建立准确的分类模型。但是,当食用油的太赫兹光谱线性不可分时,使用PCA提取到的特征往往不够准确,需要选择合适的分类器去建立准确的分类模型。结合径向基函数和KPCA的特征提取方法通过径向基函数将线性空间不可分的太赫兹光谱数据映射到径向基空间,然后使用KPCA提取特征,最终实现特征线性可分,从而可以建立更加准确的分类模型。实验首先使用滑动窗口平均滤波算法对3种食用油太赫兹光谱数据进行滤波处理,接着使用径向基函数对太赫兹光谱进行非线性映射,然后采用KPCA进行数据降维,最后用支持向量机对食用油建立分类模型,验证特征提取效果。类间可分性计算结果表明,该方法所提取的特征类内距离更小,类间距离更大,整体上特征提取效果优于PCA和KPCA。基于不同内核的SVM模型上进行分类验证的实验结果表明,在PCA和KPCA提取的特征在一些分类模型上无法准确区分食用油种类的情况下,该工作特征提取方法在各种内核的SVM模型上均能准确区分食用油种类。所提出的方法用于食用油太赫兹光谱特征提取有更好的效果,在食用油品质检测与分析方面具有良好的应用价值。  相似文献   

5.
物质的太赫兹光谱具有唯一性。目前,结合先进的机器学习方法,研究基于规模光谱数据库的太赫兹光谱识别技术已成为太赫兹应用技术领域的重点。考虑到由于实验条件及实验设备的影响,很难收集到多物质均衡光谱数据,而这又是对太赫兹光谱数据进行分类的基础。针对这一问题,提出一种基于WGAN的不均衡太赫兹光谱识别方法。WGAN作为生成数据的一种新方法,将模型达到纳什均衡条件下的生成数据用来补充数据集,使其达到类别均衡。生成数据可以有效映射真实数据分布,通过将生成数据与真实数据混合训练可以提高识别不均衡光谱数据的准确率。采用三种特征谱较为相似的麦芽糖化合物的太赫兹透射光谱数据进行验证,首先利用S-G滤波和三次样条插值法对三种物质的光谱数据进行归一化处理,然后通过构建WGAN模型对三种物质的不均衡太赫兹光谱数据进行扩展,使其达到类别均衡。实验在同一测试集下进行验证,并利用三组对比实验证明WGAN在不均衡数据集处理中的效果。首先利用WGAN生成数据,随着迭代次数的增加,生成数据逐渐符合真实数据分布。实验结果证明,使用WGAN扩展后的数据集训练SVM模型,可以解决模型在测试集上小样本数据(Maltotriose,Malthexaose)偏向大样本数据(Maltoheptaose)的问题。在将WGAN与传统处理不均衡数据集方法FWSVM和COPY对比后发现,三种分类算法在dataset-1数据集上的训练集准确率都能达到90%以上。但是由于模型泛化能力的限制,传统方法在测试集上的效果并不是很理想,而使用WGAN后的测试集准确率却能达到91.54%。在不同不均衡度方面,采用不均衡度为16,81和256的数据集进行验证,其三个测试集上的准确率分别为92.08%,91.54%和90.27%,可满足实际工作中处理不同不均衡度的要求。  相似文献   

6.
物质的太赫兹光谱包含着非常丰富的物理和化学信息。它对化合物晶体具有高的灵敏度、 单光子能量低等特点。但受到检测人员知识背景、 背景噪声、 识别算法精度等因素的影响,光谱样本识别准确率和效率较低。为了提高对太赫兹光谱的检测能力,提出应用基于凸组合核函数的support vector machines(SVM)对化合物的THz脉冲透射谱进行分类。在使用小波变换对数据进行滤波预处理之后,提取了传统波峰、 波谷位置特征和term frequency-inverse document frequency (TF-IDF) 最大间隔特征。TF-IDF方法使用信息论的原理确定每个采样点的权重,选择权重较大的点作为特征。针对太赫兹透射谱特征相似、 维数较低带来的分类困难问题,构建基于凸组合核函数的SVM分类模型。并利用核评价的方法,通过高维非线性规划方程求解最优凸组合参数。当最优凸组合参数被确定时,构建分类模型进行分类和预测。相比较于单一核函数,凸组合核函数将透射谱特征与分类模型融合起来。对于不同的检测样本,数据经过凸组合核函数映射到高维空间后,特征具有更显著的区分度。使用不同的太赫兹透射谱样本进行分类实验,结果表明,分类准确率得到极大提高。  相似文献   

7.
很多物质在太赫兹波段内的光谱参数具有指纹特征,这是太赫兹技术在安检等众多领域有所应用的基础。但是,目前常用的太赫兹时域光谱(THz-TDS)技术提取物质光学参数的Duvillaret算法,要求样品上下表面平行且充分光滑。然而在很多有潜力的实际应用场合中,尤其是对于固体样品,表面粗糙度不可避免,并且不能使用模具压片等实验室制样手段来保证其表面的平行光滑特性,由此需要一种不受样品表面粗糙度影响且更具有普适性的光学参数提取算法来增加太赫兹时域光谱技术在实际场合下的应用能力。分析了太赫兹波透射表面粗糙样品的光程,建立了包含有样品粗糙度、折射率和消光系数的表面粗糙样品太赫兹透射模型,在已知粗糙度及平均厚度的条件下,提取出在太赫兹波段有特征吸收的表面粗糙样品的折射率和吸收系数,验证了此透射模型的适用性。首先,选择在太赫兹波段有特征吸收的α-乳糖和L-组氨酸作为实验材料,制作了质量分数和密度相同的表面粗糙样品和光滑样品,并在太赫兹时域光谱系统中获取它们的太赫兹透射实验数据;然后,利用建立的透射模型从实验数据中提取出了表面粗糙α-乳糖和L-组氨酸样品的折射率和吸收系数;最后,为衡量透射模型提取结果的优劣性,把Duvillaret算法作为另一种光学参数提取的参照方法,将本模型算法、Duvillaret算法对表面粗糙样品的提取结果分别与从平行光滑样品中提取的标准结果进行比较,计算两种提取方式与标准值之间的均方根误差(RMSE)。比较结果表明,相比于Duvillaret算法,本透射模型方法所提取出的表面粗糙样品的折射率和吸收系数与标准值之间偏差更小,在一定程度上减少了粗糙度对提取结果的影响,具有更高的精确度。因此,在已知表面粗糙样品的粗糙度以及平均厚度的条件下,利用此模型可较为精确地在太赫兹时域光谱系统中提取出物质的光学参数。此研究结果将有力推进太赫兹波光学参数提取技术的实际应用。  相似文献   

8.
近红外光谱是热门的食品检测方法之一,对于这种高维光谱数据的分析常常需采用数据降维算法提取其中的特征,然而绝大多数算法都只能针对单个数据集进行分析。虽然已有基于对比学习的对比主成分分析成功应用于不同水果表面农残的近红外光谱检测中,但是该方法只能以线性的方式组合原有特征,特征提取效果存在局限性,并且需要调节对比参数来控制背景集影响,需要消耗更大的时间成本。cVAE(contrastive variational autoencoder)是一种基于对比学习和变分自编码器的改进算法,被用于图像去噪和RNA序列分析中,它仍然具备分析多个数据集的特点,同时因为组合了神经网络的概率生成模型而具备了提取非线性隐含特征的能力。将cVAE算法应用于近红外光谱分析,建立了准确的近红外光谱数据降维模型。在实际验证中,使用cVAE算法对购买的不同品牌和批次纯牛奶中掺假三聚氰胺进行检测。结果表明,使用VAE算法只能区分出不同品牌和批次的纯牛奶,而其中是否掺假三聚氰胺这一重要信息无法表现出来;而使用cVAE算法进行数据分析时,由于添加了背景数据集分离了无关变量,能够清晰的将有无掺假三聚氰胺的样本分类。这说明了,cVAE不仅具备了cPCA(contrastive principle component analysis)在近红外光谱数据降维中的优势,而且具备提取非线性特征的能力,同时不需要调节可变参数,能够更方便地建立近红外光谱降维模型。  相似文献   

9.
玉石是一种稀有的矿物质,自古以来备受国人喜爱,其真伪鉴别一直是珠宝鉴别行业的棘手难题,传统的鉴别方法已经难以实现对真假玉石的准确鉴别。太赫兹检测技术可以实现快速无损检测,在混合物的分类鉴别方面,有广泛的应用。基于太赫兹时域光谱技术和模式识别技术,对来自我国新疆、青海,以及巴基斯坦、阿富汗四个地区的软玉样品及玻璃、大理石、石包玉三种仿品,使用透射模式测得样品在0.1~1.5 THz频率范围内的太赫兹谱,通过参数提取得到其折射率谱线。由于其化学成分的复杂和多样性,仅靠其特征谱线图,并不能正确的区分软玉和仿品,为了更好的对其进行鉴别,需要建立分类模型。采用主成分分析(PCA)对实验得到的原始折射率数据进行降维和特征提取,作出样品在第一、二主成分上的二维得分图,在图中可以看出软玉和仿品能够很明显的区分开来。在经过降维处理之后的数据中,随机选取其中的四分之三作为训练集,剩下的作为测试集,输入到支持向量机(SVM)建立的分类模型中,并引入网格搜索(GridSearch)、遗传算法(GA)和粒子群算法(PSO)对支持向量机参数进行优化。结果显示,基于网格搜索的支持向量机最优参数c=2.828 4,g=2,识别率为97.7%,运行时间为1.39 s,用时最短;基于遗传算法的支持向量机最优参数c=1.740 1,g=4.544 6,识别率为98.3%,运行时间为3.6 s;基于粒子群算法的支持向量机最优参数c=11.287 2,g=1.833 1,识别率为98.6%,运行时间为6.13 s,用时最长。虽然三种优化算法得到的最优参数不同,但均可实现正确的分类。研究结果表明,使用太赫兹时域光谱技术结合模式识别方法可以快速、准确的鉴别软玉和仿品,这为玉石的鉴别提供了一种新手段。  相似文献   

10.
核优化相关向量机太赫兹频谱特征提取方法   总被引:1,自引:0,他引:1  
太赫兹频谱对分子非局域振动模式的变化较为敏感。因此,其波形容易受到多种理化因素的影响,会产生峰值改变、频移,甚至整体波形的变化,单一地从固定峰值特征与物质的对应关系上进行组分分析和物质鉴别容易产生较大误差甚至错误。针对此问题,提出区别于局部特征提取方法的基于核优化相关向量机(KO-RVM)的整体图形特征提取方法,并与支持向量回归算法(SVR)进行比较。结果表明,经过期望最大化算法进行基函数参数控制的RVM适用于太赫兹透射谱的特征提取,可对每种物质的光谱数据进行稀疏表示,控制提取图形特征的数量。利用已提取特征构造的模型能够还原频谱曲线的整体特征,对谱线各频段的拟合效果更加一致,同时所提取的特征还可作为不同物质间太赫兹光谱相似性度量和共同特征发现的依据。  相似文献   

11.
现在樱桃市场上存在着大量以次充好的不良现象,严重损害了名牌樱桃的品牌经济效益,所以亟需一种能对不同产地樱桃实现快速无损鉴别的技术。拉曼光谱溯源技术作为光谱溯源技术的一种,由于具有快速、高效、无污染、无损分析等优点,逐渐得到相关研究者的重视。长短期记忆(LSTM)网络是一种具有记忆性的反馈神经网络,它是循环神经网络的一种变体。LSTM网络克服了循环神经网络中梯度消失的缺点,适合处理序列敏感的问题和任务,目前被广泛应用在语音识别、图像识别和手写识别等领域,但LSTM网络在产地溯源方面的应用还有待研究。基于此,提出了一种LSTM网络与拉曼光谱技术结合的能对不同产地樱桃实现快速无损鉴别的技术。将来自美国、山东和四川的369个樱桃作为研究样本,用拉曼光谱仪在785 nm激光下获得了不同产地樱桃的光谱数据。并且以每条经过基线校正后的拉曼光谱数据作为网络输入数据,基于LSTM网络构建了能对不同产地樱桃实现快速鉴别的判别模型,并且以样本判别准确率A、样本精确率P、样本召回率R和样本F值作为评价指标,探究了不同预处理方法对LSTM网络判别模型性能的影响。结果表明:当样本训练集和测试集的比例为85∶38时,直接采用原始拉曼光谱数据的LSTM网络模型的产地鉴别能力不高,鉴别准确率为79.87%。但当使用预处理过后的拉曼光谱数据,模型的鉴别准确率维持在92%以上。并且光谱经过SG+MSC预处理后模型的鉴别准确度最好,鉴别准确率达99.12%。同时在采用SG+MSC预处理的方法下,LSTM网络鉴别模型的精确率、召回率、F值均较高,表明了所提出的LSTM网络模型有较好的性能可实现对不同产地樱桃的鉴别,为樱桃的产地溯源提供了一种新的思路。  相似文献   

12.
快速准确的识别突水类型和突水来源对煤矿安全开采具有重要意义,激光诱导荧光(LIF)技术在检测中具有快速性和灵敏性,将LIF应用于煤矿突水的检测,再结合模式识别算法,可快速识别出突水来源。目前用于识别水样光谱的算法过于依赖预先建立的水样光谱数据库,当突水水源不在该库中时,易引发误识别。无监督学习算法DBSCAN在聚类时不需样本集的标签和类别信息,能降低对未知类别的误识别,因此把DBSCAN算法用于突水的激光诱导荧光光谱识别,并将MVO用于DBSCAN的参数寻优,省去繁琐的人工参数寻优过程。实验中,从谢桥煤矿采水点获取四个水样,利用像素为2 048的USB2000+光谱仪采集水样的荧光光谱,每种水样采集30组光谱数据。首先,利用无监督学习算法自动编码器(AE)对原始光谱数据降维,以减少光谱数据中冗余信息对聚类的影响,设计的AE的结构是介于浅层和深层之间的多层网络模型,可将原始光谱数据降到2维;为使降维模型具有稀疏性,在传统的AE算法中加入一个Dropout层,由实验可知,加入Dropout层后的降维模型具有较快的收敛速度。将多元宇宙优化(MVO)算法用于DBSCAN参数寻优,在参数寻优过程中,DBSCAN对降维后的水样光谱识别率最高为97.5%,此时参数所对应的取值范围为[0.023 66 0.040 65];为验证AE对水样光谱数据降维的有效性,把归一化后的未降维的光谱数据用于DBSCAN聚类识别,DBSCAN对原始水样光谱的识别率最高为95%,比降维后的后水样光谱识别率低了2.5%,结果表明,使用AE降维光谱数据,可提高DBSCAN对不同光谱的识别率。最后,用监督学习算法K最近邻(KNN)识别降维后的水样光谱,将识别结果和无监督学习算法DBSCAN的识别结果对比,其中训练集选用三种水样,测试集使用四种水样;在测试集中,监督学习算法只能准确地识别训练集所包含的水样类别,但把训练集没有的类别全部识别错误,而DBSCAN能准确的识别出训练集中没有的水样光谱。非线性降维算法AE能实现对高维的水样光谱数据降维,把MVO-DBSCAN用于煤矿突水水源的LIF光谱识别,可有效降低因矿井水源光谱数据库建立不完备而引起的误识别。  相似文献   

13.
恒星光谱数据的分类是天体光谱自动识别的最基本任务之一,光谱分类的研究能够为恒星的演化提供线索。随着科技的发展,天文数据也向大数据时代迈进,需要处理的恒星光谱数量越来越多,如何对其进行自动而精准地分类成为了天文学家要解决的难题之一。当前恒星光谱自动分类问题的解决方法相对较少,为此本文使用了一种基于卷积神经网络的方法对恒星光谱MK系统进行分类。该网络由数据输入层、四个卷积层、四个池化层、全连接层、输出层构成,与传统网络相比具有局部感知、参数共享等优点实验。在Python3.5的环境下编程,利用Tensorflow构建了一个简单高效的具有四个卷积层的卷积神经网络,并将Dropout作用于全连接层之后以防止过度拟合。Dropout的基本思想:当网络模型进行训练时,把一些神经网络节点按一定的比例丢弃,使其暂时不发挥作用。Dropout可以理解成是一种十分高效的神经网络模型平均方法,由于它不依赖于某些局部特征所以能够让网络模型更加鲁棒。实验中使用的一维恒星光谱图是取自LAMOST DR3数据库,首先进行预处理截取光谱3 600~7 300 Å的部分,均匀采样后使用min-max标准化法对其进行初始化。实验包括两部分:第一部分为依据恒星光谱MK系统对光谱进行分类,每一类的训练样本包含1 000条光谱数据,测试样本为400条光谱数据,首先通过训练样本对CNN网络进行训练,进行3 000次的迭代,用训练后的网络将测试样本进行分类以验证网络的准确性;第二部分为相邻两类的恒星光谱的分类,其中O型星数据集样本为250条光谱,其余类别恒星样本数据集均为4 000条光谱,将数据5等分,每次选取当中的一份当作测试集,其余部分当作训练集,采用5折交叉验证法求得模型准确率,用BP神经网络进行对比实验。选择对网络模型进行评估的指标包括精确率P、召回率R、F-score、准确率A。实验结果显示CNN在对六类恒星光谱进行分类时其准确率都在95%以上,在对相邻类别的恒星进行分类时,由于O型星样本量较少,所以得到的分类结果不太理想,对其余类别的恒星分类准确率都高于98%,以上结果都证明了CNN算法能够很好地解决恒星光谱的分类问题。  相似文献   

14.
胚蛋雌雄识别一直是家禽业发展的瓶颈问题,在禽肉生产过程中倾向于养殖雄性个体,而禽蛋生产产业倾向于养殖雌性家禽。若能在孵化过程中较早鉴别出种蛋的雌雄,不仅能够降低家禽孵化产业的成本,还能够提高禽蛋和禽肉生产行业的经济效益。该文以种鸭蛋为研究对象,为了在种鸭蛋孵化早期实现对种蛋的雌雄识别,构建了可见/近红外透射光谱信息采集系统,在200~1 100 nm的波长范围内采集了345枚孵化了0~8 d的种鸭蛋光谱数据。搭建了适用于种鸭蛋光谱信息的6层卷积神经网络(convolutional neural network, CNN),其中包括输入层、3个卷积层、全连接层与输出分类层。卷积层可以提取光谱中的有效信息,全连接层通过对卷积层提取的局部特征进行整合供输出层分类决策。另外在卷积神经网络中引入局部响应归一化和dropout操作能够加快网络的收敛速度。利用该卷积神经网络构建鸭胚雌雄信息识别网络,通过对比与分析不同孵化天数的识别效果,发现孵化7d的识别效果最佳。随后将孵化7 d的种鸭蛋原始光谱数据进行噪声去除,选取500~900 nm波段用于后续的特征波长选取和建模。分别运用了竞争性自适应重加权算法(CARS)、连续投影算法( SPA)与遗传算法(GA)选择能够区分鸭胚性别的波长点,将选取的特征波长转换为二维的光谱信息矩阵,二维光谱信息矩阵保留了一维光谱的有效信息,同时极大地方便了与卷积神经网络的结合。利用二维光谱信息矩阵和卷积神经网络相结合,实现孵化早期阶段鸭胚的雌雄识别。经检验,基于 SPA算法和CNN网络建立的模型效果较佳,其中训练集、开发集及测试集的准确率分别为93.36%,93.12%和93.83%;基于GA算法和CNN网络建立的模型效果次之,训练集、开发集及测试集的准确率分别为90.87%,93.12%和86.42%;基于CARS算法和CNN网络建立的模型的训练集、开发集及测试集的准确率分别为84.65%,83.75%和77.78%。研究结果表明基于可见/近红外光谱技术和卷积神经网络可以实现孵化早期鸭胚胎雌雄的无损鉴别,为后续相关自动化检测装置的研发提供了技术支撑。  相似文献   

15.
鉴于浅层人工神经网络(ANN)需要依靠先验知识进行人工提取特征,同时较浅的网络结构限制了神经网络学习复杂非线性关系的能力,将深度神经网络(DNN)应用于利用傅里叶变换红外光谱(FTIR)对多组分易挥发性有机物(VOCs)进行的浓度反演研究,并利用仿真实验验证了算法的有效性。从美国环境保护署(EPA)的数据库中选取了包括苯、甲苯、 1,3-丁二烯、乙苯、苯乙烯、邻二甲苯、间二甲苯、对二甲苯在内的八种VOCs气体在8~12μm波长范围内的吸光度谱,每种气体有四种不同浓度下的谱线,依据Beer-Lambert定律从每种VOCs气体中选择一种浓度下的吸光度谱进行混合,得到65 536种不同的VOCs混合气体吸光度谱样本。随机选择5 000组混合气体的吸光度谱,其中4 000组作为训练样本, 1 000组作为预测样本。通过积分提取和主成分提取对光谱矩阵进行降维预处理,将光谱维度从3 457维降到30维。将光谱矩阵经过预处理后得到的新矩阵作为网络输入,对应八种VOCs的浓度矩阵作为输出,建立了30-25-15-10-8的深度神经网络回归预测模型来实现多组分VOCs浓度反演,反演得到样本的均方根误差为0.002 7×10-6,相比于前人利用非线性偏最小二乘拟合、人工神经网络等方法拟合的精度有了明显的提高。每种VOCs气体的均方根误差均不超过0.005×10-6,每个样本的均方根误差均不超过0.006×10-6,证明了深度神经网络预测模型具有良好的非线性拟合能力和良好的稳定性。当训练样本不足(典型值:小于500)时,深度神经网络无法充分地学习,网络误差较大,精度低于单隐藏层的人工神经网络,但随着训练样本数量的增加,深度神经网络的精度不断提高,当训练样本数充足时,相比浅层的人工神经网络,深度神经网络具有更强的非线性关系学习能力,预测精度更高,模型更为稳定。同时,由于训练前对光谱矩阵进行了降维处理,大大降低了算法的复杂度,有效提高了反演效率。分析表明,深度神经网络预测模型具有良好的非线性拟合能力和良好的稳定性,无需人工提取特征就能够充分学习数据特征,同时对多组分VOCs进行浓度反演并达到较高精度。  相似文献   

16.
矿井水害对煤矿安全生产存在巨大威胁,所以快速识别矿井突水水源,对煤矿水灾预警及灾后救援工作开展都有重大意义。激光诱导荧光(LIF)技术具有快速、高效、灵敏度高等特点,克服了传统水化学方法识别时间长的缺点。循环神经网络(RNN)在解决长序列训练过程中产生的梯度消失、梯度爆炸等问题上存在明显不足,而特殊变体RNN即长短期记忆(LSTM)神经网络很好地弥补了RNN的短板及缺陷。提出了将LIF技术与LSTM算法相结合,应用在矿井突水水源快速识别中。实验样本采自淮南矿区,以砂岩水和老空水为原始样本,并将砂岩水和老空水按照不同比例混合配置成5种混合水样,共7种待测水样进行实验。首先采用最大最小值归一化(MinMaxScaler)、平滑滤波(SG)以及标准正态变量变换(SNV)三种预处理方法对原始光谱数据进行预处理,减少原始光谱数据存在的噪声和干扰信息。之后为防止数据量过大,维度过高,将包括原始光谱数据在内的四组数据再进行LDA降维至3维。最后分别搭建LSTM识别模型,从测试集预测准确率、训练集准确率变化趋势以及训练集损失函数变化趋势三个方面进行比较,选择最优模型。其中SG+LDA+LSTM和Original+LDA+LSTM在测试集预测准确率上都能达到100%,MinMaxScaler+LDA+LSTM测试集预测准确率在98.57%,SNV+LDA+LSTM准确率最低,只有87.14%;在训练集准确率变化趋势表现上,SG+LDA+LSTM能够保持良好的学习,很快达到100%,Original+LDA+LSTM和MinMaxScaler+LDA+LSTM也能达到100%的准确率,但在前几次训练过程中会有准确率下降的情况出现,SNV+LDA+LSTM训练集准确率在训练次数内并未达到100%;SG+LDA+LSTM损失函数变化趋势也具有很好的收敛性和稳定性,Original+LDA+LSTM,MinMaxScaler+LDA+LSTM以及SNV+LDA+LSTM在损失函数变化趋势上表现并不出色。结果表明,4组模型中,SG+LDA+LSTM模型是最适合应用于矿井突水识别,该方法补充了矿井突水水源识别工作的内容,为矿井突水识别提供了新的思路。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号