首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 203 毫秒
1.
特征提取是太赫兹光谱识别的关键处理步骤,通常利用降维方法作为特征提取手段。然而,当一些化合物的太赫兹光谱曲线整体差异度较小时,降维方法往往会缺失样本差异的重要特征信息,从而导致分类错误。如果不采用降维方法提取特征,传统机器学习分类算法对维数较高的原始太赫兹光谱数据又不能很好的分类。针对此问题,提出了一种基于双向长短期记忆网络(BLSTM-RNN)自动提取太赫兹光谱特征的识别方法。BLSTM-RNN作为一种特殊的循环神经网络,利用其LSTM单元可以有效解决原始太赫兹光谱数据维数较高使得模型难以训练问题。再结合模型的双向频谱信息利用架构模式,可以增强模型对复杂光谱数据自动提取有效特征信息的能力。采用三类、15种化合物太赫兹透射光谱作为测试对象,首先利用S-G滤波和三次样条插值对Anthraquinone,Benomyl和Carbazole等十五种化合物在0.9~6 THz内的太赫兹透射光谱数据进行归一化处理,然后通过构建一个具有双向长短期记忆的循环神经网络对太赫兹光谱的全频谱信息进行自动特征提取并利用Softmax分类器进行分类。通过试验优化网络结构和各项参数,最终获得了针对复杂太赫兹透射光谱数据的预测模型,并与传统机器学习算法SVM,KNN及神经网络算法MLP,CNN进行对比实验。结果表明,dataset-1和dataset-2分别作为差异度较大和无明显峰值特征的五种化合物太赫兹透射光谱数据集,其平均识别率分别为100%和98.51%,与其他方法相比识别率有所提高;最重要的是,dataset-3作为5种化合物谱线极为相似的太赫兹透射光谱数据集,其平均识别率为96.56%,与其他方法相比识别率提高显著;dataset-4作为dataset-1,dataset-2和dataset-3的透射光谱数据集集合,其平均识别率为98.87%。从而验证了BLSTM-RNN模型能自动提取有效的太赫兹光谱特征,同时又能保证复杂太赫兹光谱的预测精度。在选择模型训练优化算法方面,使用Adam优化算法要好于RMSProp,SGD和AdaGrad,其模型的目标函数损失值收敛速度最快。同时随着模型训练迭代次数增加,相似太赫兹透射光谱数据集的预测准确率也不断提升。可为复杂太赫兹光谱数据库的光谱识别检索提供一种新的识别方法。  相似文献   

2.
利用主成分分析方法结合支持向量机建立了太赫兹时域光谱冰片种类鉴别模型。冰片是一些常用中成药的重要成分,由于其来源多、真假易混淆,在制药和交易环节,迫切需要快速、简便、准确的检测、鉴别方法。太赫兹时域光谱技术是利用太赫兹脉冲表征物质性质的一种新兴光谱技术。实验使用透射式太赫兹时域光谱系统分别获得了艾片、合成冰片和梅片三种冰片在0.2~2 THz之间的吸收谱线。通过主成分分析,做出了第一、第二主成分二维得分图以及第一、二、三主成分三维得分图,两者对三种不同种类冰片都具有很好的聚类效果。用前十个主成分的得分值矩阵代替原光谱数据,通过对三种冰片的60组样本训练,对未知的60组样本鉴别,建立了四种不同核函数的支持向量机模型。对比结果表明,径向基核函数构建的支持向量机对三种冰片的分类鉴别准确率均为100%,由此我们确定选择具有径向基核函数的支持向量机建立冰片种类的鉴别模型。此外,在含噪情况下,四种核函数SVM获得的总分类准确率都在85%以上,说明支持向量机具有很强的泛化能力。主成分分析结合支持向量机方法对冰片太赫兹光谱具有很好的分类和鉴别效果,为冰片等中成药剂的种类鉴别提供了一种新思路。  相似文献   

3.
支持向量机复合核函数的高光谱显微成像木材树种分类   总被引:1,自引:0,他引:1  
采用体视显微高光谱成像方法,构建木材树种分类识别模型。利用SOC710VP体视显微高光谱图像采集系统获取可见光/近红外(372.53~1 038.57 nm)波段内的木材高光谱图像。首先,采用ENVI软件提取木材样本感兴趣区域(ROI)的平均光谱,分别采用连续投影算法(SPA)和竞争性自适应重加权算法(CARS)对光谱数据进行降维。再利用支持向量机(SVM)分别建立木材样本采集波段和特征波长下的分类模型。然后,在空间维采用第一主成分图像,计算基于灰度共生矩阵(GLCM)的木材纹理特征。在0°,45°,90°和135°四个方向计算能量、熵、惯性矩、相关性等16个特征参数后输入SVM进行木材树种分类处理。最后,采用四个复合核函数SVM进行光谱维和空间维的特征融合及分类识别。20个树种的分类实验结果表明,CARS的特征波长选择效果和运行速度较好一些,采用普通SVM进行木材光谱维特征分类处理时,测试集分类准确率达到了92.166 7%。采用基于GLCM的木材空间维纹理特征时,采用普通SVM的测试集分类准确率是60.333 0%,具有较低的分类精度。在将光谱维和空间维纹理特征进行数据融合及分类处理时,采用复合核函数SVM分类具有更好的效果。采用第二个复合核函数的SVM分类精度最高,测试集分类正确率是94.166 7%,运行时间为0.254 7 s。另外,采用第一个和第三个复合核函数的SVM的测试集分类准确率分别是93.333 3%和92.610 0%,运行时间分别为0.180 0和0.260 2 s。可以看出,采用这3种复合核函数的SVM进行木材树种分类,分类精度都高于采用普通SVM的光谱维或者空间维的分类识别精度。因此,利用体视显微高光谱成像和复合核函数SVM可以提高木材树种分类精度,为木材树种快速分类提供了参考。  相似文献   

4.
针对太赫兹光谱线性不可分的情况,提出结合径向基函数和核主成分分析(KPCA)的方法进行食用油太赫兹光谱特征提取。该方法所提取到的特征类内距离小,类间距离大,在大多数支持向量机(SVM)分类器可以建立准确的分类模型。太赫兹光谱是检测食用油种类和品质的一种重要手段,研究针对食用油太赫兹光谱的特征提取技术对于食用油种类和品质快速检测具有重要意义。虽然利用太赫兹光谱检测食用油种类和品质已经具备理论基础,但是如何准确提取食用油太赫兹光谱的特征,从而建立更加准确的分类模型依然是一个难点。目前研究人员常常采用化学计量学中的主成分分析法(PCA)提取特征,结合机器学习的方法建立物质分类模型。然而,食用油的太赫兹光谱的线性可分情况在不同频段有不同的特性。当食用油的太赫兹光谱线性可分时,使用PCA提取特征是可行的,容易建立准确的分类模型。但是,当食用油的太赫兹光谱线性不可分时,使用PCA提取到的特征往往不够准确,需要选择合适的分类器去建立准确的分类模型。结合径向基函数和KPCA的特征提取方法通过径向基函数将线性空间不可分的太赫兹光谱数据映射到径向基空间,然后使用KPCA提取特征,最终实现特征线性可分,从而可以建立更加准确的分类模型。实验首先使用滑动窗口平均滤波算法对3种食用油太赫兹光谱数据进行滤波处理,接着使用径向基函数对太赫兹光谱进行非线性映射,然后采用KPCA进行数据降维,最后用支持向量机对食用油建立分类模型,验证特征提取效果。类间可分性计算结果表明,该方法所提取的特征类内距离更小,类间距离更大,整体上特征提取效果优于PCA和KPCA。基于不同内核的SVM模型上进行分类验证的实验结果表明,在PCA和KPCA提取的特征在一些分类模型上无法准确区分食用油种类的情况下,该工作特征提取方法在各种内核的SVM模型上均能准确区分食用油种类。所提出的方法用于食用油太赫兹光谱特征提取有更好的效果,在食用油品质检测与分析方面具有良好的应用价值。  相似文献   

5.
特征提取和分类是太赫兹光谱识别的关键。部分物质在太赫兹波段内没有明显的吸收峰,难以人工定义、提取特征及分类识别,为此,结合深度信念网络(deep belief network,DBN)和K-Nearest Neighbors (KNN)分类器的优点,提出了一种基于DBN的太赫兹光谱识别方法。首先利用S-G滤波和三次样条插值对ATP,acetylcholine_bromide,bifenthrin,buprofezin,carbazole,bleomycin,buckminster和cylotriphosphazene在0.9~6 THz内的太赫兹透射光谱进行归一化处理;然后由两层受限波尔兹曼机(restricted Boltzmann machine, RBM)构建DBN模型,并采用逐层无监督的方法训练模型,以自动提取太赫兹光谱特征;最后用KNN分类器对8种物质的太赫兹透射光谱进行分类。结果表明,使用DBN自动提取的光谱特征,KNN分类器、BP神经网络、SOM神经网络和RBF神经网络的分类准确率达到了90%以上,且KNN分类器的识别率优于其他三种分类器;采用DBN自动提取物质的太赫兹光谱特征大大减少了工作量,在海量光谱数据识别中具有广阔的应用前景。  相似文献   

6.
为了实现工业现场对特种钢材的快速检测与种类识别,采用基于光纤传能的移动式激光诱导击穿光谱(LIBS)样机对14种特种钢材进行光谱数据的采集与分析,采用预选谱线并遍历组合的降维方法与支持向量机(SVM)相结合的算法对特钢材料的光谱进行快速分类。分别将原始光谱数据、归一化处理后的光谱数据、归一化处理+遍历组合优选谱线数据作为SVM分类模型的输入向量,并对比了不同输入向量下模型对特钢识别的准确度。结果表明:在事先选出的51条特征谱线作为输入变量的基础上,归一化光谱数据作为SVM分类模型的输入特征时,识别准确度达到95.71%,明显高于使用原始光谱数据作为输入向量时SVM分类模型的准确度11.43%。进一步地,使用MATLAB程序遍历谱线组合,通过遍历各种谱线组合选出最优的输入谱线组合,当优选6条特定的谱线时,对特钢种类识别的准确度达到100%,且建模速度也有相应提升。可以看出,当预选出大量常见特征数据时,机器自动选取特征与人工挑选谱线相比,具有明显优势,基于此降维方法的SVM算法模型在LIBS快速分类技术中具有很好的工业应用前景。  相似文献   

7.
基于太赫兹时域光谱技术的红木分类识别   总被引:1,自引:0,他引:1  
提出了一种利用太赫兹时域光谱技术(THz-TDS)进行红木分类识别方法。红木价格昂贵,同时由于种类繁多难以识别,导致红木市场以次充好,以假乱真的现象层出不穷,严重扰乱了市场秩序,给生产者和消费者造成巨大的经济损失,传统的红木分类识别方法难以兼顾准确性和快速性,因此需要研究一种新的方法对现有木材分类识别方法进行补充和发展。相比于传统方法,太赫兹波对红木具有良好的穿透性及指纹特性,在红木的分类识别中有较大的应用潜力。选用5种红木(巴里黄檀、奥氏黄檀、大叶紫檀、小叶紫檀、交趾黄檀)作为试验样品木材。利用THz-TDS系统得到木材的太赫兹时域光谱,通过对五种木材的太赫兹时域光谱进行快速傅里叶变换,得到木材太赫兹频域光谱,并对太赫兹时域光谱提取光学参数,分别得到木材的太赫兹折射率谱和吸收系数谱,结果表明不同种类的木材在时域光谱上具有时间延迟线与振幅的差异,在频域光谱上显示衰减趋势及幅值各不相同,在吸收系数谱中各种类红木吸收峰出现的频段不同,能够直观地展示出各种类木材之间的区别,表明THz-TDS进行红木分类识别具有一定的可行性。利用连续投影算法(SPA)提取吸收系数谱和折射率谱的特征频率,对吸收系数谱260个频率点筛选出28个特征频率点,频段占比10.77%;对折射率谱260个频率点筛选出12个特征频率点,频段占比4.62%。分别建立基于吸收系数谱和折射率谱的随机森林分类模型和支持向量机(SVM)红木分类模型,并对各模型分类结果进行对比。实验结果表明,THz-TDS具有良好的木材识别效果,基于木材太赫兹吸收系数谱和折射率谱建立的随机森林分类模型对红木种类有着较好的分类性能,总体分类准确率分别达到了94%和96%,能够准确对红木种类进行分类识别。利用太赫兹时域光谱技术实现了红木的分类识别,为红木的分类识别提供了一个新的思路和技术方案,能够作为近红外光谱木材检测方法的补充,同时为太赫兹技术在木材分类识别领域的应用提供了理论基础。  相似文献   

8.
物质的太赫兹光谱具有唯一性。目前,结合先进的机器学习方法,研究基于规模光谱数据库的太赫兹光谱识别技术已成为太赫兹应用技术领域的重点。考虑到由于实验条件及实验设备的影响,很难收集到多物质均衡光谱数据,而这又是对太赫兹光谱数据进行分类的基础。针对这一问题,提出一种基于WGAN的不均衡太赫兹光谱识别方法。WGAN作为生成数据的一种新方法,将模型达到纳什均衡条件下的生成数据用来补充数据集,使其达到类别均衡。生成数据可以有效映射真实数据分布,通过将生成数据与真实数据混合训练可以提高识别不均衡光谱数据的准确率。采用三种特征谱较为相似的麦芽糖化合物的太赫兹透射光谱数据进行验证,首先利用S-G滤波和三次样条插值法对三种物质的光谱数据进行归一化处理,然后通过构建WGAN模型对三种物质的不均衡太赫兹光谱数据进行扩展,使其达到类别均衡。实验在同一测试集下进行验证,并利用三组对比实验证明WGAN在不均衡数据集处理中的效果。首先利用WGAN生成数据,随着迭代次数的增加,生成数据逐渐符合真实数据分布。实验结果证明,使用WGAN扩展后的数据集训练SVM模型,可以解决模型在测试集上小样本数据(Maltotriose,Malthexaose)偏向大样本数据(Maltoheptaose)的问题。在将WGAN与传统处理不均衡数据集方法FWSVM和COPY对比后发现,三种分类算法在dataset-1数据集上的训练集准确率都能达到90%以上。但是由于模型泛化能力的限制,传统方法在测试集上的效果并不是很理想,而使用WGAN后的测试集准确率却能达到91.54%。在不同不均衡度方面,采用不均衡度为16,81和256的数据集进行验证,其三个测试集上的准确率分别为92.08%,91.54%和90.27%,可满足实际工作中处理不同不均衡度的要求。  相似文献   

9.
基于扩散映射的太赫兹光谱识别   总被引:1,自引:0,他引:1  
特征提取对于太赫兹光谱识别来说至关重要。传统方法是通过人工选取太赫兹光谱中差异性较大的吸收峰作为特征进行光谱识别,但当部分物质在太赫兹波段没有明显波峰、波谷等光谱图形特征时,这种方式便不再适用。为此,研究人员利用统计学习与机器学习方法对高维太赫兹光谱数据进行降维和特征提取。由于物质的太赫兹光谱数据各维度呈现非线性,尤其是当不同物质的太赫兹光谱曲线整体非常相似时,线性处理方法易产生较大误差。针对这一问题,提出了一种基于扩散映射(DM)的太赫兹光谱识别方法。扩散映射能在保持数据内在几何结构的同时对其进行非线性降维,提取的流形特征区分度较高,对数据还有聚类效果。首先用S-G滤波器对Alloxazine等10种物质的太赫兹光谱样本进行滤波,并用三次样条插值法对截取相同频段后的光谱样本进行统一分辨率处理;然后利用DM将高维太赫兹光谱数据映射到低维特征空间并提取太赫兹光谱的流形特征;最后用多分类支持向量机(M-SVM)对十种物质的太赫兹透射光谱进行分类。实验结果表明,相比于主成分分析(PCA)和等距映射(ISOMAP),使用DM提取的太赫兹光谱流形特征具有更高的区分度,而且DM可以直接得到太赫兹光谱数据本征维数的估计值,这为相似太赫兹光谱的快速精准识别提供了一条新的途径。  相似文献   

10.
针对马铃薯空心病的难以检测问题,提出了一种基于半透射高光谱成像技术结合支持向量机(support vector machine,SVM)的马铃薯空心病无损检测方法。选取224个马铃薯样本(合格149个,空心75个)作为研究对象,搭建了马铃薯半透射高光谱图像采集系统,采集了马铃薯样本半透射高光谱图像(390~1 040 nm),对感兴趣区域内的光谱进行平均和光谱特征分析。采用变量标准化(normalize)对原始光谱进行光谱预处理,建立了全波段的SVM判别模型,模型对测试集样本的识别准确率仅为87.5%。为了提高模型性能,采用竞争性自适应重加权算法(competitive adaptive reweighed sampling algorithm, CARS)结合连续投影算法(successive projection algorithm, SPA)对光谱全波段520个变量进行变量选择,最终确定了8个光谱特征变量(454,601,639,664,748,827,874和936 nm),所选8个光谱变量建立的SVM模型对马铃薯测试集的识别率为94.64%。分别采用人工鱼群算法(artificial fish swarm algorithm,AFSA)、遗传算法(genetic algorithm,GA)和网格搜索法(grid search algorithm)对SVM模型的惩罚参数c和核参数g进行优化。经过建模比较分析,确定AFSA为最优优化算法,最优模型参数为c=10.659 1,g=0.349 7,确定AFSA-SVM模型为马铃薯空心病的最优识别模型,该模型总体识别率达到100%。试验结果表明:基于半透射高光谱成像技术结合CARS-SPA与AFSA-SVM方法能够对马铃薯空心病进行准确的检测,也为马铃薯空心病的快速无损检测提供技术支持。  相似文献   

11.
基于THz光谱和多信息融合的小麦品质无损检测研究   总被引:1,自引:0,他引:1  
为进一步提高不同品质小麦分类模型的检测精度,提出采用太赫兹时域光谱技术(THz-TDS),融合小麦样品的吸收光谱和折射率光谱信息,对其品质进行检测识别。以正常小麦、发芽小麦、霉变小麦和虫蚀小麦样品为研究对象,获取样品THz波段光学参数,在特征层选用AdaBoost(AdaBoost)分类器和支持向量机(SVM)方法,建立了小麦品质多项光学指标的分类融合模型。并将融合模型的识别结果进行比较,结果表明融合模型对小麦样品的识别率达到95%。最后,为了验证融合模型的有效性,将其与单光谱分析回归模型进行了对比,表明融合模型比单光谱模型在小麦样品的识别率上有了较大的提高,且SVM融合模型的识别率最高,是一种最优的多源信息融合方法。  相似文献   

12.
恒星光谱自动分类是研究恒星光谱的基础内容,快速、准确自动识别、分类恒星光谱可提高搜寻特殊天体速度,对天文学研究有重大意义。目前我国大型巡天项目LAMOST每年发布数百万条光谱数据,对海量恒星光谱进行快速、准确自动识别与分类研究已成为天文学大数据分析与处理领域的研究热点之一。针对恒星光谱自动分类问题,提出一种基于卷积神经网络(CNN)的K和F型恒星光谱分类方法,并与支持向量机(SVM)、误差反向传播算法(BP)对比,采用交叉验证方法验证分类器性能。与传统方法相比CNN具有权值共享,减少模型学习参数;可直接对训练数据自动进行特征提取等优点。实验采用Tensorflow深度学习框架,Python3.5编程环境。K和F恒星光谱数据集采用国家天文台提供的LAMOST DR3数据。截取每条光谱波长范围为3 500~7 500 部分,对光谱均匀采样生成数据集样本,采用min-max归一化方法对数据集样本进行归一化处理。CNN结构包括:输入层,卷积层C1,池化层S1,卷积层C2,池化层S2,卷积层C3,池化层S3,全连接层,输出层。输入层为一批K和F型恒星光谱相同的3 700个波长点处流量值。C1层设有10个大小为1×3步长为1的卷积核。S1层采用最大池化方法,采样窗口大小为1×2,无重叠采样,生成10张特征图,与C1层特征图数量相同,大小为C1层特征图的二分之一。C2层设有20个大小为1×2步长为1的卷积核,输出20张特征图。S2层对C2层20张特征图下采样输出20张特征图。C3层设有30个大小为1×3步长为1的卷积核,输出30张特征图。S3层对C3层30张特征图下采样输出30张特征图。全连接层神经元个数设置为50,每个神经元都与S3层的所有神经元连接。输出层神经元个数设置为2,输出分类结果。卷积层激活函数采用ReLU函数,输出层激活函数采用softmax函数。对比算法SVM类型为C-SVC,核函数采用径向基函数,BP算法设有3个隐藏层,每个隐藏层设有20,40和20个神经元。数据集分为训练数据和测试数据,将训练数据的40%,60%,80%和100%作为5个训练集,测试数据作为测试集。分别将5个训练集放入模型中训练,共迭代8 000次,每次训练好的模型用测试集进行验证。对比实验采用100%的训练数据作为训练集,测试数据作为测试集。采用精确率、召回率、F-score、准确率四个评价指标评价模型性能,对实验结果进行详细分析。分析结果表明CNN算法可对K和F型恒星光谱快速自动分类和筛选,训练集数据量越大,模型泛化能力越强,分类准确率越高。对比实验结果表明采用CNN算法对K和F型恒星光谱自动分类较传统机器学习SVM和BP算法自动分类准确率更高。  相似文献   

13.
针对室内复杂环境下火灾识别准确率会降低的问题,提出了一种改进的粒子群算法优化支持向量机参数进行火灾火焰识别的方法。首先在 颜色空间进行火焰图像分割,对获得的火焰图像进行预处理并提取相关特征量;其次采用PSO算法搜索SVM的最优核参数和惩罚因子,并在PSO算法中加入变异操作和非线性动态调整惯性权值的方法,加快了搜索SVM最优参数的精度和速度;然后将提取的火焰各个特征量作为训练样本输入SVM模型进行训练,并建立参数优化后的SVM分类器模型;最后将待测试样本输入SVM模型进行分类识别。算法的火灾识别准确率达到94.09%,分类效果明显优于其他分类算法。仿真结果表明,改进的PSO优化SVM算法提高了火焰识别的准确率和实时性,算法的自适应性更强,误判率更低。  相似文献   

14.
红层泥岩边坡的风化是一个普遍存在而又未完全解决好的问题。因风化而造成的不稳定红层泥岩边坡,在岩土体重力、震动及其他因素作用下,常常发生危害性的变形与破坏,导致崩塌滑坡、落石和泥石流等地质灾害。风化深度是红层泥岩边坡治理的重要依据之一。风化深度是指岩石破裂后在破裂面内侧产生的微裂隙或微裂隙带在风化作用下向岩石内部延伸的垂直距离。选择典型的红层泥岩边坡地带进行钻孔取样。太赫兹时域光谱技术是利用太赫兹脉冲表征物质性质的一种新兴光谱技术。实验使用太赫兹时域光谱系统测量所取得样本的太赫兹透射光谱。对所有样品的透射光谱进行分析,观察到各风化样品间的太赫兹透射光谱差别微小,且没有明显的特征吸收峰。为了获得取样地点的风化深度,基于太赫兹光谱建立一个智能,高效的回归预测支持向量机(SVM)模型来预测采样地点的风化深度。预测结果与实际深度相比较,所得相对误差小于7.09%。结果表明,基于太赫兹光谱的支持向量机(SVM)模型可以有效的区分样本以及预测深度,可以为红层泥岩边坡治理提供重要的参考。  相似文献   

15.
使用近红外光谱鉴别蚕茧雌雄设备成本较高,挑选有用特征可以减少成本。雌雄蚕茧的近红外光谱存在着共线性的关系,因此提出了一种包裹式的特征选择方法,基于支持向量机的自助重加权采样(BRS-SVM)的特征选择方法。使用NirQuest512近红外光谱仪采集了蚕茧的漫透射近红外光谱。用试验集的全波段建模得到特征重要度热图,并通过热图得到重要特征波段的范围。然后在重要特征波段范围内,分别用BRS-SVM、基于SVM的特征排序方法(MBR-SVM)、基于逻辑回归的特征排序方法(MBR-LR)、递归特征消除法(RFE)、连续投影算法(SPA) 和遗传算法(GA)挑选单波段特征和连续波段面积特征,再分别用支持向量机(SVM)和逻辑回归(LR)建立雌雄分类模型。通过特征重要性热力图发现,蚕茧雌雄分类重要区域在900~1 399 nm内,用此波段范围建立SVM模型,试验集准确率为99.40%。用BRS-SVM挑选5个单波段特征,然后再用SVM建模,验证集准确率为93.88%,高出其他特征选择方法5%~12%,测试集准确率为89.56%,测试集准确率高出其他特征选择方法2%~4%。用BRS-SVM挑选27个单波段特征,建立SVM雌雄分类模型测试集准确率为94.97%,准确率达到生产条件要求。用BRS-SVM挑选的14个连续波段面积特征,再用SVM建模,测试集准确率为94.43%。在挑选少量特征情况下,我们提出的BRS-SVM要优于其他方法。用BRS-SVM挑选少量的特征,可以建立性能良好的蚕茧雌雄分类模型,有效减少了成本,具有重要的现实意义。  相似文献   

16.
针对润滑脂分类,提出了基于布谷鸟搜索的红外光谱波段筛选方法,有效剔除了易受噪声等环境影响的红外光谱区域、实现了对庞大光谱数据进行特征选择和降维处理、通过筛选光谱最优波段建立了更加准确高效的润滑脂分类模型。以三类不同稠化剂润滑脂的红外光谱数据为研究对象,采用主成分分析法(PCA),对不同波段的红外光谱数据进行压缩,以提取的红外光谱主要成分作为输入,润滑脂稠化剂类别作为输出,通过布谷鸟搜索法(CS),对主要成分权重和分类核参数进行准确度寻优训练,建立分类识别预测模型。对所建立的模型再进行分类准确性测试,得到模型测试结果准确度,建立红外光谱波段和测试准确度之间的联系,得到润滑脂最优类别识别模型和最优分类波段。对所建立的模型再进行分类准确性测试,结果显示:经过布谷鸟搜索法训练加权后的主要特征呈现明显聚类现象,可以得到分类核,实现对润滑脂种类的准确识别;在搜索过程中提供了区分不同润滑脂的推荐波段和特征峰,使对润滑脂的正确鉴别概率由全波段建立分类模型的94.44%提高到筛选后特征波段建立分类模型的100%,并减少了运算时间、提高了搜索运行效率。  相似文献   

17.
紫外可见多波长透射光谱包含了细菌微生物对光的吸收和前向散射等信息,能反映细菌细胞的组分、大小以及形态等特征,具有细菌种属的特异性,可应用于细菌微生物的快速种类鉴别。以水体中常见细菌微生物为研究对象,实验测量了大肠埃希氏菌、金黄色葡萄球菌、鼠伤寒沙门氏菌以及肺炎克雷伯菌的紫外可见多波长透射光谱,简要分析了不同种类细菌微生物的多波长透射光谱特征;研究了透射光谱与支持向量机多向量分析方法相结合的水体细菌微生物快速识别方法,利用基于网格搜索法的训练集内部交叉验证获取建模所需最佳惩罚因子C和核函数参数g,根据最优参数和LibSVM一对一多分类法建立细菌快速分类鉴别模型。利用不同株实验细菌的透射光谱作为测试集对所建模型进行识别正确率的验证,结果表明,所建立的快速分类鉴别模型可以对选取的大肠埃希氏菌、金黄色葡萄球菌、鼠伤寒沙门氏菌以及肺炎克雷伯菌进行快速种类识别,识别正确率为100%;分类鉴别模型对不同大肠杆菌亚种的测试集识别正确率为100%,证明该模型对细菌属间鉴别具有较好的稳定性。不仅可为饮用水源细菌微生物的快速识别预警提供方法,而且可在生物医学方面作为细菌微生物鉴别的一种简便、快速、准确的手段。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号