首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 343 毫秒
1.
拉曼光谱因具有简单、快速及无损等特点,非常适合矿石的分类与鉴别。拉曼光谱模型拟合分类方法无需构建参考光谱库且避免了复杂的逐项光谱匹配,具有明显的优势。然而,已有的基于机器学习及深度学习的矿石拉曼光谱分类研究所采用的学习模型比较单一,缺乏具有参考意义的综合比较。对基于机器学习及深度学习的矿石拉曼光谱模型拟合分类方法进行综合评估验证,对比了KNN, XGBoost, SVM, RF四种传统机器学习方法和CNN, DNN, RNN三种深度学习模型在RRUFF矿物拉曼光谱数据集上的分类效果,验证了4种数据预处理方法和样本量对模型分类效果的影响。为提升机器学习模型的分类性能,本文还提出了一种拉曼光谱强度曲率的数据预处理方法,对经基线矫正后的拉曼光谱序列强度计算曲率作为构造特征,使模型更有效的提取出拉曼光谱的特征峰位置。实验结论:数据预处理对提升机器学习模型的分类性能效果明显,而对深度学习模型不敏感;样本量为影响模型分类效果的关键因素,当样本量较大时,深度学习模型的分类效果优于传统的机器学习模型;对于微小样本,深度学习模型难以发挥其优势,而辅以预处理的机器学习具有更优的分类性能。  相似文献   

2.
岩石光谱是岩石物理化学性质、成分和结构的综合体现,如今已经被广泛应用于岩石分类研究中。岩石光谱数据具有高维的特征数量,在样本数量有限的情况下训练时,往往会产生维数灾难现象。由于岩石光谱的数据收集困难,这在产生极大的人力成本的同时也导致收集到的岩石光谱数据往往十分有限。因此如何能够在样本数量较少时,对岩石光谱数据取得较为准确的分类效果成为了如今热门的研究课题。利用辽宁兴城地区的典型岩石光谱数据,基于Python编程语言在训练样本较少的情况下构建了孪生网络分类模型,并以Triplet Loss作为损失函数,实现了3-way-1-shot分类模型,在测试集上取得了97.8%的分类准确率。同时使用了决策树、随机森林、支持向量机和K-近邻四种传统机器学习方法在相同训练样本下建立分类模型与之对比,通过绘制学习曲线,验证了这四种传统机器学习方法在小样本的情况下不具备良好的分类功能。由于将原始光谱数据转化为图片数据之后并不会影响孪生网络模型的分类效果,因此可以将岩石光谱分类问题转化为图像分类的问题,进而使用图像分类的方法和手段。实验结果表明,孪生网络模型在岩石光谱样本数量较少的情况下仍然能够取得优秀的...  相似文献   

3.
石油污染的出现,导致生态环境遭到破坏。因此,油类识别方法的研究对于环境的保护具有重要意义。采用荧光光谱法获得石油光谱数据,并对其进行预处理,再通过降维方法来提取特征信息,最后利用模式识别算法进行分类,从而可以实现对油类的定性分析,因此研究一种更高效的数据降维方法以及识别分类算法极其重要。基于三维荧光光谱技术,利用稀疏主成分分析(SPCA)对FS920光谱仪测得的荧光光谱数据进行特征提取,再利用支持向量机(SVM)算法对提取的特征数据进行分类识别,获得了一种更加高效的油类识别方法。首先,利用海水和十二烷基硫酸钠(SDS)配制成浓度为0.1 mol·L-1的胶束溶液,将其作为溶剂配制柴油、航空煤油、汽油以及润滑油各20种不同浓度的溶液;然后,利用FS920光谱仪测得样本溶液的三维荧光光谱数据,对得到的光谱数据进行预处理;最后,对预处理后的数据分别利用SPCA和主成分分析(PCA)进行特征提取,再利用SVM和K最近邻(KNN)两种模式识别算法对特征向量进行分类,最终得到四种模型PCA-KNN,SPCA-KNN,PCA-SVM以及SPCA-SVM的分类结果。研究结果表明,由四种模型得到的分类准确率分别为85%,90%,90%和95%,其中,在同种分类算法中,利用SPCA进行特征提取得到的分类准确率均比PCA的准确率高5%,因此可知,SPCA的稀疏性具有突出主要成分的作用,在提取光谱特征时能够减小非必要成分的影响,并且载荷矩阵的稀疏化可以去除变量之间的冗余信息,优化降维特征信息,为后续分类提供更有效的数据特征信息;在同种特征提取算法下,利用SVM算法进行分类得到的分类准确率均比KNN算法得到的准确率高5%,表明SVM算法在分类中更具有优势。因此,本文利用三维荧光光谱技术结合SPCA和SVM算法,实现了对石油的准确识别与分类,为今后对石油污染物的高效检测提供了新思路。  相似文献   

4.
特征提取和分类是太赫兹光谱识别的关键。部分物质在太赫兹波段内没有明显的吸收峰,难以人工定义、提取特征及分类识别,为此,结合深度信念网络(deep belief network,DBN)和K-Nearest Neighbors (KNN)分类器的优点,提出了一种基于DBN的太赫兹光谱识别方法。首先利用S-G滤波和三次样条插值对ATP,acetylcholine_bromide,bifenthrin,buprofezin,carbazole,bleomycin,buckminster和cylotriphosphazene在0.9~6 THz内的太赫兹透射光谱进行归一化处理;然后由两层受限波尔兹曼机(restricted Boltzmann machine, RBM)构建DBN模型,并采用逐层无监督的方法训练模型,以自动提取太赫兹光谱特征;最后用KNN分类器对8种物质的太赫兹透射光谱进行分类。结果表明,使用DBN自动提取的光谱特征,KNN分类器、BP神经网络、SOM神经网络和RBF神经网络的分类准确率达到了90%以上,且KNN分类器的识别率优于其他三种分类器;采用DBN自动提取物质的太赫兹光谱特征大大减少了工作量,在海量光谱数据识别中具有广阔的应用前景。  相似文献   

5.
宁夏盐池县荒漠草地属于中温带干旱气候,由于过度利用出现不同程度的退化,退化指示种比重增大,造成不同荒漠草地群落组成差异也很大,如何区别不同荒漠草地植物,并据此对退化指示种进行动态监测是了解荒漠草地退化程度的关键。目前随机森林(RF)、支持向量机(SVM)与K-邻近(KNN)分类模型被广泛应用于森林植物和农作物的遥感分类,并取得了较好的分类识别效果,但针对草地尤其是荒漠草地植物的分类识别研究较少。因此使用ASD地物光谱仪于7月在宁夏盐池二步坑、冯记沟、高沙窝、麻黄山不同荒漠草地采集了32种植物作样本获得442条光谱进行光谱特征分析。筛选出7个植被指数:归一化植被指数705(NDVI705)、绿通道植被指数(GNDVI)、光化学植被指数(PRI)、土壤调节植被指数(OSAVI)、可视化气压阻抗指数(VARI)、植被衰减指数(PSRI)和归一化水指数(NDWI)作为随机森林模型(RF)、支持向量机(SVM)模型、K-邻近(KNN)模型的原始变量,对32种荒漠草地植物进行分类识别,并通过分类模型精度的比较筛选较优模型。结果表明:(1)不同植物光谱反射率均符合绿色植物特征,但各植物原始光谱不同波段之间存在明显差异,植物原始光谱水分吸收波段差异明显,且有红边蓝移现象;(2)RF,SVM和KNN三个分类模型对32种植物的分类精度分别达到了0.98,0.94和0.98,识别效果较好,但3种分类模型均对白莲蒿与北芸香、虫实与甘草发生了误判;(3)随机森林模型重要性指标中NDWI与PRI为区分荒漠草地植物的关键指标,说明荒漠植物冠层水分与类胡萝卜素含量是影响荒漠草地植物光谱分类的重要因素。试验利用随机森林模型(RF)、支持向量机(SVM)与K-邻近(KNN)分类方法,建立了主要植物的分类模型。  相似文献   

6.
矿物光谱综合反映了岩矿的物理化学特性、组分和内部结构特征,已被应用于岩矿识别研究。传统的矿物光谱分类方法需要先对矿物光谱进行预处理,再采用不同方法分析光谱特征,从而实现分类目的。但同时也会造成部分光谱信息丢失,导致最终分类精度不高且操作过程繁琐、效率低下,难以应对日益增长的大数据处理需求。因此,建立一个准确、高效的矿物光谱自动分类模型意义重大。卷积神经网络是应用最广泛的深度学习模型之一,它通过逐层抽取数据特征并组合形成高层语义信息,具有极强的模型表达能力,在光谱数据分析方面应用潜力巨大。针对矿物光谱数据的特点,提出了基于一维空洞卷积神经网络(1D-DCNN)的矿物光谱分类方法,利用空洞卷积神经网络提取光谱特征,采用反向传播算法结合随机梯度下降优化器调整模型参数,输出光谱分类结果,实现了矿物类别的端到端检测。该网络包含1个输入层、3个空洞卷积层、2个池化层、2个全连接层和1个输出层,采用交叉熵为损失函数,引入空洞卷积扩大滤波器感受野,有效避免光谱细节特征丢失。实验采集了白云母、白云石、方解石、高岭石四种矿物光谱,并通过添加噪声的方式进行数据增强,构建数量充足的矿物光谱样本用于神经网络模型训练与测试;探讨了卷积类型、迭代次数对模型分类结果的影响,并与多种传统矿物光谱分类方法进行对比,评价模型性能。实验结果表明,提出的1D-DCNN模型可实现矿物光谱快速准确分类,分类准确率达到99.32%,优于反向传播算法(BP)和支持向量机(SVM),说明所提方法能够充分学习矿物光谱特征并有效分类,且模型具有良好的鲁棒性和可扩展性。该方法也可推广到煤炭、油气、月壤等其他领域光谱分类应用中。  相似文献   

7.
特征提取是太赫兹光谱识别的关键处理步骤,通常利用降维方法作为特征提取手段。然而,当一些化合物的太赫兹光谱曲线整体差异度较小时,降维方法往往会缺失样本差异的重要特征信息,从而导致分类错误。如果不采用降维方法提取特征,传统机器学习分类算法对维数较高的原始太赫兹光谱数据又不能很好的分类。针对此问题,提出了一种基于双向长短期记忆网络(BLSTM-RNN)自动提取太赫兹光谱特征的识别方法。BLSTM-RNN作为一种特殊的循环神经网络,利用其LSTM单元可以有效解决原始太赫兹光谱数据维数较高使得模型难以训练问题。再结合模型的双向频谱信息利用架构模式,可以增强模型对复杂光谱数据自动提取有效特征信息的能力。采用三类、15种化合物太赫兹透射光谱作为测试对象,首先利用S-G滤波和三次样条插值对Anthraquinone,Benomyl和Carbazole等十五种化合物在0.9~6 THz内的太赫兹透射光谱数据进行归一化处理,然后通过构建一个具有双向长短期记忆的循环神经网络对太赫兹光谱的全频谱信息进行自动特征提取并利用Softmax分类器进行分类。通过试验优化网络结构和各项参数,最终获得了针对复杂太赫兹透射光谱数据的预测模型,并与传统机器学习算法SVM,KNN及神经网络算法MLP,CNN进行对比实验。结果表明,dataset-1和dataset-2分别作为差异度较大和无明显峰值特征的五种化合物太赫兹透射光谱数据集,其平均识别率分别为100%和98.51%,与其他方法相比识别率有所提高;最重要的是,dataset-3作为5种化合物谱线极为相似的太赫兹透射光谱数据集,其平均识别率为96.56%,与其他方法相比识别率提高显著;dataset-4作为dataset-1,dataset-2和dataset-3的透射光谱数据集集合,其平均识别率为98.87%。从而验证了BLSTM-RNN模型能自动提取有效的太赫兹光谱特征,同时又能保证复杂太赫兹光谱的预测精度。在选择模型训练优化算法方面,使用Adam优化算法要好于RMSProp,SGD和AdaGrad,其模型的目标函数损失值收敛速度最快。同时随着模型训练迭代次数增加,相似太赫兹透射光谱数据集的预测准确率也不断提升。可为复杂太赫兹光谱数据库的光谱识别检索提供一种新的识别方法。  相似文献   

8.
光谱技术与机器学习算法结合快速识别微塑料, 为微塑料的现场检测提供了极大的技术支持,是一个得到极大关注的新领域。近红外光谱检测技术具有检测速度快、灵敏度高、不损坏样品,且可以在不对样品进行预处理的情况下直接检测等特点,在化学分析、质量检测等领域广泛应用。本文基于近红外光谱检测技术,研究比较了结合Support Vector Machine(SVM)和Extreme Gradient Boosting(XGBoost)两种机器学习分类算法,构建微塑料的高速有效识别分类模型。采用微型近红外光谱仪采集了20种常见的微塑料标准样品的光谱数据,为了防止过拟合,对每种样品多次采样,共收集了1 260个微塑料样本,每个样本包含512个数据点。利用XGBoost算法进行特征重要性排序,共提取了对识别准确率影响较大的65个数据点。分别采用SVM算法和XGBoost算法对数据降维后提取的65个数据点建立微塑料快速识别模型,并运用网格搜索(GridSearchCV)对XGBoost算法影响较大的超参数进行选取,确定n_estimators,learning_rate,min_child_weigh,max_depth,gamma的最佳超参数分别为700,0.07,1,1,0.0。为了提高模型的稳定性,识别速率和泛化能力,对模型采用10折交叉验证和混淆矩阵评估;研究结果表明,XGBoost模型对微塑料的识别准确率为97%,而SVM模型对微塑料的识别准确率为95%;XGBoost模型对微塑料识别的正确率优于SVM模型。综上所述,XGBoost模型微塑料识别整体性能优于SVM模型,为实际微塑料快速识别提供技术支撑。  相似文献   

9.
稀疏降噪自编码算法用于近红外光谱鉴别真假药的研究   总被引:1,自引:0,他引:1  
近红外光谱分析技术作为一种快速、无损检测技术十分适用于真假药品现场鉴别。自编码网络作为当前机器学习领域研究的热点受到广泛关注,自编码网络是一种典型的深度学习网络模型,它比传统的潜层学习方法具有更强的模型表示能力。自编码网络使用贪婪逐层预训练算法,通过最小化各层网络的重构误差,依次训练网络的每一层,进而训练整个网络。通过对数据进行白化预处理并使用无监督算法对输入数据进行逐层重构,使网络更有效的学习到数据的内部结构特征。之后使用带标签数据通过监督学习算法对整个网络进行调优。首先对真假琥乙红霉素片的近红外光谱数据进行预处理以及白化预处理,通过白化处理降低数据特征之间的相关性,使数据各特征具有相同的方差。数据处理之后利用稀疏降噪自编码网络针对真假药品光谱数据建立分类模型,并将稀疏降噪自编码网络模型与BP神经网络以及SVM算法在分类准确率及算法稳定性方面进行对比。结果表明对光谱数据进行白化预处理能有效提升稀疏降噪自编码网络的分类准确率。并且自编码网络分类准确率在不同训练样本数量下均高于BP神经网络,SVM算法在少量训练样本的情况下更有优势,但在训练数据集样本数达到一定数量后,自编码网络的分类准确率将优于SVM算法。在算法稳定性方面,自编码网络较之BP神经网络和SVM算法也更稳定。使用稀疏降噪自编码网络对真假药品近红外光谱数据进行建模,能对真假药品进行有效的鉴别。  相似文献   

10.
支持向量机复合核函数的高光谱显微成像木材树种分类   总被引:1,自引:0,他引:1  
采用体视显微高光谱成像方法,构建木材树种分类识别模型。利用SOC710VP体视显微高光谱图像采集系统获取可见光/近红外(372.53~1 038.57 nm)波段内的木材高光谱图像。首先,采用ENVI软件提取木材样本感兴趣区域(ROI)的平均光谱,分别采用连续投影算法(SPA)和竞争性自适应重加权算法(CARS)对光谱数据进行降维。再利用支持向量机(SVM)分别建立木材样本采集波段和特征波长下的分类模型。然后,在空间维采用第一主成分图像,计算基于灰度共生矩阵(GLCM)的木材纹理特征。在0°,45°,90°和135°四个方向计算能量、熵、惯性矩、相关性等16个特征参数后输入SVM进行木材树种分类处理。最后,采用四个复合核函数SVM进行光谱维和空间维的特征融合及分类识别。20个树种的分类实验结果表明,CARS的特征波长选择效果和运行速度较好一些,采用普通SVM进行木材光谱维特征分类处理时,测试集分类准确率达到了92.166 7%。采用基于GLCM的木材空间维纹理特征时,采用普通SVM的测试集分类准确率是60.333 0%,具有较低的分类精度。在将光谱维和空间维纹理特征进行数据融合及分类处理时,采用复合核函数SVM分类具有更好的效果。采用第二个复合核函数的SVM分类精度最高,测试集分类正确率是94.166 7%,运行时间为0.254 7 s。另外,采用第一个和第三个复合核函数的SVM的测试集分类准确率分别是93.333 3%和92.610 0%,运行时间分别为0.180 0和0.260 2 s。可以看出,采用这3种复合核函数的SVM进行木材树种分类,分类精度都高于采用普通SVM的光谱维或者空间维的分类识别精度。因此,利用体视显微高光谱成像和复合核函数SVM可以提高木材树种分类精度,为木材树种快速分类提供了参考。  相似文献   

11.
肺炎支原体是造成人类呼吸系统疾病的主要原因。临床中,患者感染不同肺炎支原体症状极为相似,很难根据症状判别肺炎支原体类型并对症给药。因此,准确判别肺炎支原体菌株类型对于发病机理和疾病流行病学研究以及临床精准治疗具有重要意义。拉曼光谱具有快速、高效、无污染等优点,在生物医学领域逐渐得到越来越多研究者们的关注。一维卷积神经网络(1D-CNN)是一类包含卷积运算且具有深度结构的前反馈网络,在语音信号和振动信号分析等方面取得成功应用。提出一维卷积神经网络与拉曼光谱技术结合,针对肺炎支原体主要基因型M129型和FH型样本的拉曼光谱数据集,实现肺炎支原体菌株分类。利用光谱数据增强方法扩充原光谱数据集作为模型输入,训练一维卷积神经网络模型,解决由于小样本导致卷积神经网络数据饥渴问题;为了得到最好的肺炎支原体分类效果并加速学习过程,优化模型结构并确定最佳模型参数;拉曼光谱测量时常混有高斯噪声、泊松噪声和乘性噪声,为优化模型抗噪能力,将原光谱分别叠加高斯噪声、泊松噪声和乘性噪声,训练一维卷积神经网络模型并和LDA,KNN和SVM等传统算法进行比较。实验结果表明基于1D-CNN方法,对于叠加高斯噪声的光谱数据所建模型分类正确率为98.0%,叠加泊松噪声的光谱数据分类正确率为97.0%,叠加乘性噪声的光谱数据分类正确率为97.0%,分类正确率远高于基于LDA,KNN和SVM等传统算法所建模型分类正确率;同时构造叠加5,15,25,35,45和55 dBW不同强度噪声的光谱数据集,当噪声达到55 dBW时,1D-CNN模型仍能取得92.5%的分类正确率。因此,一维卷积神经网络结合拉曼光谱技术应用于肺炎支原体菌株类型分类是可行的,具有抗噪声能力强和分类正确率高的优点,该研究为肺炎支原体肺炎快速诊断提供新思路。  相似文献   

12.
We use 343,747 sources from LAMOST DR5 to do star/galaxy/QSO classification with machine learning approaches. Specifically, the 312,767 spectral labeled stars (G, K, M, F, A) are used to do star classification. The photometry of u, g, r, i, z, J, and H are used as machine learning features. For star/galaxy/QSO classification, the k nearest neighbor algorithm (KNN), decision tree (DT), random forest (RF) and support vector machine (SVM) perform well. For star classification, the accuracy of RF and SVM classification are higher than the accuracy of KNN and DT. The area under receiver operating characteristic curves of the four models are approaching to 1. The accuracy, precision, recall, f_score, Matthews correlation coefficient are always greater than 0.5. The four models perform all right in predicting the nature of sources and the star label.  相似文献   

13.
拉曼光谱检测方法依赖于化学计量学算法,深度学习是当下最炙手可热的方向,可应用于拉曼光谱进行建模。但是深度学习需要大样本进行训练,而拉曼光谱采集受制于器材和人力成本,获取大批量的样本需要更大成本,且易受荧光等因素干扰,这些问题都制约了将深度学习应用于拉曼光谱。针对以上问题,通过引入深度卷积生成对抗网络(DCGAN)提取拉曼光谱内部特征,对抗生成新的拉曼光谱,从而达到扩充数据集目的。同时和另一个扩充数据集的方法--偏移法进行对比,证明DCGAN的可靠性。设计生成光谱选取标准,选取高相似性的光谱填充数据集,为深度学习在拉曼光谱中的应用奠定基础。为了验证生成的光谱比原始光谱有更好的适用性,设计四组实验:(1)使用原始拉曼光谱输入到SVM进行分类,得到51.92%的分类准确率;(2)使用原始拉曼光谱输入到CNN进行分类,得到75.00%的分类准确率;(3)采用偏移法生成光谱,输入到CNN里进行分类,得到91.85%的分类准确率;(4)使用DCGAN生成光谱,输入到CNN里进行分类,得到98.52%分类准确率。实验结果表明,DCGAN能在只有少量拉曼光谱的情况下,通过对抗学习得到较好的生成光谱,且生成的光谱相比原光谱更加清晰,减少了可能的干扰因素,具有光谱预处理效果。通过DCGAN对抗生成大量高质量的数据填充到原有拉曼光谱数据集,扩充数据集的样本量,使得深度学习模型能够得到更好的训练,从而提高模型的准确率。该研究为深度学习方法应用于拉曼光谱分析技术提出了一个可行的方案。  相似文献   

14.
油类污染严重威胁到自然环境及人类健康。因此,识别和处理油类污染非常重要。由于三维荧光光谱能够表征石油的荧光特征,故一般利用三维荧光光谱法检测溶液中存在的油类污染物。但油类的三维荧光光谱数据维度较高且直接分析的难度较大,因此可以利用数据降维方法提取原始油类样本的光谱特征,并利用所得到的光谱特征对样本进行识别。基于此,利用二维线性判别分析(2D-LDA)对油类样本进行特征提取,研究提取的不同样本光谱特征的差别,将得到的光谱特征作为K最近邻(KNN)分类的输入,得到相应的分类结果。首先,分别配制四种不同的油类(柴油、汽油、航空煤油、润滑油)样本各20个,共计得到80个油类样本;然后,利用FS920光谱仪采集所有油类样本的三维荧光光谱数据;其次,对采集到的光谱数据进行预处理,去除光谱中散射的干扰并标准化;最后,利用2D-LDA算法对样本进行特征提取,利用KNN算法进行分类,并将其分类结果与经主成分分析(PCA)进行特征提取后的分类结果比较。研究结果表明,2D-LDA提取特征的分类效果优于PCA。利用2D-LDA分别提取发射和激发特征得到测试集识别的准确率相同且都为95%,而将发射和激发光谱特征的分类距离相结合并重新进行分类的准确率为100%。表明两类光谱相对于三维荧光光谱具有互补性,将发射和激发光谱特征相结合能够更好地对样本进行分类。而利用PCA对测试集识别的准确率仅为85%,表明2D-LDA对三维荧光光谱数据的特征提取效果更好。与PCA相比,2D-LDA通过类内散度和类间散度最大化投影向量来提取样本的特征,使得同类样本尽可能接近,不同样本尽可能分离。因此,2D-LDA具有使降维后的数据更容易被区分的特点,故其鲁棒性好。该研究为油类的降维识别提供了一种参考。  相似文献   

15.
贮存时间是影响生菜品质的一项重要因素,传统的贮存时间鉴别方法主要依靠人工经验,但是这种方法的准确率和可信度并不高。研究的目标是建立一种基于模糊识别的模型进行生菜光谱分析以实现生菜贮存时间的鉴别,并与其他鉴别方法作比较。为此,在当地超市购买60份新鲜生菜样品,存放于冰箱中待用。首先,通过Antaris Ⅱ近红外光谱检测仪采集生菜样品的近红外光谱数据,每隔12小时检测一次,每个样本检测重复三次,并取三次平均值作为实验数据。其次,利用多元散射校正(MSC)减少近红外光谱中的冗余信息。为了进一步去除近红外光谱中的无用信息以及简化随后的数据分类过程,分别运用主成分分析(PCA)和排序主成分分析 (PCA Sort)。其中,PCA Sort通过改进对主成分的排序方法能提高分类准确率,同时便于模糊线性鉴别分析(FLDA)进一步提取特征。PCA和PCA Sort的计算仅运用了前15个主成分(能充分反映光谱的主要信息)。最后,利用模糊线性鉴别分析算法(FLDA)和K近邻算法(KNN)进一步分类所得的低维数据。基于PCA和KNN算法的模型鉴别准确率达到43%,而基于PCA,FLDA和KNN算法的模型鉴别准确率可达83%。上述结果说明基于PCA,FLDA和KNN算法的模型鉴别准确率已经得到较大程度提高。当用PCA Sort替代了模型中的PCA算法后,结合FLDA和KNN算法则鉴别准确率达到98.33%。实验结果表明PCA Sort结合FLDA和KNN所建立的模型是有效的生菜贮存时间鉴别模型。  相似文献   

16.
基于近地高光谱成像技术结合化学计量学方法,实现了黑豆品种的鉴别。实验以三种不同颜色豆芯的黑豆为研究对象,采用高光谱成像系统采集380~1 030 nm波段范围的高光谱图像,提取高光谱图像中的样本感兴趣区域平均光谱信息作为样本的光谱进行分析,建立黑豆品种的判别分析模型。共采集180个黑豆样本的180条平均光谱曲线。剔除明显噪声部分之后以440~943 nm范围光谱为黑豆样本的光谱,采用多元散射校正(multiplicative scatter correction,MSC)对光谱曲线进行预处理。分别以全部光谱数据、主成分分析(principal component analysis,PCA)提取的光谱特征信息、小波分析(wavelet transform,WT)提取的光谱特征信息建立了偏最小二乘判别分析法(partial least squares discriminant analysis,PLS-DA),簇类独立模式识别法(soft independent modeling of class analogy,SIMCA),最邻近节点算法(K-nearest neighbor algorithm,KNN),支持向量机(support vector machine,SVM), 极限学习机(extreme learning machine,ELM)等判别分析模型。以全谱的判别分析模型中,ELM模型效果最优;以PCA提取的光谱特征信息建立的模型中,ELM模型也取得了最优的效果;以WT提取的光谱特征信息建立的模型中,ELM模型结识别效果最好,建模集和预测集识别正确率达到100%。在所有的判别分析模型中,WT-ELM模型取得了最优的识别效果。实验结果表明以高光谱成像技术对黑豆品种进行无损鉴别是可行的,且WT用于提取光谱特征信息以及ELM模型用于判别黑豆品种能取得较好的效果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号