首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 640 毫秒
1.
提出一种偏最小二乘法(PLS)和人工神经网络(ANN)结合用于近红外光谱(NIRS)的分析方法,以提高奶粉蛋白质模型的预测精度。首先采用基于遗传算法的波长选择法(RS-GA)优化光谱数据,建立GA-PLS模型预测奶粉蛋白线性部分;然后在RS-GA法选择的波段上进行主成分分析(PCA),以主成分的得分矩阵作为ANN模型输入层,以GA-PLS预测值与真实值之差作为输出层,建立PC-ANN模型预测其非线性部分。最终预测结果为两个模型预测值之和,以模型的预测标准偏差(RMSEP)作为评价指标,以便考察新方法的有效性。同时建立线性的全谱模型(Fr-PLS),其Fr-PLS、GA-PLS和GA-PLS+PC-ANN模型的RMSEP分别为0.511,0.440和0.235。结果表明:考虑奶粉蛋白含量近红外模型的非线性部分,可以显著提高模型的预测精度,该方法也可为其它复杂体系模型精度的提高提供借鉴。  相似文献   

2.
高光谱结合主成分分析的苎麻品种识别   总被引:1,自引:0,他引:1  
苎麻(Boehmeiria nivea L)是我国的特产,作为一种传统的纤维作物,一直有着较高的经济地位。开发一种基于高光谱的、新型高效的苎麻品种识别方法,有利于苎麻栽种、种质资源开发利用,为实现苎麻高产优质及麻田精准管理提供关键技术支撑,对提高苎麻产量和品质有重要意义。为了将高光谱技术应用于苎麻品种识别,采集了9个不同基因型苎麻品种,利用地物光谱仪测定苎麻叶片高光谱反射率,共1 458个叶片高光谱数据,利用主成分分析(PCA)对高光谱数据进行降维,探讨PCA最佳主因子个数的确定方法,比较不同主因子个数与不同判别分析(DA)方法--即线性判别分析(LDA)、二次判别分析(QDA)和马氏距离判别分析(MD-DA)组合,在建立基于叶片高光谱的苎麻品种识别模型中效果。对全波段的数据样本进行主成分分析之后,以2~20个主成分作为特征变量,分别建立LDA,QDA和MD-DA三种品种判别模型进行预测,以预测集正确率为评价标准,比较各种组合的效果。结果表明,若以累积贡献率≥85%为标准,选择2个主成分时,LDA,QDA和MD-DA三种判别模型预测集正确率分别为32.92%,38.48%和33.54%;以特征值≥1为标准,选择11个主成分时,三种判别模型预测集正确率分别为68.72%,87.04%和83.54%;若以预测集正确率为优先考虑标准,将主成分个数增加至20个时,三种判别模型正确率有较大提高,分别为84.98%,95.68%和95.27%。由此,得到如下结论:①利用PCA组合DA方法建立基于苎麻叶片高光谱的品种识别模型是可行的,但因子数不同、DA判别标准不同、组合方法不同效果差异非常大;②主因子个数对识别结果的影响较为明显,适当增加主成分个数可以显著提高模型判别正确率,因此不应局限于PCA特征值和方差累积贡献率的选择方法;③主因子个数相同时,三种判别标准中,QDA效果最好,LDA效果最差;④最佳组合是20个主成分+QDA方法,其数据维度大大降低(由全波段的2 031维降低20维),而预测集正确率为95.68%。  相似文献   

3.
蜂王浆是一种具有抗氧化、抗衰老、调节心血管系统和免疫功能的纯天然营养保健食品,近年来在食品、生物医学等领域广泛应用。由于蜂王浆的采集过程费时费力且没有快捷简便的方法检测其品质,使得市场上的蜂王浆产品质量参差不齐,因此实现蜂王浆品质的快速鉴别就显得至关重要。该研究以蜂王浆的水分和蛋白质为研究对象,利用拉曼光谱技术结合主成分回归算法(PCR)和偏最小二乘法对蜂王浆进行了快速定量检测,建立了水分、蛋白质的定量模型,探究对其定量分析的可行性,并进行光谱预处理以提升模型的预测能力,使其预测准确性更高。蜂王浆中水分和蛋白质化学值的测定分别采纳蜂王浆国家标准规定的减压干燥法和凯氏定氮法。蜂王浆光谱的采集则是由DXR激光共焦显微拉曼光谱仪测得。应用TQ Analyst分析软件对蜂王浆光谱进行预处理及建立定量分析模型。其中光谱预处理包括导数、标准正态变换、多元散射校正、Savitsky-Golay卷积这四种光谱预处理法,并按一定关系排列组合成多种不同的预处理方法,对蜂王浆样品光谱进行数据处理,寻找出最优的模型与处理方法。结果表明,利用主成分回归法建立蜂王浆水分和蛋白质的定量模型效果不理想,水分的定量模型结果表明,Savitsky-Golay平滑(7)处理校正集决定系数最高但也仅为0.741 3,预测集决定系数为0.661 6,RMSEC为0.656,RMSEP为1.34,建模效果差。蛋白质的PCR定量模型结果表明,Savitsky-Golay平滑(7)处理相较之下最优,校正集决定系数0.675 0,预测集决定系数为0.566 8,RMSEC为0.548,RMSEP为0.957,建模效果较差。因此,基于PCR所建模型对蜂王浆水分、蛋白质的含量有一定的预测可能性,但建模效果较差,预测准确度低,稳健性差。而结合偏最小二乘法并进行S-G(7)+二阶导数+SNV处理对蜂王浆水分建模效果最好,水分含量校正集和预测集的决定系数分别为0.992 7和0.948 8,RMSEC和RMSEP分别为0.162和0.442。蛋白质的PLS定量模型,通过对多种预处理组合处理结果进行对比,S-G(7)+一阶导数+SNV处理对蜂王浆蛋白质建模效果最佳,蛋白质含量校正集和预测集的决定系数分别为0.991 6和0.879 5,RMSEC和RMSEP分别为0.143和0.497,建模效果好。因此,利用拉曼光谱结合偏最小二乘法快速检测蜂王浆中水分和蛋白质的含量是可行的,且所建定量模型稳健性良好,预测准确度高。通过上述实验可总结得出,在一些不可避免的外界因素影响下,将多种预处理方法组合起来可以提高模型的准确性和稳健性,比用单一的光谱预处理方法修正光谱更加有效,优化效果更加明显,且有效提升了模型的各参数,更好的提高了模型预测的准确性。同时表明了,拉曼光谱技术应用于蜂王浆品质的快速检测是可行的,且检测准确度高,速度快,在蜂王浆品质的快速检测方面展现了很好地应用前景。  相似文献   

4.
为了实现快速检测果珍中的二氧化钛含量,提出了应用近红外光谱技术结合化学计量学的快速检测方法。研究采用了320份果珍样本进行光谱特性的检测,其中200个样本用来建模,120个样本进行预测。首先比较了标准正态变量校正(SNV)、变量标准化(Normalize)、多元散射校正(MSC)等6种不同的数据预处理方法对偏最小二乘法(PLS)建模预测效果的影响。然后将PLS模型与应用主成分(PC)建立的主成分-神经网络校正(PC-ANN)模型进行比较。结果表明,MSC预处理的效果最好,PLS模型的最佳主成分数为7,预测值与标准值的相关系数R2达0.900 8,预测标准误差RMSEP为0.05。PC-ANN模型预测值与标准值的R2为0.868 4,RMSEP为0.04。说明PLS模型比PC-ANN模型的预测效果好。同时本研究也说明能够应用可见/近红外技术对二氧化钛进行快速定量测定。  相似文献   

5.
PCA和SPA的近红外光谱识别白菜种子品种研究   总被引:2,自引:0,他引:2  
为了实现对不同品种白菜种子的快速无损鉴别,应用近红外光谱技术获取白菜种子的光谱反射率,首先采用变量标准化校正和多元散射校正对原始光谱进行预处理;其次,采用主成分分析法(PCA)对光谱数据进行聚类分析,从定性分析的角度得到三种不同白菜种子的特征差异,并采用连续投影算法(SPA)选取特征波长;最后,分别基于全波段光谱、PCA分析得到的前3个主成分变量以及SPA算法选取的特征波长,建立了最小二乘支持向量机(LS-SVM)和偏最小二乘判别(PLS-DA)模型进行白菜种子不同品种的鉴别。从主成分PC1、PC2得分图中可以看出,主成分1和2对不同种类白菜种子具有很好的聚类作用。基于特征波长建立的PLS-DA和LS-SVM模型的判别结果优于基于主成分变量建立的模型,其中基于特征波长建立的LS-SVM模型识别效果最优,建模集和预测集的品种识别率均达到100%。结果表明,通过SPA算法选取的6个特征波长变量能够很好的反映光谱信息,提出的SPA算法结合LS-SVM预测模型能获得满意的分类结果,为白菜种子品种的识别提供了一种新方法。  相似文献   

6.
快速准确监测农田土壤全氮含量,可显著提高土壤肥力诊断与评价工作的效率。传统测定土壤全氮的方法存在耗时费力、成本高、环境污染等缺点,而基于光谱学原理的土壤全氮定量方法克服了传统测量的劣势。中红外(MIR)光谱相较于可见光-近红外(VNIR)光谱而言,具有更多的波段数和信息量,如何利用中红外光谱监测土壤全氮含量是具有重要应用前景的研究课题。为了探索中红外光谱对土壤全氮监测的可行性,以新疆南疆地区采集的246个农田土样为研究对象,以室内测定的全氮含量和中红外光谱反射率数据为数据源,分析了不同全氮含量土样的中红外光谱特征差异,以主成分分析法(PCA)和连续投影算法(SPA)对光谱数据进行降维,然后采用偏最小二乘回归(PLSR)、支持向量机(SVM)、随机森林(RF)和反向传播神经网络(BPNN)四种建模方法分别构建基于全波段和降维数据的土壤全氮含量定量反演模型。研究结果表明:(1)土壤在中红外波段光谱反射率随全氮含量的增加而增加,在3 620,2 520,1 620和1 420 cm-1附近存在明显的吸收谷;将中红外光谱数据进行最大值归一化处理后,可明显提高土壤光谱反射率与全氮含量的相关性。(2)对比两种数据降维方法,PCA和SPA分别使模型变量数减少了99.8%和97.5%,但以PCA提取的8个主成分为自变量建立的模型预测精度总体要高于SPA对应的模型,因此以PCA提取的主成分建模更适于土壤全氮模型的构建。(3)在建模集中,PLSR和SVM模型以全波段建模精度最高,但建模变量数多,建模效率较低,而RF和BPNN模型分别以PCA和SPA降维后的数据建立的模型在保持精度相当的前提下,可显著提高建模效率;在预测集中,基于PCA降维数据的BPNN模型预测能力最高,R2和RMSE分别为0.78和0.12 g·kg-1,RPD和RPIQ值分别为2.33和3.54,模型具备较好的预测能力。研究结果可为农田土壤全氮含量快速估测提供一定的参考价值。  相似文献   

7.
水分含量是哈密大枣干制过程中的重要指标,对其外观、口感、贮藏和运输具有重要的影响。因此,为实现哈密大枣水分含量的准确预测,采用近红外光谱结合变量优选方法,建立干制哈密大枣水分含量的GA-ELM预测模型。为提高模型的稳定性和预测精度,开展并讨论了核函数和神经元个数对GA-ELM预测模型的影响。采用多种预处理方法对全波段光谱进行处理,对比分析发现标准正态变换方法(SNV)效果最佳。对标准正态变换处理后的光谱利用连续投影算法(SPA)、联合区间偏最小二乘(si-PLS)和遗传算法(GA)及其组合算法分别从全波段927.77~2 501.14 nm范围内筛选特征波长,并建立对应GA-ELM预测模型,同时与全波段的GA-ELM模型效果相比较,采用SNV+SPA筛选的14个特征波长建立的GA-ELM模型效果最佳,预测结果R_c和R_p分别为0.984 2和0.967 5, RMSEC和RMSEP分别为0.006 1和0.007 9, RPD为3.678 8。研究结果表明:SNV+SPA+GA-ELM方法可实现干制哈密大枣水分含量的准确预测,为近红外光谱技术应用于干制哈密大枣在线检测提供了参考。  相似文献   

8.
便携式近红外仪检测牛奶中脂肪、蛋白质及干物质含量   总被引:6,自引:0,他引:6  
采用便携式近红外光谱仪,结合偏最小二乘回归法,研究了牛奶脂肪、蛋白质和干物质含量的测定方法,建立了近红外漫反射定最分析模型.结果显示,脂肪、蛋白质和干物质模型相关系数(R2)分别为0.98,0.95,0.98,建模集标准残差(RMSEC)分别为0.187,0.105,0.217,验证集标准残差(RMSEP)分别为0.1...  相似文献   

9.
基于PCA的土壤Cd含量高光谱反演模型对比研究   总被引:4,自引:0,他引:4  
土壤重金属污染对人类健康造成了极大的威胁,如何快速摸清土壤污染情况尤为重要。高光谱遥感具备光谱分辨率高,快速无损等优势,使其在土壤组分反演方面具有巨大的潜力。针对高光谱信息冗余及光谱变换对土壤镉(Cd)含量估算的影响进行分析,并利用变换前后的高光谱数据对比研究了不同高光谱模型对土壤Cd含量反演的性能。首先利用等离子体质谱法和FieldSpec4地物光谱仪收集了56组土壤样品的Cd含量和对应的高光谱曲线(350~2 500 nm);为了弱化光谱测定中光亮变化和土壤表面凹凸对实验结果的影响,研究对高光谱数据进行倒数对数预处理;考虑到高光谱数据中存在大量的信息冗余,研究采用了主成分分析(PCA)对高光谱数据进行降维处理并最终保留了前12个主成分量作为特征变量。针对高光谱反演模型,研究选择了偏最小二乘(PLSR)、支持向量机(SVM)、人工神经网络(ANN)和随机森林(RF)四种回归模型建立PCA主成分与Cd含量之间的关系;最后,研究选取了决定系数(R2)、均方根误差(RMSE)和RPD三种精度评估指标评估回归模型的拟合精度,结果表明针对光谱采用PCA波段降维的方法处理后,选取的12个主成分对变化前后的光谱累计贡献率均达到99.99%,作为模型的输入变量,四种模型均具有一定的预测能力。无论光谱变换与否,PCA-RF反演模型的预测能力均为最好(R2分别为0.856和0.855,RPD均高达3.39)。利用PCA对高光谱数据降维处理可以有效降低高光谱数据冗余,有力的保证模型的预测能力。以PCA筛选出的主成分量可以作为模型极好的输入变量,以RF为基础的高光谱反演模型在反演土壤Cd含量时具有最佳效果,可为该区域及类似地区的土壤重金属污染物反演提供新的方法支撑。  相似文献   

10.
针对土壤中铅含量的定量检测问题,本研究基于太赫兹光谱技术对不同pH下土壤中铅含量的最佳反演预测模型进行了探索性研究。分别制备了pH为8.5, 7.0和5.5的含铅土壤样品,采集样品的太赫兹光谱数据,并对光谱数据做了多元散射矫正(MSC)、基线校正和Savitzky-Golay平滑等预处理。对预处理后的光谱数据,采用连续投影法(SPA)选取光谱数据的特征频率。基于选取的特征频率分别采用偏最小二乘法(PLS)、支持向量机(SVM)和误差反向传播神经网络(BPNN)建立土壤中铅含量的反演预测模型,采用校正集相关系数(R_c)、校正集均方根误差(RMSEC)、预测集相关系数(R_p)、预测集均方根误差(RMSEP)和剩余预测偏差(RPD)作为评价参数对模型性能进行评估,确定铅在不同pH土壤中的最佳预测模型。实验结果表明:在经过SPA选择特征频率后的建模效果普遍比全光谱的效果好。其中pH 8.5的样品最佳预测模型为SPA-PLS,R_c,R_p, RMSEC, RMSEP和RPD分别为0.997 7, 0.994 6, 14.52 mg·kg~(-1), 22.70 mg·kg~(-1)和9.63; pH 7.0的样品最佳预测模型为SPA-SVM,R_c,R_p, RMSEC, RMSEP和RPD分别为0.996 2, 0.975 7, 20.25 mg·kg~(-1), 33.04 mg·kg~(-1)和4.56; pH 5.5的样品最佳预测模型为SPA-BPNN,R_c,R_p, RMSEC, RMSEP和RPD分别为0.968 7, 0.974 4, 48.83 mg·kg~(-1), 55.03 mg·kg~(-1)和4.44。该研究结果为不同pH土壤中铅含量的光谱反演预测提供了一种新思路,亦可为其他重金属在不同pH土壤中的含量反演预测模型提供理论方法和技术支持。  相似文献   

11.
提出了应用光谱和纹理特征的高光谱成像技术早期检测番茄叶片早疫病的方法。利用高光谱图像采集系统获取380~1 030 nm范围内71个染病和88个健康番茄叶片的高光谱图像,同时采用主成分分析法(PCA)对高光谱图像进行处理。选取染病和健康叶片感兴趣区域(region of interest, ROI)的光谱反射率值,同时分别从前8个主成分的每幅主成分图像的ROI中提取对比度(Contrast)、 相关性(Correlation)、 熵(Entropy)和同质性(Homogeneity)4个灰度共生矩阵的纹理特征值,再通过PCA和连续投影算法(SPA)结合最小二乘支持向量机(LS-SVM)构建番茄叶片早疫病的早期鉴别模型。建立的6个模型中,采用光谱反射率值的LS-SVM模型对番茄叶片早疫病的识别率最高,达到100%。结果表明,应用高光谱成像技术检测番茄叶片早疫病是可行的。  相似文献   

12.
应用可见/近红外光谱进行黄酒品种的判别   总被引:5,自引:2,他引:3  
为了实现对黄酒品种的快速判别,采用可见/近红外光谱对不同品种的黄酒获取光谱曲线,然后采用主成分分析方法对光谱数据进行聚类分析,并将其提取的主成分作为BP神经网络的输入值,建立了黄酒品种鉴别模型。该模型将前6个主成分作为神经网络的输入变量,加速了神经网络的学习速度,提高了模型的预测精度。随机选取每个品种的15个黄酒样本,共45个样本组成预测集,剩余的145个黄酒样本组成训练集建立训练模型,并用预测集样本对其进行验证。将品种鉴别的偏差标准定为±0.1,结果表明,只有1个未知样本超出偏差范围,该方法的品种鉴别正确率为97.78%,获得了满意的结果。说明文章提出的方法具有很好的分类和鉴别作用,为黄酒品种的快速鉴别提供了一种新方法。  相似文献   

13.
应用近红外光谱技术快速检测果醋糖度   总被引:7,自引:0,他引:7  
为了对果醋糖度值进行快速准确检测,应用近红外光谱技术并结合最小二乘支持向量机分析方法建立了果醋糖度检测模型.应用近红外透射光谱获取五种类型共计300份果醋样本的光谱透射曲线,利用主成分分析方法对原始光谱数据进行降维处理,根据主成分的累计贡献率选取6个主成分.选取的主成分即作为光谱优化特征子集以替代原来复杂的光谱数据.随后将300份果醋样本数据随机分为定标集和预测集,利用最小二乘支持向量机在225个定标集样本数据基础上建立起果醋糖度预测模型,应用此模型对75个预测集样本进行糖度预测.根据预测均方根误差(RMSEP)和预测结果的相关系数(r)对预测模型进行评价,利用此模型得到的样本糖度预测值r=0.993 9,RMSEP=0.363,均达到了较好的预测效果.  相似文献   

14.
局部建模方法用于烟草样品的近红外光谱定量分析   总被引:1,自引:0,他引:1  
采用近红外光谱在主成分空间的距离作为样本相似性的判据,建立了一种用于近红外光谱定量分析的局部建模方法。该方法首先对校正集的光谱进行主成分分析(PCA),然后基于主成分空间中预测样本与校正集样本的距离选择校正子集并建立局部偏最小二乘(PLS)回归模型。对欧氏距离和马氏距离的比较表明,欧氏距离可以更好地表达样本之间的相似性。将所建立的方法用于烟草样品中氯和尼古丁含量的测定,结果表明局部建模方法比常用的全局建模方法具有更好的预测准确性,特别是在低含量成分的预测中具有明显优势。  相似文献   

15.
应用高光谱成像技术对不同保藏温度的灵武长枣的可溶性固形物含量进行预测模型建立。提取图像中感兴趣区域的平均光谱数据,经过不同光谱预处理后,利用连续投影法(SPA)选择特征波长,对4℃冷藏光谱提取13个特征波段(421,426,512,598,641,670,675,723,814,906,944,978,982 nm),对常温保藏光谱提取12个特征波段(425,507,555,598,673,680,685,718,809,910,954,978 nm)。对于MSC处理、MSC+SPA处理、Savitzky-Golay平滑处理和SNV 4种预处理方法,筛选出的最优预处理方法是冷藏采用MSC处理、常温采用MSC+SPA处理。对应这两种最优预处理方法,分别建立偏最小二乘法(PLSR)、支持向量机(SVM)、主成分回归(PCR)3种预测模型。在以上获得的6个预测模型中,得出冷藏、常温保藏的最优模型分别为MSCPLSR模型(R2C:0.852,RMSEC:0.940;R2P:0.857,RMSEP:0.894)和MSC+SPA-PLSR模型(R2C:0.872,RMSEC:0.866;R2P:0.787,RMSEP:1.007)。结果表明:利用高光谱成像技术,结合多种预测模型建立,能够测定不同保藏温度下的灵武长枣可溶性固形物含量,实现对灵武长枣准确快速的无损检测。  相似文献   

16.
可见光/近红外光谱模型是土壤属性预测的有效工具。波长优选在光谱建模过程中起着重要作用。文中首先利用从安徽省涡阳县采集的130个砂姜黑土土壤样本获得可见光/近红外光谱,然后利用平滑与多重散射校正联合的光谱预处理方式消除光谱中的无关变量和冗余信息以提高模型预测结果的相关性,再利用SPXY方法挑选建模集样本,分别利用连续投影算法和遗传算法进行波长优选,最后利用留一法进行交互验证建立有机质含量的主成分回归模型。研究结果显示:连续投影算法和遗传算法都可以有效地减少参与建模的波长数并提高模型的准确度,尤其是遗传算法能够更好地提高土壤有机质含量预测精度,其相关系数、预测均方根误差和相对分析误差分别达到0.9316,0.2142和2.3195。通过合适的特征波长选取,不仅计算量可以大大减少,预测精度也会有效提高。  相似文献   

17.
研究了人工神经网络在激光诱导击穿光谱(LIBS)塑料分类识别方面的应用。选用七种常见的塑料作为实验样品,获得每种样品的170组LIBS光谱数据,利用主成分分析获得前五个主成分的得分矩阵。用每种塑料样品的130组光谱数据的主成分得分矩阵作为训练集,建立反向传播(BP)人工神经网络模型。将其余40组主成分得分作为测试数据输入训练好的模型进行分类识别,其识别准确度达到97.5%。实验结果表明,通过采用主成分分析与BP人工神经网络相结合的方法,可以很好地进行塑料激光诱导击穿光谱的分类识别,对塑料的回收利用有重要价值。  相似文献   

18.
基于可见/近红外光谱技术的番茄叶片灰霉病检测研究   总被引:3,自引:1,他引:2  
利用可见/近红外光谱技术对感染灰霉病的番茄叶片感染程度进行了检测。提出了主成分分析结合BP神经网络的数据处理方法。采用主成分分析进行数据的降维,减少了计算量,提高了建模精度。通过主成分分析中的载荷值,定性地分析了不同波段对病害程度检测的重要性。将得到的最主要的几个主成分输入BP神经网络进行建模,预测结果显示,当主成分数为8,隐含层结点数为11的时候,病害程度的检测模型对未知样本预测的相关系数达到0.930,SEP为0.068 7,模型具有良好的检测效果。说明基于光谱技术和化学计量学方法的灰霉病检测模型具有很好的检测能力,为光谱技术应用于病害检测提供了新的方法。  相似文献   

19.
牛奶中包含着很多人体需要的营养元素,如脂肪、蛋白质、钙等;对牛奶营养元素进行分析是牛奶安全检测关键的一部分。高光谱技术可以有效地结合图像和光谱数据识别牛奶种营养元素。为了实现对牛奶中蛋白质含量快速、精确的预测,采用竞争性自适应重加权(CARS)算法选取特征波长,并提出一种基于麻雀搜索算法(SSA)优化支持向量机(SVM)实现对牛奶蛋白质含量预测。利用高光谱仪获取牛奶反射光谱(400~1 000 nm)。通过选取归一化(N)、标准化(Standardization)和多元散射校正(MSC)对原始的牛奶数据进行光谱降噪处理提高光谱利用率;利用竞争性自适应重加权算法和连续投影算法(SPA)对经过处理的牛奶光谱数据提取特征波长,求取蛋白质和光谱间的相关系数并进行重要性排序,获取重要的特征波段;最后,通过遗传算法(GA)优化SVM, 粒子群算法(PSO)优化SVM和偏最小二乘法(PLS)算法对牛奶蛋白质进行预测并比较预测结果,为了提高蛋白质预测的精度和模型稳定性,提出利用SSA对SVM的核函数g和惩罚参数c进行优化,以均方根误差(RMSE)作为适应度函数,通过迭代选择最优的回归参数训练模型。牛奶数据预测结果表明最优组合模型为:MSC-CARS-SSA-SVM。模型测试集的决定系数R2为0.999 6,均方根误差RMSE为0.001 1,耗时4.112 1 s。结果表明:使用CARS算法能实现特征波段的提取和冗余信息的剔除,从而提高模型效率,简化了算法的复杂度;SSA算法优化SVM的参数,通过迭代更新麻雀最优位置,可以快速得到全局最优解,与SVM,GA-SVM,PSO-SVM和PLS相比,牛奶蛋白质的预测准确度和模型稳定性都得到了明显提高,满足了对乳品检测的精确度要求,是快速检测牛奶蛋白质的一个可行新方法。为光谱模型的优化及预测模型精度的提高提供参考。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号