首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到15条相似文献,搜索用时 125 毫秒
1.
当近红外光谱信息远大于样本量时,对光谱信息进行自动变量选择进而建立光谱与样品含量的稀疏线性模型重要且具有挑战性。利用近红外光谱,将变量选择方法Elastic Net用于聚苯醚生产过程中微量成分邻甲酚的测量,建立近红外光谱与邻甲酚含量之间的定量校正模型,并将其模型预测效果与Lasso方法进行对比。在变量数目远远大于样本量的情形下,Lasso方法虽可实现变量选择,但由于对系数的过度压缩,使得模型的预测精度受到影响,而Elastic Net通过增加L2惩罚项避免了过多删失数据,可以提高模型预测精度。为了验证Elastic Net方法的模型性能指标,用复相关系数R2和调整的复相关系数R2a来评价模型的可解释性,利用平均相对预测误差MRPE(mean relative prediction error)和预测相关系数Rp来评价模型的预测精度。Lasso方法建立的模型性能指标为:R2=0.94,R2a=0.93,MRPE=4.51%,Rp=0.96;Elastic Net方法的性能指标为:R2=0.97,R2a=1,MRPE=3.25%,Rp=0.98。结果表明,Elastic Net所建立模型的性能指标优于Lasso方法,可以得到可解释性较强和预测精度较高的稀疏线性模型。  相似文献   

2.
当近红外光谱信息远远大于样本量时,对光谱信息进行自动变量选择进而建立光谱与微量成分含量之间的稀疏线性模型重要且具有挑战性。针对聚苯醚生产过程中微量成分邻甲酚难以测量的问题,将变量选择方法 Adaptive Elastic Net用于建立近红外光谱与邻甲酚含量之间的定量校正模型,并将其模型性能与ElasticNet方法进行对比。在变量数目远远大于样本量的情形下,ElasticNet方法虽可以实现变量选择,但由于其系数估计不具备Oracle性质,使得模型的可解释性和预测精度受到影响,而Adaptive Elastic Net方法通过对L1惩罚项施加自适应权重从而很好的解决了上述问题并提高了模型性能。为了验证Adaptive Elastic Net方法的模型性能指标,用最终被选中的自变量数目来评价模型复杂度;利用复相关系数R~2来评价模型的可解释性,利用平均相对预测误差MRPE(mean relative prediction error)和预测相关系数Rp来评价模型的预测精度。Elastic Net方法建立的模型性能指标为:NSIV=529,R~2=0.96,MRPE=3.22%,Rp=0.97;Adaptive Elastic Net方法的性能指标为:NSIV=139,R~2=0.99,MRPE=2.00%,Rp=0.99。结果表明:Adaptive Elastic Net所建立模型的性能指标优于Elastic Net方法,可以得到更加简单且具有较强可解释性和较高预测精度的稀疏线性模型。  相似文献   

3.
以油砂中钠元素为研究对象,首次应用近红外光谱,结合Lasso(least absolute shrinkage and selection operator)建模方法,建立了油砂金属钠含量的近红外光谱定量校正模型,并与传统的PLS建模方法进行比较。结果表明,两种方法建立的油砂金属钠含量校正模型都具有很高的精度,预测性能方面略有差异。在实验验证集与预测集中,PLS与Lasso算法的相关系数分别是:Rv=0.878 8,Rp=0.857 9和Rv=0.887 4,Rp=0.860 0。实验验证了使用近红外光谱快速测定油砂金属钠含量的有效性,并分析了PLS与Lasso算法的适用范围。  相似文献   

4.
冬枣品质受其品种和生长环境等因素的影响,引起采后化转红指数不同,导致果实的颜色差异较大,从而影响其可溶性固形物(SSC)检测模型的分析精度。采用可见-近红外(Vis-NIR)光谱结合Norris-Williams平滑(NWS)、连续小波导数(CWD)、多元散射校正(MSC)、标准正态变量变换(SNV)和NWS-MSC五种光谱预处理方法构建不同颜色(红绿相间MJ,绿色GJ和红色RJ)冬枣SSC的偏最小二乘(PLS)定量分析模型,分别采用MJ,GJ,RJ,MJ-GJ和MJ-GJ-RJ五个样品集合建立冬枣SSC的定量分析模型,并采用由MJ-GJ-RJ三种颜色冬枣样品组成的测试集进行模型的评价;以不同建模样品集(校正集)的校正相关系数(Rc)和交互验证均方根误差(RMSECV)作为构建最优模型的评价指标;测试集的预测相关系数(Rp)和预测均方根误差(RMSEP)用于模型预测精度的评价。研究结果表明:分别采用MJ,GJ和RJ的独立样品集进行建模时,模型仅对具有相同颜色的冬枣样品的SSC实现了较好的预测;分别在MJ样品中加入GJ和GJ-RJ样品进行MJ-GJ和MJ-GJ-RJ两个混合样品集的定量模型的构建时,MJ-GJ模型对MJ和GJ样品的SSC具有较好的预测效果,其RMSECV,Rc,RMSEP,Rp分别为1.108,0.698,0.980,0.724和1.108,0.698,0.983,0.822,而对RJ样品的预测误差较大,模型的RMSECV,Rc,RMSEP,Rp为1.108,0.698,1.928,0.597;而MJ-GJ-RJ模型对三种颜色的冬枣SSC均有较好的预测结果:MJ-GJ-RJ模型对MJ样品的SSC模型的RMSECV,Rc,RMSEP,Rp为1.158,0.796,1.077,0.668;对GJ样品的SSC模型的RMSECV,Rc,RMSEP,Rp为1.158,0.796,0.881,0.861;对RJ样品的SSC模型的RMSECV,Rc,RMSEP,Rp为1.158,0.796,1.140,0.841;采用蒙特卡罗无信息变量消除(MCUVE)方法进一步对MJ-GJ-RJ样品集光谱的特征变量进行优选后,模型的RcRp分别由原来的0.796和0.864提高到0.884和0.922,模型的RMSECV和RMSEP分别由1.158和0.946减小到0.886和0.721,模型具有较好的分析精度。采用可见-近红外光谱对不同颜色冬枣的SSC进行分析时,当建模集样品与测试集样品颜色属性相似或选择性质相似的建模变量进行模型构建时,模型具有更好的通用性。  相似文献   

5.
可溶性蛋白和谷胱甘肽(GSH)是羊肉重要的生理生化指标,是衡量机体抗氧化能力大小的重要因素,传统检测方法程序复杂,检测费时。为此应用可见-近红外(400~1 000 nm)高光谱成像技术实现可羊肉可溶性蛋白和还原性谷胱甘肽(GSH)含量无损、快速检测。首先,对采集的180个羊肉样本的原始光谱信息采用4种方法进行预处理,再运用竞争自适应加权算法(CARS)、区间变量迭代空间收缩算法-迭代和保留信息变量法(iVISSA-IRIV)进行特征波段的提取。同时使用灰度共生矩阵法(GLCM)提取贡献率最高的主成分图像的纹理信息。最后将优选出的预处理方法和特征波长信息作为光谱信息和光谱-纹理融合信息分别结合多元线性回归(MLR)、最小二乘支持向量机(LS-SVM)模型建立羊肉可溶性蛋白和谷胱甘肽含量的预测模型。结果显示未经预处理的原始光谱建立的羊肉可溶性蛋白含量PLSR模型效果最佳,其RcRp分别为0.875 7和0.854 7;采用SNV法预处理后光谱建立的羊肉GSH含量PLSR模型效果最佳,其RcRp分别为0.804 8和0.826 5。利用iVISSA-IRIV共筛选出31个特征波长,建立的羊肉可溶性蛋白LS-SVM模型的RcRp最优,分别为0.914 6和0.881 8;同时利用iVISSA-IRIV筛选出29个特征波长,建立的羊肉GSH-MLR模型的RcRp最优,分别为0.844 6和0.870 5。最终经光谱特征信息和图谱信息融合模型对比发现,建立iVISSA-IRIV-LS-SVM模型对羊肉可溶性蛋白预测效果最佳,其RcRp分别为0.914 6和0.881 8;利用SNV-iVISSA-IRIV法提取的光谱特征信息与纹理信息融合建立的MLR模型为预测羊肉GSH含量的最优模型,其RcRp分别为0.849 5和0.890 4。利用最优iVISSA-IRIV-LS-SVM和iVISSA-IRIV-MLR模型和成像处理方法,结合伪色彩图像直观的表示羊肉样本的可溶性蛋白和GSH含量的空间分布情况。研究结果表明利用高光谱图像的光谱和纹理信息能够用来预测羊肉可溶性蛋白和GSH含量。  相似文献   

6.
应用激光诱导击穿光谱(LIBS)技术研究了快速检测咖啡豆中咖啡因含量的可行性。将咖啡豆磨粉压成片状作为采集LIBS光谱数据的样本,应用原子吸收分光光度计测量每个样本中咖啡因的含量。应用基线校正,小波变换和归一化等数据预处理方法;针对基于全部变量的偏最小二乘(PLS)模型会出现过拟合,分别应用回归系数和主成分分析(PCA)选择特征变量,并建立了基于特征变量的PLS和BP神经网络模型。结果表明:基于回归系数所选特征变量的PLS模型中,建模集相关系数Rc=0.96,预测集Rp=0.91;基于PCA提取特征变量的PLS模型中,Rc=0.94,Rp=0.90;基于PCA所选特征变量的BP神经网络模型中,Rc=0.96,Rp=0.96。两种方法所提取特征变量均对应C,H,O,N,Na,Mn,Mg,Ca和Fe,且基于上述两种方法所选特征变量的PLS模型均对预测集样本有较好的预测结果,说明上述元素与咖啡因含量存在联系,应用回归系数和PCA选择的特征变量是有效的,但是咖啡豆内C,H,O,N,Na,Mn,Mg,Ca,Fe与咖啡因含量的确切关系需要进一步研究。基于PCA所选特征变量的BP神经网络模型有更优的预测结果,说明所选特征变量适用于不同的建模方法。研究表明LIBS技术结合化学计量学方法可以实现咖啡豆中咖啡因含量的快速检测。  相似文献   

7.
采用颜色、剪切力和K值评价冰鲜与冻融三文鱼的品质,利用高光谱成像技术结合化学计量学方法对三个品质指标进行预测,并讨论了不同波长选择算法所建模型的预测效果。准备不同冻融次数三文鱼样本,进行高光谱数据采集和品质指标真实值的测定。采用六种预处理方法减少光谱数据中暗电流以及噪声的干扰,采用竞争性自适应重加权算法(CARS)、区间变量迭代空间收缩法(iVISSA), iVISSA-CARS筛选出与待测指标相关的变量,通过比较三种波长选择算法筛选的特征变量所建偏最小二乘(PLS)模型的预测结果,优选出三个品质指标最佳的变量选择方法。结果表明1st Der-CARS-PLS模型对颜色中的a*预测效果最好,筛选出的51个变量建立模型的RcRp分别为0.931 6和0.929 7,RMSECV和RMSEP分别为0.716和0.735;2nd Der-CARS-PLS模型对剪切力的预测效果最好,筛选出的61个特征变量建立模型的RcRp分别为0.892 1和0.887 3,RMSECV和RMSEP分别为0.67 N和0.80 N;模型N-CARS-PLS取得了K值最好的预测效果,筛选出的51个特征变量所建模型的Rc,Rp,RMSECV和RMSEP分别为0.951 4, 0.950 0, 1.33, 1.53。说明CARS变量筛选方法能够有效提取与特征指标相关的变量,提高模型的预测性能。除此之外,特征变量筛选联合算法iVISSA-CARS-PLS对三个指标的预测也取得了较好的结果,对三个指标测试集的Rp分别为CARS-PLS预测模型的97.48%,97.02%,98.98%,而所用变量数仅为CARS-PLS的60.78%,62.29%,60.78%,说明变量筛选组合算法极大的减少了建立模型所用的数据量。三个指标的CARS-PLS以及iVISSA-CARS-PLS模型取得的预测效果均高于iVISSA-PLS,说明对于三文鱼三个品质指标的预测,CARS波长点筛选策略优于iVISSA波段选择策略。将优选出来的PLS模型分别用于构建三个品质指标的可视化分布图,清楚的展示了不同冻融次数三个品质指标的大小以及空间分布。因此,高光谱成像技术结合化学计量学方法可以较好的表征三文鱼的品质指标,为三文鱼多品质指标的同时快速检测提供了部分理论参考。  相似文献   

8.
温度波动影响含氢基团之间的作用力,从而影响近红外光谱的吸收强度和波峰位置等,导致近红外测量精度的降低。针对温度变化对近红外光谱建模精度的影响,对全局隐含温度补偿方法进行了研究,并对其预测精度进行了分析,分别从预测方差和置信区间两个方面对此类模型的精度进行了理论探讨和验证。同时通过温度的连续变化实验,即在温度连续变化的过程中,等时间间隔采集各样品的近红外光谱,研究了温度变化对光谱主元的连续模式影响,探讨了温度变化影响模型预测精度的方式和途径。最后对某高分子聚合物的粘度测量问题进行了实验验证和误差分析,得到标准温度下所建未经温度补偿的模型和全局隐含温度补偿模型的建模精度分别为:RMSEC=0.243 0, Rc=0.871 6, RMSEP=0.243 2, Rp=0.869 3; RMSEC=0.258 2, Rc=0.870 6, RMSEP=0.265 2, Rp=0.856 0,而当温度变化时,二者预测最大置信区间分别约为1.8和0.9 kPa·s。虽然全局隐含温度补偿模型相比于标准温度模型建模精度略降低,但预测精度提高了一倍左右。理论分析和实验结果均表明,全局温度补偿模型具有较高的预测精度,且对温度的变化有较强的鲁棒性和可靠性。  相似文献   

9.
在水果的品质检测和分级分选中,存在不同仪器所建检测模型难以共享的难题。为此,以壶瓶枣为研究对象,利用可见/近红外光谱技术探讨仪器间可溶性固形物含量(SSC)检测模型的传递方法。首先,采用美国ASD(Analytical Spectral Device)公司生产的两台仪器采集样本的光谱信息,采用最小二乘支持向量机(LS-SVM)建立原始光谱、Savitzky-Golay一阶导数处理、标准正态变量变换后的SSC检测模型,预测不同仪器采集的光谱时3种方法的预测能力均较差。预测同一台仪器的光谱时,基于原始光谱的主仪器所建模型最优,预测集的决定系数(R2p)和均方根误差(RMSEP)分别为0.73和1.36%。在此基础上,采用Kennard/Stone算法选取标样,利用专利算法(Shenk’s)、直接标准化(DS)、斜率/偏差算法(S/B)进行模型传递。然后,根据回归系数提取主仪器(24个)和从仪器(28个)的特征波长,优选出单一变量(SV)24个、共性变量(CV)23个、融合变量(FV)29个,均涵盖了SSC的主要吸收谱带。利用优选的变量分别建立主仪器的LS-SVM检测模型,采用主仪器的预测结果(R2p=0.78~0.80,RMSEP=1.07%~1.13%)明显好于全波段所建模型,但预测从仪器时RMSEP为6.62%~7.88%,模型失效。最后,基于波长位置偏移和分子振动的吸收特性提出了共性变量优选结合差值补正(CV-MC)、单一变量优选结合差值补正、融合变量优选结合差值补正、共性变量优选结合波长补正算法(CV-WC)进行模型传递,并与SV-Shenk’s,CV-Shenk’s,FV-Shenk’s,SV-DS,CV-DS,FV-DS,SV-S/B,CV-S/B和FV-S/B进行对比分析。结果表明,基于全波段进行模型传递时,预测结果均较差(R2p=0.03~0.34,RMSEP=2.44%~4.67%);基于优选变量所建模型经SV-Shenk’s,CV-Shenk’s,FV-Shenk’s传递后的结果较差,经其他算法传递后的结果(R2p=0.47~0.73,RMSEP=1.30%~1.90%)好于全波段;基于共性变量传递后的结果好于单一变量和融合变量,CV-MC结果最佳(R2p=0.73,RMSEP=1.30%),CV-WC传递后的预测结果(RMSEP=1.62%)与CV-DS和CV-S/B相近。研究表明,CV-MC和CV-WC均是一种有效模型传递算法,对建立不同仪器间通用的鲜枣品质检测模型具有重要意义。  相似文献   

10.
近红外(NIR)光谱一般具有较多的波长变量数,对其直接或间接地进行变量选择是提高模型稳定性能及预测性能的关键。最小角回归(LAR)是一种相对较新和有效的机器学习算法,常用于进行回归分析和变量选择。面向光谱建模应用,提出一种LAR结合遗传偏最小二乘法(GA-PLS)的变量选择方法,可有效筛选出少数特征波长点。首先在全光谱区利用LAR消除变量间的共线性得到初筛波长点,然后用GA-PLS对LAR筛选出的波长点进一步优选从而得到最终建模用的特征波长点。为验证本文方法的有效性,以药片和汽油的近红外光谱回归分析作为应用案例,对原光谱进行预处理后,采用该方法进行变量筛选,然后分别建模其中的活性成分含量和C10含量。结果显示,在这两个应用中,最终优化得到的特征波长点数均只需七个,而两者的预测决定系数R2p分别达到0.933 9和0.951 9,与全光谱、无信息变量消除法(UVE)和连续投影算法(SPA)等方法相比,特征波长点更少,同时R2p和预测均方根误差RMSEP值更优。因此,LAR结合GA-PLS,能有效地从近红外光谱中选择出信息变量从而减少建模波数,提高预测精度,拥有较好的模型解释性。该方法可为特定领域的专用光谱仪设计提供有效的波长筛选工具。  相似文献   

11.
畜禽养殖中抗生素的不合理使用导致畜禽产品中抗生素残留问题时有发生,进而通过食物链影响食品安全,威胁人类健康。准确、快速检测出抗生素药物的含量对保障食品安全具有重要意义。以残留较为常见的喹诺酮类诺氟沙星抗菌药为研究对象,开展基于太赫兹光谱技术的诺氟沙星较大梯度和较小梯度的全浓度含量检测研究。在较大梯度诺氟沙星样本中,首先,在1%~100%范围内设置了11个浓度,完成较大梯度压片样本制备;然后经太赫兹时域光谱系统扫描获取其时域光谱,提取样本的吸收系数,用卷积平滑S-G二项式拟合滤波去除噪声、平滑样本光谱数据。发现纯净的诺氟沙星在1.205 THz处存在一个强烈吸收峰,在0.816 THz处存在一个弱吸收峰。最后,利用逐步回归和连续投影法(SPA)选择变量并结合特征吸收峰进行多元线性回归建模预测分析。进一步在较小梯度诺氟沙星样本研究中,首先在浓度100 μg·mL-1(0.01%)以下设置了29个浓度系列,完成较小梯度溶液样本制备;然后获得其太赫兹时域光谱,用S-G二项式拟合滤波进行数据预处理,发现各浓度的吸收光谱未出现明显差异,最后利用逐步回归和连续投影法(SPA)选择变量结合特征吸收峰实现多元线性回归建模预测分析。结果表明:在较大梯度诺氟沙星样本中逐步回归选择变量的多元线性回归达到了模型最优(Rp=0.962, RMSEP=2.74%),准确率优于当前已有最优预测模型(Rp=0.867, RMSEP=16.6%);小梯度诺氟沙星样本的逐步回归选择变量的多元线性回归模型最优(Rp=0.728, RMSEP=18.79 μg·mL-1),该方法有一定的预测能力,但是准确率有待提升。利用太赫兹光谱技术实现了较全浓度诺氟沙星的检测,为后续诺氟沙星检测限的探索等进一步研究提供了一定的研究基础。  相似文献   

12.
为探究遥感监测水稻冠层叶片氮素含量的较优高光谱反演模型,以水稻小区试验为基础,获取了不同生长期水稻冠层高光谱数据。在综合比较一阶导数变换(1-Der)、标准正态变量变换(SNV)和SG滤波法等处理方法基础上,提出一种将SNV与一阶导数变换的SG滤波法相结合的光谱处理方法(SNV-FDSGF),并将处理后的数据经无信息变量消除法(UVE)与竞争自适应重加权采样法(CARS)选出不同生长期的敏感波段。将各生长期的敏感波段两两随机组合,并构建与水稻叶片含氮量相关性较高的差值光谱植被指数(DSI)、比值光谱植被指数(RSI)、归一化光谱植被指数(NDSI)。其中分蘖、拔节和抽穗3个时期的最优植被指数和决定系数R2分别为:DSI(R857, R623), 0.704; DSI(R670, R578), 0.786; DSI(R995, R508), 0.754。以各生长期内的较优的三种植被指数作为输入分别构建自适应差分优化的极限学习机(SaDE-ELM)、径向基神经网络(RBF-NN)以及粒子群优化的BP神经网络(PSO-BPNN)反演模型。结果表明:SaDE-ELM建模效果最好,在模型稳定性和预测能力上比RBF-NN和PSO-BPNN都有了明显提高,各生长期反演模型的训练集和验证集决定系数R2均在0.810以上,RMSE均在0.400以下,可为东北水粳稻冠层叶片含氮量的检测与评估提供科学和技术依据。  相似文献   

13.
为了实现库尔勒香梨依据可溶性固体含量(SSC)分级定等和按质论价,推动采后处理向标准化、产业化方向健康发展,利用高光谱成像技术研究出了一种快速、有效、无损检测库尔勒香梨SSC的方法。以表面无损伤的157个库尔勒香梨作为研究样本,应用高光谱成像采集系统获取400~1 000 nm波长范围内高光谱图像并用ENVI5.3软件提取感兴趣区域(ROI),获得高光谱数据。采用Kennard-Stone(KS)样本集划分方法将全部样本按照2∶1的比例划分为校正集(105)和预测集(52)。对比标准变量变换(SNV)、多元散射校正(MSC)、一阶导数(FD)和二阶导数(SD)等数据预处理方法对建模精度的影响,最终选用SNV方法对光谱曲线进行平滑去噪。该研究提出竞争性自适应重加权算法与平均影响值算法的组合算法(CARS-MIV)选择特征波长。在竞争性自适应重加权算法(CARS)方法中,建模样本由蒙特卡罗算法随机选择生成,变量回归系数会随之发生变化,因而回归系数的绝对值不能全面反映变量重要性,从而影响模型检测精度。为降低这种影响,应用平均影响值(MIV)算法对选出的自变量进行二次筛选,筛选出相关性较大的变量用以建模分析,并与CARS、连续投影算法(SPA)、蒙特卡罗无信息变量消除算法(MCUVE)等经典特征波长选择算法进行比较。最后分别以全波长(FS)光谱信息和四种特征波长选择方法得出的光谱信息作为输入矢量,应用支持向量回归(SVR)建立库尔勒香梨可溶性固体含量定量预测数学模型,以校正集相关系数(Rc)、校正集均方根误差(RMSEC)、预测集相关系数(Rp)和预测集均方根误差(RMSEP)四个参数来评估模型的预测精度。比较分析发现,CARS-MIV-SVR模型效果最佳,校正集相关系数(Rc)为0.985 94,预测集相关系数(Rp)达到0.946 31,校正集和预测集均方根误差分别为0.185 85和0.403 33。结果证明:CARS-MIV特征波长选择方法能够有效增强库尔勒香梨光谱数据特征波长选择的稳定性和精确性,提高模型的预测精度。利用高光谱技术结合CARS-MIV-SVR模型能够满足库尔勒香梨可溶性固体含量测定需求,实现库尔勒香梨的分级定等和按质论价。  相似文献   

14.
利用光谱信息快速、无损和准确的检测水稻冠层叶片叶绿素含量,对水稻的长势评估、精准施肥、科学管理都具有非常重要的现实意义。以东北粳稻为研究对象,以小区试验为基础,获取关键生长期的水稻冠层高光谱数据。首先采用标准正态变量校正法(SNV)对光谱数据进行预处理,针对处理后光谱数据,以随机蛙跳(RF)算法为基础,结合相关系数分析法(CC)和续投影算法(SPA),提出一种融合两种初选波段的改进型随机蛙跳算法(fpb-RF)筛选叶绿素含量的特征波段,并分别与标准RF,CC 和SPA方法进行对比。以提取的特征波段作为输入,结合线性模型和非线性模型各自优势,提出一种高斯过程回归(GPR)补偿偏最小二乘(PLSR)的叶绿素含量混合预测模型(GPR-P):利用PLSR法对水稻叶绿素含量初步预测,得到叶绿素含量的线性趋势,然后利用具有较好非线性逼近能力的GPR对PLSR模型偏差进行预测,两者叠加得到最终预测值。为了验证所提方法优越性,以不同方法提取的特征波段作为输入,分别建立PLSR、最小二乘支持向量机(LSSVM)、BP神经网络预测模型。结果表明:相同预测模型条件下,改进fpb-RF算法提取特征波段作为输入可较好的降低模型复杂性、提高模型预测性能,各模型测试集的决定系数(R2P)和训练集的决定系数(R2C)均高于0.704 7。另外,在各算法提取特征波段进行建模时,GPR-P模型的R2CR2P均高于0.755 3,其中,采用fpb-RF方法提取的特征波段作为输入建立的GPR-P模型预测精度最高,R2CR2P分别为 0.781 5和0.779 6,RMSEC和RMSEP分别为0.904 1和0.928 3 mg·L-1,可为东北粳稻叶绿素含量的检测与评估提供有价值的参考和借鉴作用。  相似文献   

15.
高光谱成像的褐土土壤速效钾含量预测   总被引:2,自引:0,他引:2  
精细农业变量施肥取决于对农田的土壤养分分布的了解,快速获取土壤信息是实施精细农业的基础。速效钾是土壤肥力的重要参数,是植物生长发育所必需的营养元素。对土壤速效钾含量进行测量,是了解土壤肥力的重要途径,是实现精细农业的必要条件。以山西典型褐土土壤为研究对象,采集农田耕层褐土土壤样品共169份,样品经风干处理,手动捏碎较大的土粒并去除杂质后,未经研磨过筛处理而直接用于土壤近红外高光谱的测量。根据实验室速效钾含量测定结果,将所有土壤样品分为两类:其中速效钾含量低于100 mg·kg-1的样品共144个,随机选取108个作为低含量建模集(Lc),剩余36个作为低含量验证集(Lp);速效钾含量高于100 mg·kg-1的样品共25个,随机选取19个作为高含量建模集(Hc),剩余6个作为高含量验证集(Hp)。其中LcHc统称为所有含量建模集(Tc),Lp和Hp统称为所有含量验证集(Tp)。获取所有土壤样本950~1 650 nm范围内的近红外高光谱图像。分别采用平均光谱曲线(R)、平均光谱曲线的一阶导数(FD)、平均光谱曲线与一阶导数共同建模(R&FD)、平均光谱曲线与一阶导数的乘积(R*FD)、平均光谱曲线与一阶导数的商(R/FD)等五种光谱数据预处理方法,结合偏最小二乘法(PLS),分别对建模集Tc,LcHc建模,然后分别对验证集Tp,LpHp进行验证。结果表明:土壤的平均光谱反射率随速效钾含量的增大呈现先增加后减小的趋势。当速效钾含量低于100 mg·kg-1时,所有波段的光谱反射率随速效钾含量的增加而增加;当速效钾含量在100~200 mg·kg-1之间时,所有波段的光谱反射率均达到最大值。当速效钾含量超过200 mg·kg-1时,950~1 400 nm的光谱反射率急剧减小,但曲线的整体斜率显著增加;且速效钾含量越高,曲线整体斜率越大。当速效钾含量高于100 mg·kg-1时,平均光谱曲线的一阶导数显著增大,且随速效钾含量的增加而增加。该研究建立的PLS模型,可以对整体(所有速效钾含量)和高含量(≥100 mg·kg-1)速效钾进行有效预测,但无法对低含量(≤100 mg·kg-1)速效钾进行预测。建模效果最好的光谱预处理方法为R*FD,其次为FD,R,而R&FD,R/FD预测效果相对较差。最优建模方式为:R*FD结合Tc建模,其PLS主因子个数为2个,RMSEc=29.293,RPDc=4.669,R2c=0.956;对Tp的验证效果为RMSEp=29.438,RPDp=4.740,R2p=0.958;对Hp的验证效果为RMSEp=23.033,RPDp=3.199,R2p=0.915。该模型能够根据土壤速效钾的含量对土壤进行分类:当预测值小于100 mg·kg-1时,表明土壤速效钾含量低于100 mg·kg-1,具体含量不确定;当预测值大于100 mg·kg-1时,预测值则能够很好反映土壤速效钾的真实含量。由于选用的土壤样本未经研磨和过筛处理,因而能够大大缩短样本制备时间,提高预测效率。该研究结果可为近红外高光谱成像应用于褐土土壤除速效钾含量以外其他营养成份的快速预测提供参考。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号