首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到15条相似文献,搜索用时 187 毫秒
1.
采用近红外(NIR)漫反射光谱法对新疆特色梨果库尔勒香梨的五种不同果(包括青头、粗皮、脱萼、宿萼、突顶果)的硬度进行测定。由于近红外光谱数据量大且原始光谱噪声明显、测定水果时散射严重等导致光谱建模时关键波长变量提取困难。以新疆库尔勒香梨为研究对象,为了有效地消除固体表面散射以及光程变化对NIR漫反射光谱的影响,首先采用标准正态变量变换(SNV)和多元散射校正(MSC)对库尔勒香梨的原始光谱进行预处理。为寻找适合近红外光谱检测库尔勒香梨硬度的最佳特征波长筛选方法,进行香梨近红外光谱的特征波长变量选择方法的比较与研究。研究比较了两种特征波长筛选方法对库尔勒香梨硬度偏最小二乘法(PLS)建模精度的影响。同时使用反向偏最小二乘(BiPLS)和遗传算法结合反向偏最小二乘(BiPLS-GA)在全光谱范围内筛选香梨硬度的特征波长变量,将校正均方根误差(RESMC)、预测均方根误差(RESMP)以及决定系数(R2)作为模型的评价标准,并最终确定最优波段选择方法及最佳预测模型。基于选择的特征波长变量建立的PLS模型(BiPLS-GA)与全光谱变量建立的PLS模型进行比较发现BiPLS-GA模型仅仅使用原始变量中6.6%的信息就获得了比全变量PLS模型更好的库尔勒香梨硬度的预测结果,其中R2,RMSEC和RMSEP分别为0.91,1.03和1.01。进一步与基于反向偏最小二乘算法(BiPLS)获得的特征变量建立的PLS模型比较发现,BiPLS-GA不仅可以去除原始光谱数据中的无信息变量,同时也能够对共线性的变量进行压缩去除,使得建模变量从301个减少到20个。极大地简化模型的同时有效地提高了模型的预测精准度和稳定性。因此该方法能够有效地用于近红外光谱数据变量的选择。证明了近红外光谱分析技术结合BiPLS-GA模型能够高效地选择出建模变量,去除与库尔勒香梨硬度无关的近红外光谱信息,显著地提高库尔勒香梨硬度定量模型的预测精度。这不仅为新疆地区特色梨果库尔勒香梨的快速、精确、无损优选分级提供一定的技术支持,同时也为基于近红外光谱分析技术预测水果内部品质的研究提供了参考。  相似文献   

2.
近红外光谱法对甲醇柴油中甲醇含量测定   总被引:1,自引:0,他引:1  
应用近红外光谱结合化学计量学方法实现了对甲醇柴油中的甲醇含量的定量分析。以实验室配制的32种不同浓度[浓度范围为2%~25.8%(φ)]的甲醇柴油溶液为研究对象,在4 500~7 000 cm-1光谱范围内,建立偏最小二乘(PLS)、支持向量机(SVM)和最小二乘支持向量机(LS-SVM)三种定量分析模型。在建立SVM模型时,经过比较分析,径向基函数(radial basis function,RBF)作为SVM模型的核函数时可以获得更高的预测精度。最终获得甲醇含量的PLS, SVM和LS-SVM三种模型的预测相关系数RP分别为0.985 9, 0.990 3, 0.998 9,预测均方根误差RMSEP分别为0.405 2, 0.356 3, 0.062 4,可以看出,三种预测模型都可以达到很好的效果,最优的预测模型是使用LS-SVM建模。研究结果表明,利用近红外光谱法结合化学计量学方法对甲醇柴油中甲醇含量的检测具有可行性,并可以达到很好的效果。采用近红外光谱技术结合化学计量方法对甲醇柴油中甲醇含量进行定量分析,也为近红外光谱技术快速无损检测甲醇柴油甲醇含量提供参考和应用价值。  相似文献   

3.
应用可见/短波近红外光谱(Vis/SW-NIRS)测量土壤速效氮(N)和速效钾(K)含量。光谱预处理包括标准正态变换(SNV),多元散射校正(MSC)和Savitzky Golay平滑结合一阶导数,以消除系统噪声和外部干扰,分别应用偏最小二乘(PLS)和最小二乘支持向量机(LS-SVM)方法建立校正模型。最小二乘支持向量机(LS-SVM)输入分别包括主成分分析得到的主成分(PCs)和PLSR建模得到的潜在变量(LVs)和由PLSR模型回归系数得到有效波长(EWs)。结果表明,三种输入的LS-SVM模型都优于PLS模型, 其中EWs-LS-SVM模型最佳,速效氮(N)的相关系数(R2)和预测均方误差RMSEP分别0.82和17.2,速效钾(K)为0.72和15.0。结果表明,利用可见光和短波近红外光谱(Vis/ SW-近红外光谱)(325~1 075 nm)的LS-SVM的结合,可以作为一个精确的土壤理化性质的测定方法。  相似文献   

4.
甲醇汽油是一种用以替代传统汽油的新型燃料,其品质受到甲醇含量的严重影响。因此,甲醇汽油中甲醇含量的快速分析对其品质把控具有深远意义。基于拉曼光谱(Raman)结合偏最小二乘(PLS)建立了一种甲醇汽油中甲醇含量快速定量分析方法。采用激光拉曼光谱仪对49组甲醇汽油样品的Raman光谱进行采集,并进行光谱解析。比较了五种光谱预处理方法对甲醇汽油原始Raman光谱的预处理效果,并采用变量重要性投影(VIP)对小波变换(WT)预处理后的甲醇汽油Raman光谱数据进行了特征变量提取。其次,采用五折交叉验证(5-flod cross-validation (CV))对PLS校正模型的潜变量数目(LVs)及VIP阈值进行优化。在最优输入变量和模型参数下,分别构建了基于不同输入变量的PLS模型。研究表明,相较于原始光谱-偏最小二乘模型(RAW-PLS)和小波变换-偏最小二乘模型(WT-PLS),变量重要性投影-偏最小二乘模型(VIP-PLS)可以获得更好的分析性能,其预测集决定系数(R2p)为0.960 4,均方根误差(RMSEP)为0.0341。因此,Raman光谱结合PLS是一种快速准确的甲醇汽油中甲醇含量分析方法。  相似文献   

5.
在水果的品质检测和分级分选中,存在不同仪器所建检测模型难以共享的难题。为此,以壶瓶枣为研究对象,利用可见/近红外光谱技术探讨仪器间可溶性固形物含量(SSC)检测模型的传递方法。首先,采用美国ASD(Analytical Spectral Device)公司生产的两台仪器采集样本的光谱信息,采用最小二乘支持向量机(LS-SVM)建立原始光谱、Savitzky-Golay一阶导数处理、标准正态变量变换后的SSC检测模型,预测不同仪器采集的光谱时3种方法的预测能力均较差。预测同一台仪器的光谱时,基于原始光谱的主仪器所建模型最优,预测集的决定系数(R2p)和均方根误差(RMSEP)分别为0.73和1.36%。在此基础上,采用Kennard/Stone算法选取标样,利用专利算法(Shenk’s)、直接标准化(DS)、斜率/偏差算法(S/B)进行模型传递。然后,根据回归系数提取主仪器(24个)和从仪器(28个)的特征波长,优选出单一变量(SV)24个、共性变量(CV)23个、融合变量(FV)29个,均涵盖了SSC的主要吸收谱带。利用优选的变量分别建立主仪器的LS-SVM检测模型,采用主仪器的预测结果(R2p=0.78~0.80,RMSEP=1.07%~1.13%)明显好于全波段所建模型,但预测从仪器时RMSEP为6.62%~7.88%,模型失效。最后,基于波长位置偏移和分子振动的吸收特性提出了共性变量优选结合差值补正(CV-MC)、单一变量优选结合差值补正、融合变量优选结合差值补正、共性变量优选结合波长补正算法(CV-WC)进行模型传递,并与SV-Shenk’s,CV-Shenk’s,FV-Shenk’s,SV-DS,CV-DS,FV-DS,SV-S/B,CV-S/B和FV-S/B进行对比分析。结果表明,基于全波段进行模型传递时,预测结果均较差(R2p=0.03~0.34,RMSEP=2.44%~4.67%);基于优选变量所建模型经SV-Shenk’s,CV-Shenk’s,FV-Shenk’s传递后的结果较差,经其他算法传递后的结果(R2p=0.47~0.73,RMSEP=1.30%~1.90%)好于全波段;基于共性变量传递后的结果好于单一变量和融合变量,CV-MC结果最佳(R2p=0.73,RMSEP=1.30%),CV-WC传递后的预测结果(RMSEP=1.62%)与CV-DS和CV-S/B相近。研究表明,CV-MC和CV-WC均是一种有效模型传递算法,对建立不同仪器间通用的鲜枣品质检测模型具有重要意义。  相似文献   

6.
莲子是我国重要的药食同源食物,与莲子营养价值相当、便于食用的莲子粉备受消费者青睐。为保证莲子粉的品质,利用近红外光谱(NIRs)技术对掺杂小麦粉、玉米粉和地瓜粉的莲子粉进行鉴定,在样品类别已知下利用支持向量机(SVM)、最小二乘支持向量机(LS-SVM)、偏最小二乘法-判别分析(PLS-DA)模型进行判别,在样品类别未知下基于聚类算法进行判别。同时,对莲子粉中水分含量利用偏最小二乘(PLS)回归进行定量分析。结果表明,LS-SVM模型对纯莲子粉样品与掺入小麦粉、玉米粉和地瓜粉的莲子粉样品的判别率达到100%;基于聚类算法能够有效识别掺入5%地瓜粉、小麦粉和玉米粉的莲子粉样品;PLS模型对莲子粉中水分含量预测综合性能良好,其中经过标准化预处理得到模型效果最佳,其R2c,RMSEC,R2p和RMSEP分别达到0.973 2,0.111 5,0.969 5和0.118 9。近红外光谱技术能为隐蔽的莲子粉掺杂的鉴别以及莲子粉中水分含量监控提供一种快速、准确、无损检测的分析方法,为保证高档次莲子品质提供一种有益的思路。  相似文献   

7.
基于最优光谱指数的大豆叶片叶绿素含量反演模型研究   总被引:1,自引:0,他引:1  
叶绿素含量的准确获取及预测可为作物种植的精准化管理提供理论依据。利用最优光谱指数建立大豆叶绿素含量反演模型,以大豆花芽分化期叶片为研究对象,获取高光谱和叶绿素含量数据。首先构建了7种与叶绿素含量相关的典型光谱指数,分别为比值指数(RI)、差值指数(DI)、归一化差值植被指数(NDVI)、修正简单比值指数(mSR)、修正归一化差值指数(mNDI)、土壤调节植被指数(SAVI)和三角形植被指数(TVI),并对原始高光谱进行一阶微分(FD)处理,随后分别对原始和一阶微分高光谱在全光谱波长范围内两两组合所有波长,进行14个光谱指数的计算。再采用相关矩阵法进行最优光谱指数的提取,将所有波长组合计算出的光谱指数与叶绿素含量进行相关性分析,以相关系数最大值为指标,提取出14组最优的波长组合,并进行对应光谱指数值的计算作为最优光谱指数。最后将最优光谱指数划分为3组模型输入变量,分别与偏最小二乘回归(PLS)、最小二乘支持向量机回归(LSSVM)和套索算法LASSO回归3种方法组合建模并对比分析,以决定系数R2c,R2p和均方根误差RMSEC,RMSEP作为模型评价指标,最终优选出精度最高的大豆叶片绿素含量反演模型。结果表明:14组最优光谱指数波长组合分别为RI(728,727),DI(735,732),NDVI(728,727),mSR(728,727),mNDI(728,727),SAVI(728,727),TVI(1 007,708),FDRI(727,708),FDDI(727,788),FDNDVI(726,705),FDmSR(726,705),FDmNDI(726,705),FDSAVI(727,788)和FDTVI(760,698),相关系数最大值rmax均大于0.8。建立最优模型的方法为输入变量为一阶微分光谱指数(组合2)与LSSVM组合的建模方法,所建模型的R2c=0.751 8,R2p=0.836 0,RMSEC=1.361 2,RMSEP=1.220 4,表明模型精度较高,可为大面积监测大豆的生长状态提供参考。  相似文献   

8.
为提高生鲜羊肉储存期内(4,8和20 ℃环境)挥发性盐基氮(TVB-N)的近红外光谱(NIR)检测的稳定性和准确性,选取特征光谱和预测模型是关键步骤。以121个羊肉样品为实验对象,采集生鲜羊肉680~2 600 nm波段的近红外光谱。以多元散射校正(MSC)、标准正态变换(SNV)等散射校正方法,Savitzky-Golay卷积平滑(SGS)、移动平均平滑(MAS)等平滑处理方法,以及归一化(Normalization)、中心化(Centering)、标准化(Autoscaling)等尺度缩放方法分别预处理光谱数据后建立偏最小二乘法(PLS)预测模型。比较发现SGS处理的光谱建模效果最好。利用蒙特卡洛采样(MCS)法及马氏距离法(MD)消除了羊肉光谱的5个异常数据。运用光谱-理化值共生距离(SPXY)算法划分总样本的75%(87个)为校正集样本,剩余29个为验证集样本,利用竞争性自适应重加权法(CARS)、无信息变量消除法(UVE)、改进的无信息变量消除法(IUVE)和连续投影算法(SPA)提取特征光谱得到的波长个数分别为14,713,144和15。将全光谱和4种方法提取的特征波长作为输入变量建立预测模型,CARS提取的波长所建立模型的性能优于UVE、IUVE和SPA提取的波长所建立模型的性能,表明CARS方法可以有效简化输入变量并提高预测模型的性能。改进后得到的IUVE法相比于UVE法,筛选出的波长数更少且模型性能有所提升。以提取的特征波长建立PLS,支持向量机(SVM)和最小二乘支持向量机(LS-SVM)预测模型,SVM模型得到最优的校正集预测结果,其中CARS-SVM预测模型的校正决定系数(R2C)和校正均方根误差(RMSEC)分别为0.939 1和1.426 7,最优的验证集预测效果为LS-SVM预测模型得到,其中IUVE-LS-SVM预测模型的验证决定系数(R2V)和验证均方根误差(RMSEV)分别为0.856 8和1.886 2。基于近红外特征光谱建立简化、优化的生鲜羊肉储存期TVB-N预测模型,为实现快速无损检测生鲜羊肉中的TVB-N浓度提供技术支持。  相似文献   

9.
近红外光谱技术结合RCA和SPA方法检测土壤总氮研究   总被引:1,自引:0,他引:1  
基于近红外光谱技术结合连续投影算法和回归系数分析对检测土壤总氮含量进行研究。采集农田土壤样本近红外光谱数据,土壤样本数量共394个。由于原始光谱数据量大,在500~2 500 nm光谱波长范围基础上,为简化模型,在原始光谱基础上采用连续投影算法和回归系数分析提取特征变量,以两种变量选择方法提取的特征变量作为输入,分别采用偏最小二乘回归(PLS)、 多元线性回归(MLR)和最小二乘支持向量机(LS-SVM)建模方法建立总氮预测模型,共建立了9个预测模型,最优预测集的决定系数为0.81,剩余预测偏差RPD为2.26。研究表明,基于连续投影算法和回归系数分析选择的特征波长可以应用于近红外光谱检测土壤总氮含量,同时可以大大简化模型,适合开发便携式土壤养分检测仪。  相似文献   

10.
为探讨基于可见一近红外光谱技术快速检测牛奶中是否含有三聚氰胺的可行性.文章通过往液态奶中添加不同含量的三聚氰胺,共制备样本160个.利用Handheld Field Spec光谱仪获取样本光谱,其后采用不同的预处理方法对光谱数据进行预处理,然后分别建立数学模型,比较模型的好坏,得到采用移动平均平滑作为数据的预处理方法较好.从160个样本中随机的取出120个样本建模,剩下的40个样本作为独立的验证集.采用偏最小二乘回归法(PLS)和最小二乘支持向苗机法(LS-SVM)方法分别建立判别分析模型,利用独立的验证集对判别模型进行了预测验证.预测结果的预测相关系数(R2)分别为0.917 4(PLS)和0.910 9(LS-SVM),预测标准误差(RMSEP)分别为0.030 4(PLS)和0.046 7(LS-SVM).研究结果表明近红外反射光谱可以作为一种快速检测牛奶中三聚氰胺的方法.  相似文献   

11.
红参中提取出的有效活性成分人参皂苷含量对后续产品的质量有重要的影响。传统的红参提取质量控制化学检测方法成本高,具有滞后性。已有的研究表明快速无损的近红外检测方法用于红参提取过程具有可行性,但现有方法依赖仪器自带数据处理软件,无法满足生产实际的精度和速度需求。为实现红参提取过程的快速、精确监测,提出将多种智能光谱筛选算法应用在近红外光谱建模中,并对比不同光谱筛选算法的性能和稳健性。以红参提取液中含量高的人参皂苷Rg1和含量较低的人参皂苷Rc为目标,采集了三个不同批次前两次红参提取液样本128份,在线获取1 000~2 499 nm波段近红外原始光谱吸光度数据,并同时采用国标方法高效液相色谱法测定目标人参皂苷含量,首先采用竞争适应性重加权采样法(CARS)、无信息变量消除法(UVE)、随机蛙跳算法(RF)和连续投影算法(SPA)四种波长筛选算法进行波长降维处理,然后使用筛选后的波长建立线性偏最小二乘(PLS)定量模型,并通过模型的均方根误差(RMSE)、决定系数(R2)和预测相对分析误差(RPD)等来评估模型的性能。从四种波长优选算法PLS建模结果可知,经RF优选后,建模特征波长变量下降为原来的0.67%,红参提取液中人参皂苷Rg1和Rc含量的R2都达到了0.94以上, 预测均方误差分别为0.024 6和0.013 5,预测集相对分析误差达到了4.84以上,降低了建模的难度,提高了建模的精度;将RF和CARS在原始光谱、全光谱、SNV预处理后的全光谱上建模对比,RF波长筛选算法建模模型的性能整体较好,不同的光谱范围和预处理方法下性能影响较小,稳健性好。综上表明RF是红参提取液建模相对理想的波长筛选算法,基于RF的PLS算法实现了对红参两次提取液的一次建模,可用于提取液中人参皂苷成分含量的快速检测,为药物的在线提取控制提供理论支撑。  相似文献   

12.
为了探究反射光谱检测水体中毒死蜱农药的可行性,使用由ASD公司的FieldSpecPro地物波谱仪构成的高光谱采集系统在室内、室外环境获取两种不同浓度区间的毒死蜱样品的光谱数据。基于偏最小二乘(PLS)和主成分分析(PCA)算法分别对毒死蜱样品光谱数据建立全波段定量模型,结果两种模型的预测能力均较高。通过相关性分析(CA)计算相关系数来选择毒死蜱样品光谱的特征波长,其中浓度区间为5~75 mg·L-1的室内、室外实验光谱的特征波长为388,1 080,1 276 nm和356,1 322,1 693 nm,浓度区间为0.1~100 mg·L-1的室内外实验样品光谱的特征波长为367,1 070,1 276,1 708 nm和383,1 081,1 250,1 663 nm。结合PLS算法建立样品特征波长光谱数据的定量模型,结果与全波段模型相比,浓度区间为5~75 mg·L-1的室内外实验光谱PLS特征波长模型的校正集决定系数R2C分别提高至0.987 5和0.999 2,预测集决定系数R2P分别提高至0.989 4和0.994 4,校正集均方根误差RMSEC分别降低为2.841和0.714,预测集均方根误差RMSEP分别降低为1.715和1.244;浓度区间为0.1~100 mg·L-1的室内外实验光谱特征波长PLS模型的校正集决定系数R2C分别提高至0.998 3和0.998 8,预测集决定系数R2P分别提高至0.998 4和0.999 0,校正集均方根误差RMSEC分别降低为1.383和1.186,预测集均方根误差RMSEP分别降低为1.510和1.229,验证集标准差与预测均方根误差的比值(RPD)有所增加,尤其是针对浓度区间为0.1~100 mg·L-1的实验,RPD值显著增加至21.7,说明基于特征波长建立的毒死蜱样品定量模型具有较高精度的预测能力,但是通过不同浓度区间范围的对比实验发现,ASD地物光谱仪对低浓度的毒死蜱溶液预测的相对误差偏大,存在客观上的检测下限。为了保证不同试验条件下的毒死蜱农药的特征波长都得到分析,增强模型使用的普适性与鲁棒性,根据特征波长选择出4个波段,即351~393,1 065~1 086,1 245~1 281和1 658~1 713 nm作为特征波段。特征波段模型的波长变量个数共38个,相比于全波段模型的432个波长变量,模型变量精简了91.2%,其中浓度区间为5~75 mg·L-1的室内外实验光谱PLS特征波段模型的R2C分别为0.993 7和0.987 8,R2P分别为0.979 8和0.998 2,RMSEC分别为1.690和2.516,RMSEP分别为1.987和0.659;浓度区间为0.1~100 mg·L-1的室内外实验光谱特征波段PLS模型的R2C分别为0.9882和0.9807,R2P分别为0.9391和0.9936,RMSEC分别为3.345和3.942,RMSEP分别为8.996和2.663,且四种实验情况下的模型RPD值均大于2.5,满足定量分析条件。因此采用高光谱采集系统对室内和室外环境中毒死蜱农药的快速检测具有一定的可行性,此研究结果对有机磷农药等面源污染物快速检测有实际的应用价值,可为农田水体有机磷农药快速检测仪器的开发提供理论基础。  相似文献   

13.
采用颜色、剪切力和K值评价冰鲜与冻融三文鱼的品质,利用高光谱成像技术结合化学计量学方法对三个品质指标进行预测,并讨论了不同波长选择算法所建模型的预测效果。准备不同冻融次数三文鱼样本,进行高光谱数据采集和品质指标真实值的测定。采用六种预处理方法减少光谱数据中暗电流以及噪声的干扰,采用竞争性自适应重加权算法(CARS)、区间变量迭代空间收缩法(iVISSA), iVISSA-CARS筛选出与待测指标相关的变量,通过比较三种波长选择算法筛选的特征变量所建偏最小二乘(PLS)模型的预测结果,优选出三个品质指标最佳的变量选择方法。结果表明1st Der-CARS-PLS模型对颜色中的a*预测效果最好,筛选出的51个变量建立模型的RcRp分别为0.931 6和0.929 7,RMSECV和RMSEP分别为0.716和0.735;2nd Der-CARS-PLS模型对剪切力的预测效果最好,筛选出的61个特征变量建立模型的RcRp分别为0.892 1和0.887 3,RMSECV和RMSEP分别为0.67 N和0.80 N;模型N-CARS-PLS取得了K值最好的预测效果,筛选出的51个特征变量所建模型的Rc,Rp,RMSECV和RMSEP分别为0.951 4, 0.950 0, 1.33, 1.53。说明CARS变量筛选方法能够有效提取与特征指标相关的变量,提高模型的预测性能。除此之外,特征变量筛选联合算法iVISSA-CARS-PLS对三个指标的预测也取得了较好的结果,对三个指标测试集的Rp分别为CARS-PLS预测模型的97.48%,97.02%,98.98%,而所用变量数仅为CARS-PLS的60.78%,62.29%,60.78%,说明变量筛选组合算法极大的减少了建立模型所用的数据量。三个指标的CARS-PLS以及iVISSA-CARS-PLS模型取得的预测效果均高于iVISSA-PLS,说明对于三文鱼三个品质指标的预测,CARS波长点筛选策略优于iVISSA波段选择策略。将优选出来的PLS模型分别用于构建三个品质指标的可视化分布图,清楚的展示了不同冻融次数三个品质指标的大小以及空间分布。因此,高光谱成像技术结合化学计量学方法可以较好的表征三文鱼的品质指标,为三文鱼多品质指标的同时快速检测提供了部分理论参考。  相似文献   

14.
结球甘蓝是一种富含碳水化合物的常见蔬菜,可溶性糖含量是决定其品质的重要参数。可溶性糖易溶于水,是蔬菜和水果口味的有效调节剂。作为碳水化合物,可溶性糖由三种元素C,H和O组成,其分子吸收光谱主要由被检测材料的分子中C-H,O-H和CO等基团的组合频率吸收和倍频吸收组成,包含丰富的有机物信息。因此,采用近红外光谱和化学计量学方法,探索结球甘蓝可溶性糖含量的快速检测方法。用德国布鲁克公司的MATRIX-Ⅰ型傅里叶变换近红外光谱仪采集161份结球甘蓝样本光谱数据。波数范围:12 800~4 000 cm-1(780~2 500 nm)。蒽酮比色法测量样本的可溶性糖。综合应用马氏距离法(MD)和蒙特卡洛交叉验证法(MCCV)剔除异常样本,采用Kennard-Stone(K-S)法将样本按照给定比例划分为校正集和验证集。分别使用Savitzky-Golay卷积平滑(S-G),一阶导数(FD),二阶导数(SD),多元散射校正(MSC)和变量标准化(SNV)及它们的组合共12种方法对样本进行光谱预处理,获得最佳预处理方法,提高光谱数据的信噪比。采用竞争性自适应重加权采样法(CARS)筛选偏最小二乘回归(PLS)模型中回归系数绝对值大的波数点,去掉回归系数绝对值小的波数点,以有效选择与所测特性值相关的最优波数组合,获得具有良好鲁棒性和强预测能力的校正模型。使用模型决定系数R2、交互验证均方根误差(RMSECV)、预测均方根误差(RMSEP)作为模型精度评价指标。根据蒙特卡洛交叉验证法和马氏距离剔除异常样本的原理,共剔除10个光谱或者化学值异常的样本。最终参与建模分析的样本个数为151。异常样本剔除后,通过K-S法将样本按照3∶1被分成校正集(110个样本)和验证集(41个样本)。使用原始光谱数据,预处理后的光谱数据和对应于优选波数的光谱数据,建立PLS模型。结果表明,利用MSC+FD光谱预处理可以提高建模精度,校正集R2从处理前的0.68增长到0.93,MSC+FD是本研究中理想的光谱数据预处理方法。利用CARS法共优选了84个建模波数。在12 000~10 000 cm-1波数区域内,有O-H键2级和C-H键3级倍频伸缩振动吸收,此区域主要的背景信息为水和其他含氢基团,在此区域内共包含了36个选定的波数。在8 500~6 000 cm-1区域,存在糖类和水的O-H键的1级倍频伸缩振动吸收,葡萄糖的O-H键的1级倍频伸缩振动吸收,该区域是包含反映可溶性糖成分的主要光谱区间,背景影响较小,CARS方法在此区域共选择了15个建模波数。5 800~4 000 cm-1区域与12 000~10 000 cm-1区域相似,包含的选定波数多,CARS方法在此区域选择了33个建模波数。利用CARS对参与建模的波数进行优选,减少了无关信息,降低了模型的复杂度,选择的波数不但引入了表征待测组分的光谱,同时还引入了代表背景信息的光谱,使得校正模型适应性增强。建立了结球甘蓝可溶性糖的全谱PLS模型,根据CARS波数优选结果,建立了结球甘蓝可溶性糖的CARS-PLS模型。对于全谱PLS定量模型,校正集的决定系数R2为0.93,RMSECV为0.157 2%,RMSEP为0.132 8%。对于CARS-PLS模型,校正集的决定系数R2为0.96,RMSECV为0.076 8%,RMSEP为0.059 4%。数据表明,两种模型具有相当的R2,但CARS-PLS模型的RMSECV是全谱PLS模型的1/2。RMSEP也接近1/2,CARS-PLS模型比全谱PLS定量模型所用建模变量少,模型得到简化,精度更优。用CARS-PLS模型对验证集41个样本进行预测,预测集决定系数R2为0.86,预测标准误差为0.059 4%。提供了一种工作效率较高的结球甘蓝质量无损检测方法。  相似文献   

15.
基于中红外光谱分析技术对浓香型白酒原酒中总酸及己酸乙酯的关键指标含量进行检测分析,采用标准正态变换(SNV)方法对数据进行预处理,结合组合间隔偏最小二乘波段选择法(SiPLS)及遗传算法(GA)对各指标的特征吸收波长进行筛选,最终采用偏最小二乘法(PLS)建立分析模型,通过决定系数R2、预测标准偏差(RMSEP)、性能...  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号