首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 156 毫秒
1.
冬枣品质受其品种和生长环境等因素的影响,引起采后化转红指数不同,导致果实的颜色差异较大,从而影响其可溶性固形物(SSC)检测模型的分析精度。采用可见-近红外(Vis-NIR)光谱结合Norris-Williams平滑(NWS)、连续小波导数(CWD)、多元散射校正(MSC)、标准正态变量变换(SNV)和NWS-MSC五种光谱预处理方法构建不同颜色(红绿相间MJ,绿色GJ和红色RJ)冬枣SSC的偏最小二乘(PLS)定量分析模型,分别采用MJ,GJ,RJ,MJ-GJ和MJ-GJ-RJ五个样品集合建立冬枣SSC的定量分析模型,并采用由MJ-GJ-RJ三种颜色冬枣样品组成的测试集进行模型的评价;以不同建模样品集(校正集)的校正相关系数(Rc)和交互验证均方根误差(RMSECV)作为构建最优模型的评价指标;测试集的预测相关系数(Rp)和预测均方根误差(RMSEP)用于模型预测精度的评价。研究结果表明:分别采用MJ,GJ和RJ的独立样品集进行建模时,模型仅对具有相同颜色的冬枣样品的SSC实现了较好的预测;分别在MJ样品中加入GJ和GJ-RJ样品进行MJ-GJ和MJ-GJ-RJ两个混合样品集的定量模型的构建时,MJ-GJ模型对MJ和GJ样品的SSC具有较好的预测效果,其RMSECV,Rc,RMSEP,Rp分别为1.108,0.698,0.980,0.724和1.108,0.698,0.983,0.822,而对RJ样品的预测误差较大,模型的RMSECV,Rc,RMSEP,Rp为1.108,0.698,1.928,0.597;而MJ-GJ-RJ模型对三种颜色的冬枣SSC均有较好的预测结果:MJ-GJ-RJ模型对MJ样品的SSC模型的RMSECV,Rc,RMSEP,Rp为1.158,0.796,1.077,0.668;对GJ样品的SSC模型的RMSECV,Rc,RMSEP,Rp为1.158,0.796,0.881,0.861;对RJ样品的SSC模型的RMSECV,Rc,RMSEP,Rp为1.158,0.796,1.140,0.841;采用蒙特卡罗无信息变量消除(MCUVE)方法进一步对MJ-GJ-RJ样品集光谱的特征变量进行优选后,模型的RcRp分别由原来的0.796和0.864提高到0.884和0.922,模型的RMSECV和RMSEP分别由1.158和0.946减小到0.886和0.721,模型具有较好的分析精度。采用可见-近红外光谱对不同颜色冬枣的SSC进行分析时,当建模集样品与测试集样品颜色属性相似或选择性质相似的建模变量进行模型构建时,模型具有更好的通用性。  相似文献   

2.
可溶性蛋白和谷胱甘肽(GSH)是羊肉重要的生理生化指标,是衡量机体抗氧化能力大小的重要因素,传统检测方法程序复杂,检测费时。为此应用可见-近红外(400~1 000 nm)高光谱成像技术实现可羊肉可溶性蛋白和还原性谷胱甘肽(GSH)含量无损、快速检测。首先,对采集的180个羊肉样本的原始光谱信息采用4种方法进行预处理,再运用竞争自适应加权算法(CARS)、区间变量迭代空间收缩算法-迭代和保留信息变量法(iVISSA-IRIV)进行特征波段的提取。同时使用灰度共生矩阵法(GLCM)提取贡献率最高的主成分图像的纹理信息。最后将优选出的预处理方法和特征波长信息作为光谱信息和光谱-纹理融合信息分别结合多元线性回归(MLR)、最小二乘支持向量机(LS-SVM)模型建立羊肉可溶性蛋白和谷胱甘肽含量的预测模型。结果显示未经预处理的原始光谱建立的羊肉可溶性蛋白含量PLSR模型效果最佳,其RcRp分别为0.875 7和0.854 7;采用SNV法预处理后光谱建立的羊肉GSH含量PLSR模型效果最佳,其RcRp分别为0.804 8和0.826 5。利用iVISSA-IRIV共筛选出31个特征波长,建立的羊肉可溶性蛋白LS-SVM模型的RcRp最优,分别为0.914 6和0.881 8;同时利用iVISSA-IRIV筛选出29个特征波长,建立的羊肉GSH-MLR模型的RcRp最优,分别为0.844 6和0.870 5。最终经光谱特征信息和图谱信息融合模型对比发现,建立iVISSA-IRIV-LS-SVM模型对羊肉可溶性蛋白预测效果最佳,其RcRp分别为0.914 6和0.881 8;利用SNV-iVISSA-IRIV法提取的光谱特征信息与纹理信息融合建立的MLR模型为预测羊肉GSH含量的最优模型,其RcRp分别为0.849 5和0.890 4。利用最优iVISSA-IRIV-LS-SVM和iVISSA-IRIV-MLR模型和成像处理方法,结合伪色彩图像直观的表示羊肉样本的可溶性蛋白和GSH含量的空间分布情况。研究结果表明利用高光谱图像的光谱和纹理信息能够用来预测羊肉可溶性蛋白和GSH含量。  相似文献   

3.
乙醇柴油作为清洁燃料是柴油很好的替代品,不同乙醇含量的乙醇柴油其粘度有差别,而乙醇的含量直接影响着柴油机燃烧性能。所以急需一种方法实现快速对乙醇柴油主要指标在线监测。对采集到的不同浓度的乙醇柴油的原始拉曼光谱数据使用Savitzkv-Golay平滑(S-G)、多元散射校正(MSC)、微分处理(1stD和2ndD)、标准正态变量校正(SNV)等四种方法以及他们的组合方法对光谱数据进行预处理后,分别建立了乙醇柴油密度、粘度和乙醇含量的偏最小二乘回归(PLSR)模型,比较不同的预处理方法发现,乙醇含量和粘度在S-G+2ndD预处理后所建立的PLSR模型效果最好,预测集Rp分别为0.930和0.918,RMSEP分别为1.237和0.034;S-G+1stD预处理后所建立的乙醇柴油密度PLSR模型结果最优,预测集Rp最大,为0.962,RMSEP最小,为0.14×10-2。将经过S-G+2ndD预处理后的光谱数据选用递归偏最小二乘算法(RPLS)、无信息变量消除(UVE)、正自适应加权算法(CRES)、连续投影算法(SPA)四种变量筛选方法以及将它们组合筛选得到的波长变量分别作为输入变量建立了PLSR模型,在使用SPA-CARS波长筛选方法所建立的乙醇柴油乙醇含量的预测模型效果最优,其预测集的Rp,RMSEP分别为0.978 1和0.825 5。结果表明使用该方法可以很好的对乙醇柴油的密度、粘度以及乙醇含量等主要指标进行预测。  相似文献   

4.
温度波动影响含氢基团之间的作用力,从而影响近红外光谱的吸收强度和波峰位置等,导致近红外测量精度的降低。针对温度变化对近红外光谱建模精度的影响,对全局隐含温度补偿方法进行了研究,并对其预测精度进行了分析,分别从预测方差和置信区间两个方面对此类模型的精度进行了理论探讨和验证。同时通过温度的连续变化实验,即在温度连续变化的过程中,等时间间隔采集各样品的近红外光谱,研究了温度变化对光谱主元的连续模式影响,探讨了温度变化影响模型预测精度的方式和途径。最后对某高分子聚合物的粘度测量问题进行了实验验证和误差分析,得到标准温度下所建未经温度补偿的模型和全局隐含温度补偿模型的建模精度分别为:RMSEC=0.243 0, Rc=0.871 6, RMSEP=0.243 2, Rp=0.869 3; RMSEC=0.258 2, Rc=0.870 6, RMSEP=0.265 2, Rp=0.856 0,而当温度变化时,二者预测最大置信区间分别约为1.8和0.9 kPa·s。虽然全局隐含温度补偿模型相比于标准温度模型建模精度略降低,但预测精度提高了一倍左右。理论分析和实验结果均表明,全局温度补偿模型具有较高的预测精度,且对温度的变化有较强的鲁棒性和可靠性。  相似文献   

5.
为了实现库尔勒香梨依据可溶性固体含量(SSC)分级定等和按质论价,推动采后处理向标准化、产业化方向健康发展,利用高光谱成像技术研究出了一种快速、有效、无损检测库尔勒香梨SSC的方法。以表面无损伤的157个库尔勒香梨作为研究样本,应用高光谱成像采集系统获取400~1 000 nm波长范围内高光谱图像并用ENVI5.3软件提取感兴趣区域(ROI),获得高光谱数据。采用Kennard-Stone(KS)样本集划分方法将全部样本按照2∶1的比例划分为校正集(105)和预测集(52)。对比标准变量变换(SNV)、多元散射校正(MSC)、一阶导数(FD)和二阶导数(SD)等数据预处理方法对建模精度的影响,最终选用SNV方法对光谱曲线进行平滑去噪。该研究提出竞争性自适应重加权算法与平均影响值算法的组合算法(CARS-MIV)选择特征波长。在竞争性自适应重加权算法(CARS)方法中,建模样本由蒙特卡罗算法随机选择生成,变量回归系数会随之发生变化,因而回归系数的绝对值不能全面反映变量重要性,从而影响模型检测精度。为降低这种影响,应用平均影响值(MIV)算法对选出的自变量进行二次筛选,筛选出相关性较大的变量用以建模分析,并与CARS、连续投影算法(SPA)、蒙特卡罗无信息变量消除算法(MCUVE)等经典特征波长选择算法进行比较。最后分别以全波长(FS)光谱信息和四种特征波长选择方法得出的光谱信息作为输入矢量,应用支持向量回归(SVR)建立库尔勒香梨可溶性固体含量定量预测数学模型,以校正集相关系数(Rc)、校正集均方根误差(RMSEC)、预测集相关系数(Rp)和预测集均方根误差(RMSEP)四个参数来评估模型的预测精度。比较分析发现,CARS-MIV-SVR模型效果最佳,校正集相关系数(Rc)为0.985 94,预测集相关系数(Rp)达到0.946 31,校正集和预测集均方根误差分别为0.185 85和0.403 33。结果证明:CARS-MIV特征波长选择方法能够有效增强库尔勒香梨光谱数据特征波长选择的稳定性和精确性,提高模型的预测精度。利用高光谱技术结合CARS-MIV-SVR模型能够满足库尔勒香梨可溶性固体含量测定需求,实现库尔勒香梨的分级定等和按质论价。  相似文献   

6.
高光谱成像的猕猴桃糖度无损检测方法   总被引:1,自引:0,他引:1  
猕猴桃糖度是重要的猕猴桃内部品质衡量指标。传统的糖度检测耗时且有损样品,有效无损检测猕猴桃糖度含量对于其品质分级、储藏销售具有重大意义。基于高光谱成像技术的常见果蔬品质无损检测方法多数是采用竞争性自适应重加权算法(CARS)、连续投影算法(SPA)、主成分分析(PCA)、迭代保留信息变量法(IRIV)等算法中的某个单一算法提取特征光谱变量,而这些算法单独使用易导致预测结果的稳定性不足。对此,开展了基于高光谱成像技术的猕猴桃糖度的无损检测方法研究。以四川省雅安市“红阳”猕猴桃为研究对象,依次对猕猴桃样本编号并采集其在400~1 000 nm波长范围内的高光谱图像,计算感兴趣区域的平均光谱作为样本的有效光谱信息;分别采用多元散射校正(MSC)、标准正态变量变换(SNV)、直接正交信号校正(DOSC)等3种光谱数据预处理方法分析对预测模型精度的影响,对比结果显示DOSC的预处理效果最好;对预处理后的光谱分别采用一次降维(CARS,SPA,IRIV)、一次组合降维(CARS+SPA,CARS+IRIV)算法和二次组合降维算法((CARS+SPA)-SPA,(CARS+IRIV)-SPA))等7种算法提取特征光谱变量,并分别构建了预测猕猴桃糖度的3种模型,即支持向量回归机(SVR)、最小二乘支持向量机(LSSVM)和极限学习机(ELM)模型;最后对比了基于不同特征提取方法的3种模型的预测精度。研究结果表明:ELM模型具有最好的预测性能,而SVR模型的预测性能最差;(CARS+IRIV)-SPA所选特征光谱变量输入LSSVM、ELM模型,其获得的预测结果均优于其他算法所选特征光谱变量输入对应模型所得的预测结果,证明了(CARS+IRIV)-SPA算法在提高猕猴桃糖度含量检测精度方面的有效性。对比不同方法的预测结果可知,(CARS+IRIV)-SPA-ELM对猕猴桃糖度的预测性能最优,其相关系数Rc=0.945 1,Rp=0.839 0,均方根误差RMSEC=0.450 3,RMSEP=0.598 3,预测相对分析误差RPD=2.535 1,该方法为猕猴桃糖度的检测无损化、精准化、智能化发展提供了可靠的理论依据和技术支撑。  相似文献   

7.
在水果的品质检测和分级分选中,存在不同仪器所建检测模型难以共享的难题。为此,以壶瓶枣为研究对象,利用可见/近红外光谱技术探讨仪器间可溶性固形物含量(SSC)检测模型的传递方法。首先,采用美国ASD(Analytical Spectral Device)公司生产的两台仪器采集样本的光谱信息,采用最小二乘支持向量机(LS-SVM)建立原始光谱、Savitzky-Golay一阶导数处理、标准正态变量变换后的SSC检测模型,预测不同仪器采集的光谱时3种方法的预测能力均较差。预测同一台仪器的光谱时,基于原始光谱的主仪器所建模型最优,预测集的决定系数(R2p)和均方根误差(RMSEP)分别为0.73和1.36%。在此基础上,采用Kennard/Stone算法选取标样,利用专利算法(Shenk’s)、直接标准化(DS)、斜率/偏差算法(S/B)进行模型传递。然后,根据回归系数提取主仪器(24个)和从仪器(28个)的特征波长,优选出单一变量(SV)24个、共性变量(CV)23个、融合变量(FV)29个,均涵盖了SSC的主要吸收谱带。利用优选的变量分别建立主仪器的LS-SVM检测模型,采用主仪器的预测结果(R2p=0.78~0.80,RMSEP=1.07%~1.13%)明显好于全波段所建模型,但预测从仪器时RMSEP为6.62%~7.88%,模型失效。最后,基于波长位置偏移和分子振动的吸收特性提出了共性变量优选结合差值补正(CV-MC)、单一变量优选结合差值补正、融合变量优选结合差值补正、共性变量优选结合波长补正算法(CV-WC)进行模型传递,并与SV-Shenk’s,CV-Shenk’s,FV-Shenk’s,SV-DS,CV-DS,FV-DS,SV-S/B,CV-S/B和FV-S/B进行对比分析。结果表明,基于全波段进行模型传递时,预测结果均较差(R2p=0.03~0.34,RMSEP=2.44%~4.67%);基于优选变量所建模型经SV-Shenk’s,CV-Shenk’s,FV-Shenk’s传递后的结果较差,经其他算法传递后的结果(R2p=0.47~0.73,RMSEP=1.30%~1.90%)好于全波段;基于共性变量传递后的结果好于单一变量和融合变量,CV-MC结果最佳(R2p=0.73,RMSEP=1.30%),CV-WC传递后的预测结果(RMSEP=1.62%)与CV-DS和CV-S/B相近。研究表明,CV-MC和CV-WC均是一种有效模型传递算法,对建立不同仪器间通用的鲜枣品质检测模型具有重要意义。  相似文献   

8.
近红外高光谱图像结合CARS算法对鸭梨SSC含量定量测定   总被引:3,自引:0,他引:3  
高光谱数据量大、 维数高且原始光谱噪声明显、 散射严重等特征导致光谱建模时关键波长变量提取困难。 基于此,提出采用竞争性自适应重加权算法(CARS)对近红外高光谱数据进行关键变量选择。 鸭梨作为研究对象。 采用决定系数r2、 预测均方根误差RMSEP和验证集标准偏差和预测集标准偏差的比值RPD值进行模型性能评估。 基于选择的关键变量建立PLS模型(CARS-PLS)与全光谱变量建立的PLS模型进行比较发现CARS-PLS模型仅仅使用原始变量中15.6%的信息获得了比全变量PLS模型更好的鸭梨SSC含量预测结果,r2pre,RMSEP和RPD分别为0.908 2,0.312 0和3.300 5。 进一步与基于蒙特卡罗无信息变量MC-UVE和遗传算法(GA)获得的特征变量建立的PLS模型比较发现,CARS不仅可以去除原始光谱数据中的无信息变量,同时也能够对共线性的变量进行压缩去除,该方法能够有效地用于高光谱数据变量的选择。 结果表明,近红外高光谱技术结合CARS-PLS模型能够用于鸭梨可溶性固形物SSC含量的定量预测。 从而为基于近红外高光谱技术预测水果内部品质的研究提供了参考。  相似文献   

9.
利用中红外光谱和化学计量学实现了对乙醇柴油各项性能指标的定量分析。实验样品96个,为32种不同浓度的乙醇柴油溶液。采用S-G平滑、MSC、微分处理(1stD和2ndD)、SNV等四种方法对光谱数据进行预处理,并结合八种波段筛选方法(UVE,CARS,SPA,RPLS,UVE-SPA,UVE-CARS,SPA-CARS,UVE-SPA-CARS)对乙醇柴油MIR光谱数据进行处理,分别建立乙醇柴油密度、粘度、乙醇含量的PLSR模型,得出以下主要结论:综合比较八种变量筛选方法,发现UVE-SPA-CARS-PLS对乙醇含量的建模效果最好,模型预测集的Rp和RMSEP分别为0.978 1和0.825 5。变量筛选较原始光谱建立的模型来说,不仅模型输入数量减少,预测效果也有所提高。  相似文献   

10.
应用激光诱导击穿光谱(LIBS)技术研究了快速检测咖啡豆中咖啡因含量的可行性。将咖啡豆磨粉压成片状作为采集LIBS光谱数据的样本,应用原子吸收分光光度计测量每个样本中咖啡因的含量。应用基线校正,小波变换和归一化等数据预处理方法;针对基于全部变量的偏最小二乘(PLS)模型会出现过拟合,分别应用回归系数和主成分分析(PCA)选择特征变量,并建立了基于特征变量的PLS和BP神经网络模型。结果表明:基于回归系数所选特征变量的PLS模型中,建模集相关系数Rc=0.96,预测集Rp=0.91;基于PCA提取特征变量的PLS模型中,Rc=0.94,Rp=0.90;基于PCA所选特征变量的BP神经网络模型中,Rc=0.96,Rp=0.96。两种方法所提取特征变量均对应C,H,O,N,Na,Mn,Mg,Ca和Fe,且基于上述两种方法所选特征变量的PLS模型均对预测集样本有较好的预测结果,说明上述元素与咖啡因含量存在联系,应用回归系数和PCA选择的特征变量是有效的,但是咖啡豆内C,H,O,N,Na,Mn,Mg,Ca,Fe与咖啡因含量的确切关系需要进一步研究。基于PCA所选特征变量的BP神经网络模型有更优的预测结果,说明所选特征变量适用于不同的建模方法。研究表明LIBS技术结合化学计量学方法可以实现咖啡豆中咖啡因含量的快速检测。  相似文献   

11.
结球甘蓝是一种富含碳水化合物的常见蔬菜,可溶性糖含量是决定其品质的重要参数。可溶性糖易溶于水,是蔬菜和水果口味的有效调节剂。作为碳水化合物,可溶性糖由三种元素C,H和O组成,其分子吸收光谱主要由被检测材料的分子中C-H,O-H和CO等基团的组合频率吸收和倍频吸收组成,包含丰富的有机物信息。因此,采用近红外光谱和化学计量学方法,探索结球甘蓝可溶性糖含量的快速检测方法。用德国布鲁克公司的MATRIX-Ⅰ型傅里叶变换近红外光谱仪采集161份结球甘蓝样本光谱数据。波数范围:12 800~4 000 cm-1(780~2 500 nm)。蒽酮比色法测量样本的可溶性糖。综合应用马氏距离法(MD)和蒙特卡洛交叉验证法(MCCV)剔除异常样本,采用Kennard-Stone(K-S)法将样本按照给定比例划分为校正集和验证集。分别使用Savitzky-Golay卷积平滑(S-G),一阶导数(FD),二阶导数(SD),多元散射校正(MSC)和变量标准化(SNV)及它们的组合共12种方法对样本进行光谱预处理,获得最佳预处理方法,提高光谱数据的信噪比。采用竞争性自适应重加权采样法(CARS)筛选偏最小二乘回归(PLS)模型中回归系数绝对值大的波数点,去掉回归系数绝对值小的波数点,以有效选择与所测特性值相关的最优波数组合,获得具有良好鲁棒性和强预测能力的校正模型。使用模型决定系数R2、交互验证均方根误差(RMSECV)、预测均方根误差(RMSEP)作为模型精度评价指标。根据蒙特卡洛交叉验证法和马氏距离剔除异常样本的原理,共剔除10个光谱或者化学值异常的样本。最终参与建模分析的样本个数为151。异常样本剔除后,通过K-S法将样本按照3∶1被分成校正集(110个样本)和验证集(41个样本)。使用原始光谱数据,预处理后的光谱数据和对应于优选波数的光谱数据,建立PLS模型。结果表明,利用MSC+FD光谱预处理可以提高建模精度,校正集R2从处理前的0.68增长到0.93,MSC+FD是本研究中理想的光谱数据预处理方法。利用CARS法共优选了84个建模波数。在12 000~10 000 cm-1波数区域内,有O-H键2级和C-H键3级倍频伸缩振动吸收,此区域主要的背景信息为水和其他含氢基团,在此区域内共包含了36个选定的波数。在8 500~6 000 cm-1区域,存在糖类和水的O-H键的1级倍频伸缩振动吸收,葡萄糖的O-H键的1级倍频伸缩振动吸收,该区域是包含反映可溶性糖成分的主要光谱区间,背景影响较小,CARS方法在此区域共选择了15个建模波数。5 800~4 000 cm-1区域与12 000~10 000 cm-1区域相似,包含的选定波数多,CARS方法在此区域选择了33个建模波数。利用CARS对参与建模的波数进行优选,减少了无关信息,降低了模型的复杂度,选择的波数不但引入了表征待测组分的光谱,同时还引入了代表背景信息的光谱,使得校正模型适应性增强。建立了结球甘蓝可溶性糖的全谱PLS模型,根据CARS波数优选结果,建立了结球甘蓝可溶性糖的CARS-PLS模型。对于全谱PLS定量模型,校正集的决定系数R2为0.93,RMSECV为0.157 2%,RMSEP为0.132 8%。对于CARS-PLS模型,校正集的决定系数R2为0.96,RMSECV为0.076 8%,RMSEP为0.059 4%。数据表明,两种模型具有相当的R2,但CARS-PLS模型的RMSECV是全谱PLS模型的1/2。RMSEP也接近1/2,CARS-PLS模型比全谱PLS定量模型所用建模变量少,模型得到简化,精度更优。用CARS-PLS模型对验证集41个样本进行预测,预测集决定系数R2为0.86,预测标准误差为0.059 4%。提供了一种工作效率较高的结球甘蓝质量无损检测方法。  相似文献   

12.
当近红外光谱信息远大于样本量时,对光谱信息进行自动变量选择进而建立光谱与样品含量的稀疏线性模型重要且具有挑战性。利用近红外光谱,将变量选择方法Elastic Net用于聚苯醚生产过程中微量成分邻甲酚的测量,建立近红外光谱与邻甲酚含量之间的定量校正模型,并将其模型预测效果与Lasso方法进行对比。在变量数目远远大于样本量的情形下,Lasso方法虽可实现变量选择,但由于对系数的过度压缩,使得模型的预测精度受到影响,而Elastic Net通过增加L2惩罚项避免了过多删失数据,可以提高模型预测精度。为了验证Elastic Net方法的模型性能指标,用复相关系数R2和调整的复相关系数R2a来评价模型的可解释性,利用平均相对预测误差MRPE(mean relative prediction error)和预测相关系数Rp来评价模型的预测精度。Lasso方法建立的模型性能指标为:R2=0.94,R2a=0.93,MRPE=4.51%,Rp=0.96;Elastic Net方法的性能指标为:R2=0.97,R2a=1,MRPE=3.25%,Rp=0.98。结果表明,Elastic Net所建立模型的性能指标优于Lasso方法,可以得到可解释性较强和预测精度较高的稀疏线性模型。  相似文献   

13.
X射线荧光光谱分析作为一种以化学计量学为基础的定量分析技术,所建立模型优劣对结果的预测准确性显得十分重要.竞争性自适应重加权算法(CARS)采用自适应重加权采样技术,利用交互验证选出互验证均方根误差(RMSECV)值最低原则,寻出最优变量组合.为了进一步提高PLS模型的解释和预测能力,将竞争性自适应重加权算法(CARS...  相似文献   

14.
当近红外光谱信息远远大于样本量时,对光谱信息进行自动变量选择进而建立光谱与微量成分含量之间的稀疏线性模型重要且具有挑战性。针对聚苯醚生产过程中微量成分邻甲酚难以测量的问题,将变量选择方法Adaptive Elastic Net用于建立近红外光谱与邻甲酚含量之间的定量校正模型,并将其模型性能与ElasticNet方法进行对比。在变量数目远远大于样本量的情形下,ElasticNet方法虽可以实现变量选择,但由于其系数估计不具备Oracle性质,使得模型的可解释性和预测精度受到影响,而Adaptive Elastic Net方法通过对L1惩罚项施加自适应权重从而很好的解决了上述问题并提高了模型性能。为了验证Adaptive Elastic Net方法的模型性能指标,用最终被选中的自变量数目来评价模型复杂度;利用复相关系数R2来评价模型的可解释性,利用平均相对预测误差MRPE(mean relative prediction error)和预测相关系数Rp来评价模型的预测精度。Elastic Net方法建立的模型性能指标为:NSIV=529,R2=0.96, MRPE=3.22%, Rp=0.97; Adaptive Elastic Net方法的性能指标为:NSIV=139, R2=0.99, MRPE=2.00%, Rp=0.99。结果表明:Adaptive Elastic Net所建立模型的性能指标优于Elastic Net方法,可以得到更加简单且具有较强可解释性和较高预测精度的稀疏线性模型。  相似文献   

15.
为了探究反射光谱检测水体中毒死蜱农药的可行性,使用由ASD公司的FieldSpecPro地物波谱仪构成的高光谱采集系统在室内、室外环境获取两种不同浓度区间的毒死蜱样品的光谱数据。基于偏最小二乘(PLS)和主成分分析(PCA)算法分别对毒死蜱样品光谱数据建立全波段定量模型,结果两种模型的预测能力均较高。通过相关性分析(CA)计算相关系数来选择毒死蜱样品光谱的特征波长,其中浓度区间为5~75 mg·L-1的室内、室外实验光谱的特征波长为388,1 080,1 276 nm和356,1 322,1 693 nm,浓度区间为0.1~100 mg·L-1的室内外实验样品光谱的特征波长为367,1 070,1 276,1 708 nm和383,1 081,1 250,1 663 nm。结合PLS算法建立样品特征波长光谱数据的定量模型,结果与全波段模型相比,浓度区间为5~75 mg·L-1的室内外实验光谱PLS特征波长模型的校正集决定系数R2C分别提高至0.987 5和0.999 2,预测集决定系数R2P分别提高至0.989 4和0.994 4,校正集均方根误差RMSEC分别降低为2.841和0.714,预测集均方根误差RMSEP分别降低为1.715和1.244;浓度区间为0.1~100 mg·L-1的室内外实验光谱特征波长PLS模型的校正集决定系数R2C分别提高至0.998 3和0.998 8,预测集决定系数R2P分别提高至0.998 4和0.999 0,校正集均方根误差RMSEC分别降低为1.383和1.186,预测集均方根误差RMSEP分别降低为1.510和1.229,验证集标准差与预测均方根误差的比值(RPD)有所增加,尤其是针对浓度区间为0.1~100 mg·L-1的实验,RPD值显著增加至21.7,说明基于特征波长建立的毒死蜱样品定量模型具有较高精度的预测能力,但是通过不同浓度区间范围的对比实验发现,ASD地物光谱仪对低浓度的毒死蜱溶液预测的相对误差偏大,存在客观上的检测下限。为了保证不同试验条件下的毒死蜱农药的特征波长都得到分析,增强模型使用的普适性与鲁棒性,根据特征波长选择出4个波段,即351~393,1 065~1 086,1 245~1 281和1 658~1 713 nm作为特征波段。特征波段模型的波长变量个数共38个,相比于全波段模型的432个波长变量,模型变量精简了91.2%,其中浓度区间为5~75 mg·L-1的室内外实验光谱PLS特征波段模型的R2C分别为0.993 7和0.987 8,R2P分别为0.979 8和0.998 2,RMSEC分别为1.690和2.516,RMSEP分别为1.987和0.659;浓度区间为0.1~100 mg·L-1的室内外实验光谱特征波段PLS模型的R2C分别为0.9882和0.9807,R2P分别为0.9391和0.9936,RMSEC分别为3.345和3.942,RMSEP分别为8.996和2.663,且四种实验情况下的模型RPD值均大于2.5,满足定量分析条件。因此采用高光谱采集系统对室内和室外环境中毒死蜱农药的快速检测具有一定的可行性,此研究结果对有机磷农药等面源污染物快速检测有实际的应用价值,可为农田水体有机磷农药快速检测仪器的开发提供理论基础。  相似文献   

16.
以油砂中钠元素为研究对象,首次应用近红外光谱,结合Lasso(least absolute shrinkage and selection operator)建模方法,建立了油砂金属钠含量的近红外光谱定量校正模型,并与传统的PLS建模方法进行比较。结果表明,两种方法建立的油砂金属钠含量校正模型都具有很高的精度,预测性能方面略有差异。在实验验证集与预测集中,PLS与Lasso算法的相关系数分别是:Rv=0.878 8,Rp=0.857 9和Rv=0.887 4,Rp=0.860 0。实验验证了使用近红外光谱快速测定油砂金属钠含量的有效性,并分析了PLS与Lasso算法的适用范围。  相似文献   

17.
高光谱成像的褐土土壤速效钾含量预测   总被引:2,自引:0,他引:2  
精细农业变量施肥取决于对农田的土壤养分分布的了解,快速获取土壤信息是实施精细农业的基础。速效钾是土壤肥力的重要参数,是植物生长发育所必需的营养元素。对土壤速效钾含量进行测量,是了解土壤肥力的重要途径,是实现精细农业的必要条件。以山西典型褐土土壤为研究对象,采集农田耕层褐土土壤样品共169份,样品经风干处理,手动捏碎较大的土粒并去除杂质后,未经研磨过筛处理而直接用于土壤近红外高光谱的测量。根据实验室速效钾含量测定结果,将所有土壤样品分为两类:其中速效钾含量低于100 mg·kg-1的样品共144个,随机选取108个作为低含量建模集(Lc),剩余36个作为低含量验证集(Lp);速效钾含量高于100 mg·kg-1的样品共25个,随机选取19个作为高含量建模集(Hc),剩余6个作为高含量验证集(Hp)。其中LcHc统称为所有含量建模集(Tc),Lp和Hp统称为所有含量验证集(Tp)。获取所有土壤样本950~1 650 nm范围内的近红外高光谱图像。分别采用平均光谱曲线(R)、平均光谱曲线的一阶导数(FD)、平均光谱曲线与一阶导数共同建模(R&FD)、平均光谱曲线与一阶导数的乘积(R*FD)、平均光谱曲线与一阶导数的商(R/FD)等五种光谱数据预处理方法,结合偏最小二乘法(PLS),分别对建模集Tc,LcHc建模,然后分别对验证集Tp,LpHp进行验证。结果表明:土壤的平均光谱反射率随速效钾含量的增大呈现先增加后减小的趋势。当速效钾含量低于100 mg·kg-1时,所有波段的光谱反射率随速效钾含量的增加而增加;当速效钾含量在100~200 mg·kg-1之间时,所有波段的光谱反射率均达到最大值。当速效钾含量超过200 mg·kg-1时,950~1 400 nm的光谱反射率急剧减小,但曲线的整体斜率显著增加;且速效钾含量越高,曲线整体斜率越大。当速效钾含量高于100 mg·kg-1时,平均光谱曲线的一阶导数显著增大,且随速效钾含量的增加而增加。该研究建立的PLS模型,可以对整体(所有速效钾含量)和高含量(≥100 mg·kg-1)速效钾进行有效预测,但无法对低含量(≤100 mg·kg-1)速效钾进行预测。建模效果最好的光谱预处理方法为R*FD,其次为FD,R,而R&FD,R/FD预测效果相对较差。最优建模方式为:R*FD结合Tc建模,其PLS主因子个数为2个,RMSEc=29.293,RPDc=4.669,R2c=0.956;对Tp的验证效果为RMSEp=29.438,RPDp=4.740,R2p=0.958;对Hp的验证效果为RMSEp=23.033,RPDp=3.199,R2p=0.915。该模型能够根据土壤速效钾的含量对土壤进行分类:当预测值小于100 mg·kg-1时,表明土壤速效钾含量低于100 mg·kg-1,具体含量不确定;当预测值大于100 mg·kg-1时,预测值则能够很好反映土壤速效钾的真实含量。由于选用的土壤样本未经研磨和过筛处理,因而能够大大缩短样本制备时间,提高预测效率。该研究结果可为近红外高光谱成像应用于褐土土壤除速效钾含量以外其他营养成份的快速预测提供参考。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号