首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 125 毫秒
1.
在近红外光谱分析中,将近红外光谱和浓度信息建立统计模型,通过光谱代入模型即可预测未知样本浓度。但是,检测条件的变化会导致光谱的改变,进而导致原有的模型不能准确预测光谱改变后的样本。对此,模型转移可以通过校正新测量的光谱(从光谱),使得从光谱能够被原有光谱(主光谱)建立的模型准确预测。模型转移可以使用全光谱进行校正,但是全光谱中往往包括噪声、背景等干扰信息,这些干扰会增加预测误差。故可以使用变量选择方法找出光谱中有化学意义的信息来模型转移。但是一般的变量选择算法只选择主光谱的区间,从光谱使用主光谱相同的波长区间模型转移。但是在实际工作中,主光谱和从光谱有化学意义的区间往往不一致,主从光谱使用同一区间模型转移会增加误差;此外,有时二者原光谱的波长范围并不一致,从主光谱选出的区间不能用于从光谱的校正。对此,提出了基于双光谱区间遗传算法(GA-IDS),同时选择主光谱和从光谱有化学意义的区间,进而实现模型转移。GA-IDS算法步骤包括,①随机产生种群;②分析种群中每条染色体,删去错误染色体;③根据每条染色体,找出其相应的主光谱和从光谱波段组合,并计算其模型转移后的验证均方根误差(RMSEV);④按照概率,执行选择、交叉、变异操作。在一次迭代结束之后,返回到步骤②,重新执行纠错、计算RMSEV、选择、交叉、变异。达到停止迭代的要求后,将最低的RMSEV值所对应的染色体保存下来作为最优染色体,其所对应的主从光谱区间作为最优区间。用玉米、小麦两套数据测试了该算法,结果显示,与全光谱相比,GA-IDS选择的主从光谱区间可以显著地降低误差;与向后迭代区间选择法(IIBS)相比,在小样本情况下,GA-IDS的误差显著地小于IIBS方法。  相似文献   

2.
样本选择是模型转移的重要组成部分,其目的是在主光谱和从光谱中选择合适的样本,建立二者的转移模型,使得从光谱的预测样本能通过转移模型校正成类似于主光谱的样本,进而用主光谱的模型直接预测其浓度。目前,常用的样本选择算法有:Kennard-Stone 法 (KS法), SPXY法和SPXYE法。根据上述算法的特点,提出了一种新的样本选择方法:加权SPXYE法(WSPXYE法),进而将其用于选择合适的转移集样本。WSPXYE同样先计算样本间的距离,其距离有三个部分组成:光谱(X)之间的归一化距离dxs,浓度(y)之间的归一化距离dys,以及校正误差(e)之间的归一化距离des。其加权代数和dwspxye=αdxs+βdys+(1-α-β)des即为WSPXYE距离。计算了WSPXYE距离之后,可以根据其距离选择距离较大的样本作为转移集样本。WSPXYE是Kennard-Stone法(KS法), SPXY法和SPXYE法的推广,而KS法(α=1=0)、SPXY法(α=0.5,β=0.5)以及SPXYE法(α=0.333,β=0.333)则是WSPXYE法的特例。直接校正法(DS)、有信息成分提取-典型相关分析法(CCA-ICE)作为模型转移算法验证了WSPXYE方法的效果。结果显示,与KS法、SPXY法以及SPXYE法相比,WSPXYE法可以通过调节参数,选择合适的样本,获得较低的误差。  相似文献   

3.
采用近红外(NIR)漫反射光谱法对新疆特色梨果库尔勒香梨的五种不同果(包括青头、粗皮、脱萼、宿萼、突顶果)的硬度进行测定。由于近红外光谱数据量大且原始光谱噪声明显、测定水果时散射严重等导致光谱建模时关键波长变量提取困难。以新疆库尔勒香梨为研究对象,为了有效地消除固体表面散射以及光程变化对NIR漫反射光谱的影响,首先采用标准正态变量变换(SNV)和多元散射校正(MSC)对库尔勒香梨的原始光谱进行预处理。为寻找适合近红外光谱检测库尔勒香梨硬度的最佳特征波长筛选方法,进行香梨近红外光谱的特征波长变量选择方法的比较与研究。研究比较了两种特征波长筛选方法对库尔勒香梨硬度偏最小二乘法(PLS)建模精度的影响。同时使用反向偏最小二乘(BiPLS)和遗传算法结合反向偏最小二乘(BiPLS-GA)在全光谱范围内筛选香梨硬度的特征波长变量,将校正均方根误差(RESMC)、预测均方根误差(RESMP)以及决定系数(R2)作为模型的评价标准,并最终确定最优波段选择方法及最佳预测模型。基于选择的特征波长变量建立的PLS模型(BiPLS-GA)与全光谱变量建立的PLS模型进行比较发现BiPLS-GA模型仅仅使用原始变量中6.6%的信息就获得了比全变量PLS模型更好的库尔勒香梨硬度的预测结果,其中R2,RMSEC和RMSEP分别为0.91,1.03和1.01。进一步与基于反向偏最小二乘算法(BiPLS)获得的特征变量建立的PLS模型比较发现,BiPLS-GA不仅可以去除原始光谱数据中的无信息变量,同时也能够对共线性的变量进行压缩去除,使得建模变量从301个减少到20个。极大地简化模型的同时有效地提高了模型的预测精准度和稳定性。因此该方法能够有效地用于近红外光谱数据变量的选择。证明了近红外光谱分析技术结合BiPLS-GA模型能够高效地选择出建模变量,去除与库尔勒香梨硬度无关的近红外光谱信息,显著地提高库尔勒香梨硬度定量模型的预测精度。这不仅为新疆地区特色梨果库尔勒香梨的快速、精确、无损优选分级提供一定的技术支持,同时也为基于近红外光谱分析技术预测水果内部品质的研究提供了参考。  相似文献   

4.
近红外光谱因为具有小成本、易操作、低耗时等优点,所以广泛用于食品领域。作为一种间接的检测方法,近红外光谱检测需要建立光谱和浓度之间的统计模型。但是,一种条件下建立的模型在另一种检测条件下会失效。针对此问题,重新建模可以加以解决,但是重新建立光谱与浓度之间的模型非常繁琐耗时。此时,模型转移可以在避免重新建模的情况下,通过光谱校正,保证预测精度。在模型转移中,已经建立好模型的光谱称为主光谱(A),不用建立模型,而只用主光谱模型预测的光谱称为从光谱 (B)。模型转移方法的步骤是,先在校正集中选择一些样本作为主光谱的转移集(At),然后选择从光谱中浓度和At相同的光谱,以此作为从光谱的转移集(Bt)。通过AtBt构建模型转移矩阵。最后将需要校正的从光谱(Bv)乘以上述的转移矩阵中,即可获得校正后的从光谱(Bnew)。此时,Bnew就可以用主光谱的模型来直接预测。在模型转移中,转移集样本的选择对模型校正至关重要。目前,转移集的样本通常从光谱之间的距离而非模型转移误差获得。但是,转移误差对模型转移结果的验证至关重要,故该研究出了基于集群分析的集群优化法(ER)并将其用于优化KS方法产生的转移集样本。ER先用随机方法建立转移集的多个子集合,并计算每个子集合的转移误差。然后,对某一个样本,计算包含这个样本的子集合转移误差均值。最后,选择转移误差均值较低的样本作为新转移集样本进行模型转移。以玉米数据测试了ER算法。结果显示,对于典型相关分析-有信息成分提取法(CCA-ICE)、直接校正法(DS)、分段直接校正法(PDS)、光谱空间转化法(SST)这些常见的模型转移方法,相比于KS样本选择方法,ER方法可以找出重要的转移集样本,进而显著降低模型转移误差。  相似文献   

5.
近红外(NIR)光谱一般具有较多的波长变量数,对其直接或间接地进行变量选择是提高模型稳定性能及预测性能的关键。最小角回归(LAR)是一种相对较新和有效的机器学习算法,常用于进行回归分析和变量选择。面向光谱建模应用,提出一种LAR结合遗传偏最小二乘法(GA-PLS)的变量选择方法,可有效筛选出少数特征波长点。首先在全光谱区利用LAR消除变量间的共线性得到初筛波长点,然后用GA-PLS对LAR筛选出的波长点进一步优选从而得到最终建模用的特征波长点。为验证本文方法的有效性,以药片和汽油的近红外光谱回归分析作为应用案例,对原光谱进行预处理后,采用该方法进行变量筛选,然后分别建模其中的活性成分含量和C10含量。结果显示,在这两个应用中,最终优化得到的特征波长点数均只需七个,而两者的预测决定系数R2p分别达到0.933 9和0.951 9,与全光谱、无信息变量消除法(UVE)和连续投影算法(SPA)等方法相比,特征波长点更少,同时R2p和预测均方根误差RMSEP值更优。因此,LAR结合GA-PLS,能有效地从近红外光谱中选择出信息变量从而减少建模波数,提高预测精度,拥有较好的模型解释性。该方法可为特定领域的专用光谱仪设计提供有效的波长筛选工具。  相似文献   

6.
为提高生鲜羊肉储存期内(4,8和20 ℃环境)挥发性盐基氮(TVB-N)的近红外光谱(NIR)检测的稳定性和准确性,选取特征光谱和预测模型是关键步骤。以121个羊肉样品为实验对象,采集生鲜羊肉680~2 600 nm波段的近红外光谱。以多元散射校正(MSC)、标准正态变换(SNV)等散射校正方法,Savitzky-Golay卷积平滑(SGS)、移动平均平滑(MAS)等平滑处理方法,以及归一化(Normalization)、中心化(Centering)、标准化(Autoscaling)等尺度缩放方法分别预处理光谱数据后建立偏最小二乘法(PLS)预测模型。比较发现SGS处理的光谱建模效果最好。利用蒙特卡洛采样(MCS)法及马氏距离法(MD)消除了羊肉光谱的5个异常数据。运用光谱-理化值共生距离(SPXY)算法划分总样本的75%(87个)为校正集样本,剩余29个为验证集样本,利用竞争性自适应重加权法(CARS)、无信息变量消除法(UVE)、改进的无信息变量消除法(IUVE)和连续投影算法(SPA)提取特征光谱得到的波长个数分别为14,713,144和15。将全光谱和4种方法提取的特征波长作为输入变量建立预测模型,CARS提取的波长所建立模型的性能优于UVE、IUVE和SPA提取的波长所建立模型的性能,表明CARS方法可以有效简化输入变量并提高预测模型的性能。改进后得到的IUVE法相比于UVE法,筛选出的波长数更少且模型性能有所提升。以提取的特征波长建立PLS,支持向量机(SVM)和最小二乘支持向量机(LS-SVM)预测模型,SVM模型得到最优的校正集预测结果,其中CARS-SVM预测模型的校正决定系数(R2C)和校正均方根误差(RMSEC)分别为0.939 1和1.426 7,最优的验证集预测效果为LS-SVM预测模型得到,其中IUVE-LS-SVM预测模型的验证决定系数(R2V)和验证均方根误差(RMSEV)分别为0.856 8和1.886 2。基于近红外特征光谱建立简化、优化的生鲜羊肉储存期TVB-N预测模型,为实现快速无损检测生鲜羊肉中的TVB-N浓度提供技术支持。  相似文献   

7.
优化光谱指数的露天煤矿区土壤重金属含量估算   总被引:1,自引:0,他引:1  
光谱学提供了对土壤中许多元素进行定量分析和快速无损检测的方法。可见光和近红外反射光谱(Vis-NIR)为研究土壤重金属污染提供了一个有用的工具。于新疆准东露天煤矿区采集51个0~10 cm深度的土壤样品,在实验室中分别测定样品的有机质(SOM)含量、重金属砷(As)含量与高光谱;使用基于JAVA语言自主开发的两波段组合软件V1.0(No: 2018R11S177501)计算不同高光谱数据变换形式(原始反射率(R),倒数(1/R),对数(lgR)和平方根()下Vis-NIR区域(400~2 400 nm)所有两波段组合得到的优化光谱指数(NPDI)与As的相关性,在最优光谱指数(|r|≥0.73和p=0.001)中通过变量重要性准则(VIP)进一步筛选VIP≥1的指数作为模型自变量,基于地理加权回归(GWR)模型估算As含量并使用四个交叉验证度量标准:相对分析误差(RPD),决定系数(R2),均方根误差(RMSE)和最小信息准则(ACI)评价模型精度,从而探讨优化光谱指数方法应用于高光谱检测露天煤矿区土壤重金属砷含量的可行性。结果表明:(1)研究区As含量离散度较高,所有样品中SOM含量均小于2%,且As含量与SOM含量在0.01的显著性水平上无显著相关性(|r|=0.113)。(2)As含量与单波段光谱反射率的相关性很低(|r|≤0.228),而通过R,1/R,lgR计算的NPDIs与As含量的相关性在近红外(NIR,780~1 100 nm)和短波红外(SWIR,1 100~1 935 nm)光谱中发现最高的相关系数和最低的p值(|r|≥0.73和p=0.001),在长波近红外(LW-NIR)区域基于R形成的NPDIs与As含量相关性最高(|r|=0.74)。(3)VIP方法分别筛选NPDIR(1 417/1 246),NPDI1/R(799/953,825/947)、NPDIsqrt-R(1 023/1 257,1 008/1 249,1 021/1 250,1 020/1 247)和NPDIlgR(801/953,811/953,817/951,825/947,828/945)为GWR模型自变量。(4)从4个预测模型的表现可以看出,Model-a(R)与其他三个模型(Model-b(1/R),Model-c()和Model-d(lgR))相比,它具有最高的验证系数(R2=0.831,RMSE=4.912 μg·g-1,RPD=2.321)和最低的最小信息准则值(AIC=179.96)。优化光谱指数NPDIR(1 417/1 246)有助于快速准确地估算As含量,为进一步获取地表土壤重金属污染分布信息提供理论支持和应用参考,促进露天煤矿区环境污染快速有效调查和生态可持续发展。  相似文献   

8.
在水稻抗倒伏育种中,水稻茎秆纤维素含量作为重要的作物性状表现型数据,用传统方法获取时受人力成本和时间成本的约束,采集群体大小有限。利用高光谱技术能够实现对作物性状信息的快速、无损检测。为探究水稻茎秆纤维素含量近红外光谱反演模型,以田间小区试验的方式,采集水稻灌浆期至成熟期茎秆基部倒2、3节作为实验样本,并在实验室内使用NIRQuest512型号高光谱仪测得茎秆近红外反射光谱数据;采用标准变量正态变换(SNV)、连续小波变换(CWT)及两种方法结合(SNV-CWT)对原始近红外光谱进行预处理,经对比分析,原始光谱经SNV处理后再通过CWT对应6尺度分解最优,然后采用联合区间偏最小二乘法(SiPLS)、迭代保留信息变量法(IRIV)对最优预处理(SNV-CWT)的光谱特征曲线进行光谱特征变量筛选,分别提取了64个和16个特征变量;为优化模型并提高其模型精度,采用IRIV算法对SiPLS所选的特征变量进行二次筛选,得到6个特征变量,特征波长为1 200, 1 207, 1 325, 1 470, 1 482和1 492 nm,最后基于优选出的特征变量分别建立水稻茎秆纤维素含量的支持向量机回归(εSVR)和核极限学习机(KELM)预测模型,模型参数(惩罚系数C,核函数系数γ和不敏感参数ε)分别采用灰狼算法(GWO)、差分进化灰狼算法(DEGWO)和自适应差分进化灰狼算法(SaDEGWO)进行优化选择。结果表明,采用SNV-CWT方法光谱预处理后,经SiPLS-IRIV方法筛选的特征变量构建的SaDEGWO优化的SVR模型精度最高,模型参数,γ,ε分别为302.838 2,0.087 7,0.070 8,测试集的决定性系数(R2p)为0.880,均方根误差(RMSEP)为15.22 mg·g-1,剩余预测残差(RPD)为2.91,表明模型具有较好的预测能力,可为水稻茎秆纤维素含量预测提供参考。  相似文献   

9.
在水果的品质检测和分级分选中,存在不同仪器所建检测模型难以共享的难题。为此,以壶瓶枣为研究对象,利用可见/近红外光谱技术探讨仪器间可溶性固形物含量(SSC)检测模型的传递方法。首先,采用美国ASD(Analytical Spectral Device)公司生产的两台仪器采集样本的光谱信息,采用最小二乘支持向量机(LS-SVM)建立原始光谱、Savitzky-Golay一阶导数处理、标准正态变量变换后的SSC检测模型,预测不同仪器采集的光谱时3种方法的预测能力均较差。预测同一台仪器的光谱时,基于原始光谱的主仪器所建模型最优,预测集的决定系数(R2p)和均方根误差(RMSEP)分别为0.73和1.36%。在此基础上,采用Kennard/Stone算法选取标样,利用专利算法(Shenk’s)、直接标准化(DS)、斜率/偏差算法(S/B)进行模型传递。然后,根据回归系数提取主仪器(24个)和从仪器(28个)的特征波长,优选出单一变量(SV)24个、共性变量(CV)23个、融合变量(FV)29个,均涵盖了SSC的主要吸收谱带。利用优选的变量分别建立主仪器的LS-SVM检测模型,采用主仪器的预测结果(R2p=0.78~0.80,RMSEP=1.07%~1.13%)明显好于全波段所建模型,但预测从仪器时RMSEP为6.62%~7.88%,模型失效。最后,基于波长位置偏移和分子振动的吸收特性提出了共性变量优选结合差值补正(CV-MC)、单一变量优选结合差值补正、融合变量优选结合差值补正、共性变量优选结合波长补正算法(CV-WC)进行模型传递,并与SV-Shenk’s,CV-Shenk’s,FV-Shenk’s,SV-DS,CV-DS,FV-DS,SV-S/B,CV-S/B和FV-S/B进行对比分析。结果表明,基于全波段进行模型传递时,预测结果均较差(R2p=0.03~0.34,RMSEP=2.44%~4.67%);基于优选变量所建模型经SV-Shenk’s,CV-Shenk’s,FV-Shenk’s传递后的结果较差,经其他算法传递后的结果(R2p=0.47~0.73,RMSEP=1.30%~1.90%)好于全波段;基于共性变量传递后的结果好于单一变量和融合变量,CV-MC结果最佳(R2p=0.73,RMSEP=1.30%),CV-WC传递后的预测结果(RMSEP=1.62%)与CV-DS和CV-S/B相近。研究表明,CV-MC和CV-WC均是一种有效模型传递算法,对建立不同仪器间通用的鲜枣品质检测模型具有重要意义。  相似文献   

10.
化学需氧量(COD)是反映水体受有机物污染程度的重要指标。紫外吸收光谱法是目前水体COD检测研究中应用最为广泛的方法,具有样品无需预处理,成本低,无污染,测定速度快等优点。但是,原始光谱数据维数高,光谱信息中包含大量冗余变量,直接将全光谱数据进行建模存在精度低,计算复杂等问题。针对紫外吸收光谱全光谱建模精度低,光谱数据存在大量共线性的问题,提出了一种基于粒子群算法(PSO)结合偏最小二乘(PLS)优选特征波长建立预测模型的方法,以提高紫外吸收光谱预测模型的精度和适用性,简化模型。利用搭建的紫外吸收光谱装置,采集29份不同浓度的COD标准溶液的紫外光谱数据,每份标准溶液采集5次取平均值并对其进行平滑处理,减少仪器和环境带来的误差。考虑到标准溶液在200~310 nm的光谱范围内存在吸收,故选取该波段范围内246个波长点作为建模数据,每个波长点下的吸光度数据作为一个粒子并按照顺序编号,以PLS为建模方法,相关系数r和均方根误差(RMSE)为评价指标,设置粒子群算法适应度函数f(x)=min(RMSE),取粒子初始种群数为20个,惯性权重w=0.6,自我学习因子c1=1.6,群体学习因子c2=1.6,最大迭代次数为200次,算法终止条件为达到最大迭代次数。算法输出全局最优变量取值为168,94,181,183,175,209,106和142。采用粒子群算法优选的8个波长点建立PLS预测模型的相关系数r和预测均方根误差RMSE分别为0.999 98和0.155 1。为了验证PSO-PLS建立的预测模型效果,建立了PLS,iPLS和SVR三种预测模型进行对比。验证结果表明,PSO-PLS模型的相关系数r和均方根误差RMSE均优于其他三种预测模型,说明粒子群算法能有效的提取用于PLS建模的特征波长,消除子区间变量的共线性,提高预测模型的精度。该方法为实现水体COD实时在线监测提供了一种有效途径。  相似文献   

11.
In order to improve prediction accuracy of calibration in human blood glucose noninvasive measurement using near infrared (NIR) spectroscopy, a modified uninformative variable elimination (mUVE) method combined with kernel partial least squares (KPLS), named as mUVE–KPLS, is proposed as an alternative nonlinear modeling strategy. Under the mUVE method, high-frequency noise and matrix background can be eliminated simultaneously, which provide a optimized data for calibration in sequence; under the kernel trick, a nonlinear relationship of response variable and predictor variables is constructed, which is different with PLS that is a complex model and inappropriate to describe the underlying data structure with significant nonlinear characteristics. Two NIR spectra data of basic research experiments (simulated physiological solution samples experiment in vitro and human noninvasive measurement experiment in vivo) are introduced to evaluate the performance of the proposed method. The results indicate that, after elimination high-frequency noise and matrix background from optical absorption of water in NIR region, a high-quality spectra data is employed in calibration; and under the selection of kernel function and kernel parameter, the best prediction accuracy can be got by KPLS with Gaussian kernel compared with Spline-PLS and PLS. It is encouraging that mUVE–KPLS is a promising nonlinear calibration strategy with higher prediction accuracy for blood glucose noninvasive measurement using NIR spectroscopy.  相似文献   

12.
甲醇汽油是一种用以替代传统汽油的新型燃料,其品质受到甲醇含量的严重影响。因此,甲醇汽油中甲醇含量的快速分析对其品质把控具有深远意义。基于拉曼光谱(Raman)结合偏最小二乘(PLS)建立了一种甲醇汽油中甲醇含量快速定量分析方法。采用激光拉曼光谱仪对49组甲醇汽油样品的Raman光谱进行采集,并进行光谱解析。比较了五种光谱预处理方法对甲醇汽油原始Raman光谱的预处理效果,并采用变量重要性投影(VIP)对小波变换(WT)预处理后的甲醇汽油Raman光谱数据进行了特征变量提取。其次,采用五折交叉验证(5-flod cross-validation (CV))对PLS校正模型的潜变量数目(LVs)及VIP阈值进行优化。在最优输入变量和模型参数下,分别构建了基于不同输入变量的PLS模型。研究表明,相较于原始光谱-偏最小二乘模型(RAW-PLS)和小波变换-偏最小二乘模型(WT-PLS),变量重要性投影-偏最小二乘模型(VIP-PLS)可以获得更好的分析性能,其预测集决定系数(R2p)为0.960 4,均方根误差(RMSEP)为0.0341。因此,Raman光谱结合PLS是一种快速准确的甲醇汽油中甲醇含量分析方法。  相似文献   

13.
提出了一种基于稳定竞争自适应重加权采样(stability competitive adaptive reweighted sampling,SCARS)的无标模型传递方法。利用有用信息标准即稳定度指数(定义为回归系数除以其标准偏差的绝对值)和传递后的预测均方根误差(root mean squared error of prediction,RMSEP),选择重要的、受测样参数影响不敏感的波长变量,能够消除或减少不同仪器或测量条件对样本信息反应差异,提高模型传递效果。此外,在该方法中,光谱变量被压缩、降维,从而使模型传递更稳定。采用该方法对谷物的近红外光谱分析模型在不同仪器之间进行传递研究。结果表明,该方法能消除仪器间的大部分差异,较好地实现模型传递效果。与正交信号校正法(orthogonal signal correction,OSC)、蒙特卡罗结合无用信息变量消除法(Monte Carlo uninformative variable elimination,MCUVE)、竞争自适应重加权采样法(competitive adaptive reweighted sampling,CARS)的比较表明,SCARS不仅在传递精度上能取得比OSC、MCUVE及CARS更好的效果,而且能有效地对光谱数据进行压缩,简化并优化传递过程。  相似文献   

14.
可溶性固形物(SSC)是脐橙重要内部品质之一。采用QualitySpec型光谱仪在350~1000 nm波段范围采集脐橙的可见/近红外漫透射光谱,采用CARS(competitive adaptive reweighted sampling)变量选择方法筛选出与脐橙SSC相关的重要变量,并与无信息变量消除(UVE)及连续投影算法(SPA)比较。最后,对选择的38个重要波长变量应用偏最小二乘(PLS)回归建立脐橙SSC预测模型,并对未参与建模的75个样品进行预测。研究结果表明,CARS方法优于UVE及SPA变量选择方法,能有效地筛选出重要波长变量。CARS-PLS建立的SSC预测模型优于全光谱的PLS模型,其校正集及预测集的相关系数分别为0.948和0.917,均方根误差分别为0.347%和0.394%。因此,可见/近红外漫透射光谱结合CARS方法可以预测脐橙可溶性固形物,CARS变量选择方法能有效简化预测模型和提高模型的预测精度。  相似文献   

15.
利用反向区间偏最小二乘法(BiPLS)定位光谱糖度若干信息区间,运用遗传算法(GA)从中选择波长点,建立了多元线性回归(MLR)模型。光谱进行卷积平滑和二阶导数处理后,将光谱(225个数据点)分割成25个子区间时,BiPLS优化结果最优。在所定位的信息区间进行GA二次选择特征变量,运行100次依次选择入选频率较高的12个波长点。为简化MLR模型,对于入选的相邻波长选择频率较高者,最后选择 638,734,752,868,910,916和938 nm作为回归变量,建立的MLR预测模型相关系数(R2)、校正均方根误差(RMSEC)和预测均方根误差(RMSEP)分别为0.984,0.364和0.471,优于常用的逐步多元线性回归的建模结果。表明BiPLS结合GA可以有效地对李子糖度可见/近红外光谱MLR回归变量进行筛选,提高了模型的精度。  相似文献   

16.
莠去津是一种广泛使用的除草剂,我国是其原药的主要生产国家。为加强工作场所莠去津暴露浓度的检测力度,保障职业接触工人身体健康,研究开发工作场所莠去津浓度的现场快速检测方法具有重要现实意义。利用自行组装的便携式近红外光谱仪,采集了实验室配置的浓度为10~1 000 mg·L-1的莠去津溶液样本光谱,并比较了多元散射校正、变量标准化、一阶导数方法、二阶导数方法及其组合等光谱预处理方法,竞争自适应重加权采样变量选择法和遗传算法等变量选择方法,偏最小二乘算法和支持向量机等回归方法对近红外光谱模型分析精度的影响。研究发现一阶导数是最佳光谱预处理方法;遗传算法优选的光谱变量表现优于竞争自适应重加权采样变量选择法;支持向量机模型表现优于偏最小二乘模型。基于遗传算法选择的16个光谱变量建立的支持向量机模型分析精度最高,其定标决定系数、验证决定系数、定标均方差、预测均方差和相对分析误差(成分浓度的标准偏差与预测均方差的比值)分别为1,0.99,17.54 mg·L-1,25.42 mg·L-1和11.43,有望应用于工作场所莠去津浓度的实际检测中。该研究探讨了近红外光谱法检测工作场所莠去津浓度的可行性,相关结果对于未来类似工作的开展具有重要参考价值。  相似文献   

17.
当近红外光谱信息远大于样本量时,对光谱信息进行自动变量选择进而建立光谱与样品含量的稀疏线性模型重要且具有挑战性。利用近红外光谱,将变量选择方法Elastic Net用于聚苯醚生产过程中微量成分邻甲酚的测量,建立近红外光谱与邻甲酚含量之间的定量校正模型,并将其模型预测效果与Lasso方法进行对比。在变量数目远远大于样本量的情形下,Lasso方法虽可实现变量选择,但由于对系数的过度压缩,使得模型的预测精度受到影响,而Elastic Net通过增加L2惩罚项避免了过多删失数据,可以提高模型预测精度。为了验证Elastic Net方法的模型性能指标,用复相关系数R2和调整的复相关系数R2a来评价模型的可解释性,利用平均相对预测误差MRPE(mean relative prediction error)和预测相关系数Rp来评价模型的预测精度。Lasso方法建立的模型性能指标为:R2=0.94,R2a=0.93,MRPE=4.51%,Rp=0.96;Elastic Net方法的性能指标为:R2=0.97,R2a=1,MRPE=3.25%,Rp=0.98。结果表明,Elastic Net所建立模型的性能指标优于Lasso方法,可以得到可解释性较强和预测精度较高的稀疏线性模型。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号