首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 328 毫秒
1.
光谱分析是化学计量学的一个重要应用方向,并已被广泛应用到各个领域,其中光谱变量选择又是光谱分析的重要环节。研究不同的变量选择方法客观地识别有用的信息变量和消除无关或干扰变量十分关键。提出了一种新的变量选择方法,命名选择比率的竞争性群体分析法(SRCMPA)。该算法采用选择比率,自适应加权采样和模型群体分析的思想,并结合了变量排列和指数递减函数方法。关键波长定义为多元线性回归模型中得分值较大的波长,将线性模型PLS下的选择比率的得分值作为评价各波长重要性的指标,然后,根据每个波长的重要性, SRCMPA依次从蒙特卡罗采样中选择N个波长子集,以迭代和竞争的方式运行。在每一次采样运行中,以固定比率的样品以建立校准的PLS模型并计算每个变量的选择比率值,基于排序选择比率的得分值和作为权重的归一化的SR(选择比率)得分值,采用指数递减函数的强制选择和自适应加权采样竞争选择的两步过程来选择关键变量。最后,应用交叉验证(CV)方法来选择具有最低交叉验证均方根(RMSECV)的子集作为最优子集。该算法已在小麦蛋白数据集和啤酒数据集上进行了测试,并使用三种高效算法作对比。通过对实验结果来评估算法优越性,该算法能够找到数据集的关键波长变量的最佳组合,并能用于解释感兴趣的化学特性,通过建模后的评价结果也是最佳的。该算法在啤酒光谱数据集的运行结果,相较于啤酒数据集的全光谱PLS模型,变量个数由567个减少到42个左右。并且模型的RMSECV由0.622下降到0.115, RMSEP由0.823减少到了0.263左右,预测精度分别提高了81.5%和68.1%。Q2_CV和Q2_test也分别由0.940, 0.852提高到了0.994和0.995。在小麦蛋白数据集的运行结果,相较于于小麦蛋白光谱数据集的全光谱PLS模型,变量个数由175个减少到18个左右。并且模型的RMSECV由0.607下降到0.292, RMSEP由0.519减少到了0.234左右,预测精度分别提高了51.9%和54.9%。Q2_CV和Q2_test也分别由0.748, 0.774提高到了0.931和0.839。  相似文献   

2.
一种基于SCARS策略的近红外特征波长选择方法及其应用   总被引:4,自引:0,他引:4  
针对近红外光谱数据的内在特点,提出了一种基于稳定性竞争自适应重加权采样(stability competitive adaptive reweighted sampling, SCARS)策略的近红外特征波长优选方法。该方法以PLS模型回归系数的稳定性作为变量选择的依据,其过程包含多次循环迭代,每次循环均首先计算相应变量的稳定性,而后通过强制变量筛选以及自适应重加权采样技术(ARS)进行变量筛选;最后对每次循环后所得变量子集建立PLS模型并计算交互验证均方根误差(RMSECV),将RMSECV值最小的集合作为最优变量子集。利用饲料蛋白固态发酵过程近红外光谱数据集对所提方法进行了验证,并与基于PLS的蒙特卡罗无信息变量消除法(MC-UVE)和竞争自适应重加权采样(CARS)方法所得结果进行了比较。试验结果显示: 建立在SCARS方法优选的21个特征波长变量基础上的PLS模型预测效果更好,其预测均方根误差(RMSEP)和相关系数(Rp)分别为0.054 3和0.990 8;该优选策略能有效地增强固态发酵光谱数据特征波长变量选择的准确性和稳定性,提高了模型的预测精度,具有一定的应用价值。  相似文献   

3.
X射线荧光光谱分析作为一种以化学计量学为基础的定量分析技术,所建立模型优劣对结果的预测准确性显得十分重要。竞争性自适应重加权算法(CARS)采用自适应重加权采样技术,利用交互验证选出互验证均方根误差(RMSECV)值最低原则,寻出最优变量组合。为了进一步提高PLS模型的解释和预测能力,将竞争性自适应重加权算法(CARS)与X射线荧光光谱分析技术相结合,对土壤中重金属元素铅和砷进行特征波长变量筛选后建立偏最小二乘(PLS)模型。首先,利用CARS算法对铅含量密切相关的波长变量进行筛选,当采样次数为26次时,筛选出60个有效波长点;对砷含量密切相关的波长变量进行筛选,当采样次数为34次时,筛选出19个有效波长点;然后对优选出的波长点利用PLS方法分别建立土壤中铅和砷含量定量分析模型,并与经连续投影算法(SPA)及蒙特卡罗无信息变量消除(MC-UVE)方法波长变量筛选后所建立的PLS模型进行比较。结果显示:铅的CARS-PLS模型的预测集决定系数(R2)、交互验证均方根误差(RMSECV)、预测均方根误差(RMSEP)和相对预测误差(RPD)分别为0.995 5,2.598 6,3.228和9.401 1,砷的CARS-PLS模型的预测集R2,RMSECV,RMSEP和RPD分别为0.989 9,3.013 2,2.737 1和8.211 6;两元素的CARS-PLS模型性能均优于全波段PLS,SPA-PLS和MC-UVE-PLS模型。基于CARS-PLS的算法可以有效筛选出X射线荧光光谱特征波长点,在简化了建模复杂程度的同时,提高了模型的准确性和稳健性。  相似文献   

4.
为了探究反射光谱检测水体中毒死蜱农药的可行性,使用由ASD公司的FieldSpecPro地物波谱仪构成的高光谱采集系统在室内、室外环境获取两种不同浓度区间的毒死蜱样品的光谱数据。基于偏最小二乘(PLS)和主成分分析(PCA)算法分别对毒死蜱样品光谱数据建立全波段定量模型,结果两种模型的预测能力均较高。通过相关性分析(CA)计算相关系数来选择毒死蜱样品光谱的特征波长,其中浓度区间为5~75 mg·L-1的室内、室外实验光谱的特征波长为388,1 080,1 276 nm和356,1 322,1 693 nm,浓度区间为0.1~100 mg·L-1的室内外实验样品光谱的特征波长为367,1 070,1 276,1 708 nm和383,1 081,1 250,1 663 nm。结合PLS算法建立样品特征波长光谱数据的定量模型,结果与全波段模型相比,浓度区间为5~75 mg·L-1的室内外实验光谱PLS特征波长模型的校正集决定系数R2C分别提高至0.987 5和0.999 2,预测集决定系数R2P分别提高至0.989 4和0.994 4,校正集均方根误差RMSEC分别降低为2.841和0.714,预测集均方根误差RMSEP分别降低为1.715和1.244;浓度区间为0.1~100 mg·L-1的室内外实验光谱特征波长PLS模型的校正集决定系数R2C分别提高至0.998 3和0.998 8,预测集决定系数R2P分别提高至0.998 4和0.999 0,校正集均方根误差RMSEC分别降低为1.383和1.186,预测集均方根误差RMSEP分别降低为1.510和1.229,验证集标准差与预测均方根误差的比值(RPD)有所增加,尤其是针对浓度区间为0.1~100 mg·L-1的实验,RPD值显著增加至21.7,说明基于特征波长建立的毒死蜱样品定量模型具有较高精度的预测能力,但是通过不同浓度区间范围的对比实验发现,ASD地物光谱仪对低浓度的毒死蜱溶液预测的相对误差偏大,存在客观上的检测下限。为了保证不同试验条件下的毒死蜱农药的特征波长都得到分析,增强模型使用的普适性与鲁棒性,根据特征波长选择出4个波段,即351~393,1 065~1 086,1 245~1 281和1 658~1 713 nm作为特征波段。特征波段模型的波长变量个数共38个,相比于全波段模型的432个波长变量,模型变量精简了91.2%,其中浓度区间为5~75 mg·L-1的室内外实验光谱PLS特征波段模型的R2C分别为0.993 7和0.987 8,R2P分别为0.979 8和0.998 2,RMSEC分别为1.690和2.516,RMSEP分别为1.987和0.659;浓度区间为0.1~100 mg·L-1的室内外实验光谱特征波段PLS模型的R2C分别为0.9882和0.9807,R2P分别为0.9391和0.9936,RMSEC分别为3.345和3.942,RMSEP分别为8.996和2.663,且四种实验情况下的模型RPD值均大于2.5,满足定量分析条件。因此采用高光谱采集系统对室内和室外环境中毒死蜱农药的快速检测具有一定的可行性,此研究结果对有机磷农药等面源污染物快速检测有实际的应用价值,可为农田水体有机磷农药快速检测仪器的开发提供理论基础。  相似文献   

5.
饲料中粗脂肪和粗纤维含量的近红外光谱快速分析   总被引:1,自引:0,他引:1  
采用近红外光谱(NIRS)结合偏最小二乘(PLS)方法,实现对饲料中粗脂肪和粗纤维的快速定量分析。采用Norris-Williams平滑求导(NW)和多元散射校正(MSC)方法对光谱进行预处理;蒙特卡罗无信息变量消除法(MCUVE)、变量组合集群分析法(VCPA)和区间变量迭代空间收缩法(iVISSA)用于光谱变量选择和优化; PLS用于光谱校正模型的建立,采用校正集相关系数(R_c)、交互验证均方根误差(RMSECV)、预测集相关系数(R_p)和预测集均方根误差(RMSEP)评价模型。光谱预处理中经MSC处理后的光谱模型优于其他预处理方法,其RMSECV和RMSEP值都减小,R_c和R_p值都增大。脂肪定量分析中,原始光谱模型的RMSECV和R_c为0.21和0.87, RMSEP和R_p为0.20和0.88,变量数(V_n)为1 501;经MCUVE方法选择变量后建立的定量模型,其RMSECV和R_c为0.17和0.92, RMSEP和R_p为0.19和0.89,V_n为400个;经VCPA选择变量建立PLS定量模型,其RMSECV和R_c为0.21和0.87, RMSEP和R_p为0.25和0.81,V_n为12;经iVISSA选择变量后的模型,其RMSECV和R_c为0.21和0.86, RMSEP和R_p为0.20和0.87,V_n为20。粗纤维定量分析中,原始模型的RMSECV和R_c为0.28和0.91, RMSEP和R_p为0.25和0.95,V_n为1 501;经MCUVE选择后的模型,其RMSECV和R_c为0.23和0.95, RMSEP和R_p为0.23和0.94,V_n为740;经VCPA选择变量后的模型,其RMSECV和R_c为0.27和0.91, RMSEP和R_p为0.30和0.91,V_n为11;经iVISSA选择后变量的模型,其RMSECV和R_c为0.29和0.90, RMSEP和R_p为0.27和0.93,V_n为20。结果表明, MSC方法可以有效提高光谱质量,消除光谱平移误差; MCUVE变量选择方法可以简化模型提高模型精度和稳定性,建立最优模型。在粗脂肪的定量分析模型中, MSC处理后的光谱经过MCUVE选择后剩余400个变量,R_c和R_p相较于全谱模型提高了0.05和0.01, RMSECV和RMSEP分别降低到了0.17和0.19;经VCPA和iVISSA选择变量的模型其结果与全谱模型相似,但其变量分别只有12和20个。在粗纤维模型中,经MCUVE选择后740个变量用于建立PLS模型,其R_c和R_p为0.95和0.94, RMSECV和RMSEP分别为0.23和0.23; VCPA和iVISSA分别运用11和12个变量建立回归模型,但结果都比MCUVE模型差。利用饲料近红外光谱建立MSC-MCUVE-PLS模型可以有效对饲料粗脂肪和粗纤维进行定量分析。  相似文献   

6.
近红外高光谱图像结合CARS算法对鸭梨SSC含量定量测定   总被引:3,自引:0,他引:3  
高光谱数据量大、 维数高且原始光谱噪声明显、 散射严重等特征导致光谱建模时关键波长变量提取困难。 基于此,提出采用竞争性自适应重加权算法(CARS)对近红外高光谱数据进行关键变量选择。 鸭梨作为研究对象。 采用决定系数r2、 预测均方根误差RMSEP和验证集标准偏差和预测集标准偏差的比值RPD值进行模型性能评估。 基于选择的关键变量建立PLS模型(CARS-PLS)与全光谱变量建立的PLS模型进行比较发现CARS-PLS模型仅仅使用原始变量中15.6%的信息获得了比全变量PLS模型更好的鸭梨SSC含量预测结果,r2pre,RMSEP和RPD分别为0.908 2,0.312 0和3.300 5。 进一步与基于蒙特卡罗无信息变量MC-UVE和遗传算法(GA)获得的特征变量建立的PLS模型比较发现,CARS不仅可以去除原始光谱数据中的无信息变量,同时也能够对共线性的变量进行压缩去除,该方法能够有效地用于高光谱数据变量的选择。 结果表明,近红外高光谱技术结合CARS-PLS模型能够用于鸭梨可溶性固形物SSC含量的定量预测。 从而为基于近红外高光谱技术预测水果内部品质的研究提供了参考。  相似文献   

7.
采用颜色、剪切力和K值评价冰鲜与冻融三文鱼的品质,利用高光谱成像技术结合化学计量学方法对三个品质指标进行预测,并讨论了不同波长选择算法所建模型的预测效果。准备不同冻融次数三文鱼样本,进行高光谱数据采集和品质指标真实值的测定。采用六种预处理方法减少光谱数据中暗电流以及噪声的干扰,采用竞争性自适应重加权算法(CARS)、区间变量迭代空间收缩法(iVISSA), iVISSA-CARS筛选出与待测指标相关的变量,通过比较三种波长选择算法筛选的特征变量所建偏最小二乘(PLS)模型的预测结果,优选出三个品质指标最佳的变量选择方法。结果表明1st Der-CARS-PLS模型对颜色中的a*预测效果最好,筛选出的51个变量建立模型的RcRp分别为0.931 6和0.929 7,RMSECV和RMSEP分别为0.716和0.735;2nd Der-CARS-PLS模型对剪切力的预测效果最好,筛选出的61个特征变量建立模型的RcRp分别为0.892 1和0.887 3,RMSECV和RMSEP分别为0.67 N和0.80 N;模型N-CARS-PLS取得了K值最好的预测效果,筛选出的51个特征变量所建模型的Rc,Rp,RMSECV和RMSEP分别为0.951 4, 0.950 0, 1.33, 1.53。说明CARS变量筛选方法能够有效提取与特征指标相关的变量,提高模型的预测性能。除此之外,特征变量筛选联合算法iVISSA-CARS-PLS对三个指标的预测也取得了较好的结果,对三个指标测试集的Rp分别为CARS-PLS预测模型的97.48%,97.02%,98.98%,而所用变量数仅为CARS-PLS的60.78%,62.29%,60.78%,说明变量筛选组合算法极大的减少了建立模型所用的数据量。三个指标的CARS-PLS以及iVISSA-CARS-PLS模型取得的预测效果均高于iVISSA-PLS,说明对于三文鱼三个品质指标的预测,CARS波长点筛选策略优于iVISSA波段选择策略。将优选出来的PLS模型分别用于构建三个品质指标的可视化分布图,清楚的展示了不同冻融次数三个品质指标的大小以及空间分布。因此,高光谱成像技术结合化学计量学方法可以较好的表征三文鱼的品质指标,为三文鱼多品质指标的同时快速检测提供了部分理论参考。  相似文献   

8.
为了提高对蓝莓果渣的开发利用,探索了近红外光谱测定三种蓝莓(北陆、蓝美1号、灿烂)果渣中花色苷含量的可行性。通过DA7200采集三种蓝莓果渣的近红外光谱,利用PCA-MD对北陆、蓝美1号、灿烂果渣分别剔除1, 4和8个异常样本。运用K-S划分样本集得到校正集(686个样本)和验证集(171个样本)。对样本集分别进行归一化、变量标准化(SNV)、多元散射校正(MSC)、 Norris一阶导数(NFD)、 Norris二阶导数(NSD)、 SG卷积一阶导数(SGCFD)、 SG卷积二阶导数(SGCSD)、 Savitzky-Golay(SG)卷积平滑、正交信号校正预处理,并建立相应全谱PLS模型。比较并选择MSC、 SGCSD、 SG卷积平滑、正交信号校正,进行预处理方法顺序组合的比较,结果显示,全谱PLS模型中最优预处理方法为正交信号校正+SGCSD+SG卷积平滑,其R■为0.940 0、R■为0.886 7、 RMSEC为0.722 5、 RMSECV为0.246 2、 RMSEP为1.000 5、 RPD为2.970 8。利用SPA和CARS对预处理过的光谱数据分别进行波长变量的筛选,依次建立PLS回归模型,并定量分析其对蓝莓果渣花色苷的预测能力。在所有预处理方法进行波长变量筛选中, SPA与CARS算法均可以有效地筛选出波长变量,但SPA筛选出的波长变量,无法全部建立PLS回归模型,而CARS算法筛选出的波长变量,均可建立PLS回归模型。数据表明, CARS-PLS最佳组合为正交信号校正+MSC+SG卷积平滑+SGCSD,选择波长数为25个,相较于原始光谱,其R■从0.900 8增长到0.940 3,R■从0.881 8增长到0.885 7, RMSEC从0.929 1减少到0.720 9, RMSECV从0.317 6减少到0.245 6, RMSEP从1.021 8减少到1.004 9, RPD从2.908 8增长到2.957 5。近红外光谱的蓝莓果渣花色苷含量测定中,正交信号校正表现出强大的去噪效果, CARS算法具有简化模型、适用性较好和预测精度较高等优点。研究结果表明,应用近红外光谱技术可以较好地实现三种不同品种蓝莓果渣中花色苷含量的测定,可为蓝莓果渣品质分级提供一种快速、支持大样本量的检测方法。  相似文献   

9.
将经典的卡尔曼滤波器与近红外光谱分析技术相结合,提出了一种新的特征波长变量选择方法——卡尔曼滤波法。分析了卡尔曼滤波器用于波长优选的原理,设计了波长选择算法并将其应用到大豆油脂酸价的近红外光谱检测中。首先利用偏最小二乘法(PLS)对油脂不同吸收波段建模,初步筛选出4 472~5 000 cm-1油脂酸价特征波段共132个波长点,然后进一步利用卡尔曼滤波器进行特征波长选择,从中优选出22个特征波长变量建立PLS校正模型,预测集决定系数R2、预测误差均方根RMSEP分别为0.970 8和0.125 4,与利用132个波长点建立的校正模型预测结果相当,而波长变量数减少到原来的16.67%。该波长变量选择算法是一种确定性的迭代过程,无复杂的参数设置和变量选择的随机性,物理意义明确。优选出少数对模型影响较大的特征波长变量以代替全谱建模,在简化模型的同时提高了模型的稳健性,为开发专用油脂近红外光谱分析仪器提供了重要参考依据。  相似文献   

10.
LSSVM模型下的近红外光谱联合区间波长筛选方法   总被引:2,自引:0,他引:2  
针对传统近红外光谱波长选择方法忽略模型中非线性因素的缺陷,采用具有非线性处理能力的最小二乘支持向量机,结合间隔策略的波长选择方法和联合区间的思想,提出了一种非线性模型下的波长筛选算法—联合区间最小二乘支持向量机(synergy interval least squares support vector machines, siLSSVM)。以苹果糖度近红外光谱数据为例,与传统siPLS波长筛选方法相比,新算法的预测集均方根误差(RMSEP)在PLS模型和LSSVM模型预测时分别提高了37.43%和47.88%,预测集相关系数(RP)在PLS模型和LSSVM模型预测时分别增加了6.04%和7.31%。实例表明,对于存在非线性因素较强的光谱数据,siLSSVM算法能够有效的挑选最优波长区间与提高模型的预测精度和鲁棒性,为近红外光谱在非线性因素下筛选波长提供了新前景。  相似文献   

11.
针对多组分金属离子混合溶液的紫外-可见吸收光谱(UV-Vis)重叠严重、难以分离的问题,提出了一种基于稳定性和可信度偏最小二乘法(SCPLS)的特征波长选择方法。在SCPLS中,引入指数衰减函数(EDF)以迭代的方式对波长变量进行选择。在每次迭代中对蒙特卡罗采样所得到的数据集建模,计算各波长变量的稳定性和可信度指标,并通过EDF选择具有较高稳定性和可信度的变量,选择的变量作为新的变量集进入下一次变量选择迭代。迭代全部完成后,计算每一次迭代所选的变量集建模的交叉验证均方根误差(RMSECV),选择RMSECV最小的变量集作为波长变量选择的结果。利用Zn(Ⅱ), Cu(Ⅱ) 和Co(Ⅱ)混合溶液的紫外-可见光谱数据集和Zn(Ⅱ)和Co(Ⅱ)混合溶液的紫外-可见光谱数据集对所提方法性能进行了验证,并与全波段偏最小二乘、移动窗口偏最小二乘法(MWPLS)、蒙特卡罗无信息变量消除方法 (MC-UVE)、竞争性自适应加权算法 (CARS)和稳定性竞争自适应加权算法(SCARS)进行了比较分析。结果表明:该方法不仅能降低波长选择的复杂度,还能在保证波长选择过程稳定的情况下,选出对模型重要的波长变量,较之其他方法所提出的方法选取的变量建立的模型RMSECV最小,对于Zn(Ⅱ),Cu(Ⅱ) 和Co(Ⅱ)数据集,使用SCPLS方法得到的Zn(Ⅱ),Cu(Ⅱ)和Co(Ⅱ)的RMSECV值分别比全光谱PLS下降60.5%,40.2%和31.8%,与SCARS相比分别下降29.8%,26.1%和0.8%,Zn(Ⅱ),Cu(Ⅱ)和Co(Ⅱ)平均相对误差分别为2.14%,1.25%和0.74%,其中Zn(Ⅱ)的最大相对误差为4.67%,Cu(Ⅱ)的最大相对误差为3.99%,Co(Ⅱ)的最大相对误差为3.12%;对于Zn(Ⅱ)和Co(Ⅱ)数据集,使用SCPLS方法得到的Zn(Ⅱ)和Co(Ⅱ)的RMSECV值分别比全光谱PLS下降39.4%和24.9%,与SCARS相比分别下降35.3%和13.3%,Zn(Ⅱ)和Co(Ⅱ)平均相对误差分别为1.23%,1.10%,其中Zn(Ⅱ)的最大相对误差为4.45%,Co(Ⅱ)的最大相对误差为4.57%,有效提高光谱建模精度。  相似文献   

12.
冬枣品质受其品种和生长环境等因素的影响,引起采后化转红指数不同,导致果实的颜色差异较大,从而影响其可溶性固形物(SSC)检测模型的分析精度。采用可见-近红外(Vis-NIR)光谱结合Norris-Williams平滑(NWS)、连续小波导数(CWD)、多元散射校正(MSC)、标准正态变量变换(SNV)和NWS-MSC五种光谱预处理方法构建不同颜色(红绿相间MJ,绿色GJ和红色RJ)冬枣SSC的偏最小二乘(PLS)定量分析模型,分别采用MJ,GJ,RJ,MJ-GJ和MJ-GJ-RJ五个样品集合建立冬枣SSC的定量分析模型,并采用由MJ-GJ-RJ三种颜色冬枣样品组成的测试集进行模型的评价;以不同建模样品集(校正集)的校正相关系数(Rc)和交互验证均方根误差(RMSECV)作为构建最优模型的评价指标;测试集的预测相关系数(Rp)和预测均方根误差(RMSEP)用于模型预测精度的评价。研究结果表明:分别采用MJ,GJ和RJ的独立样品集进行建模时,模型仅对具有相同颜色的冬枣样品的SSC实现了较好的预测;分别在MJ样品中加入GJ和GJ-RJ样品进行MJ-GJ和MJ-GJ-RJ两个混合样品集的定量模型的构建时,MJ-GJ模型对MJ和GJ样品的SSC具有较好的预测效果,其RMSECV,Rc,RMSEP,Rp分别为1.108,0.698,0.980,0.724和1.108,0.698,0.983,0.822,而对RJ样品的预测误差较大,模型的RMSECV,Rc,RMSEP,Rp为1.108,0.698,1.928,0.597;而MJ-GJ-RJ模型对三种颜色的冬枣SSC均有较好的预测结果:MJ-GJ-RJ模型对MJ样品的SSC模型的RMSECV,Rc,RMSEP,Rp为1.158,0.796,1.077,0.668;对GJ样品的SSC模型的RMSECV,Rc,RMSEP,Rp为1.158,0.796,0.881,0.861;对RJ样品的SSC模型的RMSECV,Rc,RMSEP,Rp为1.158,0.796,1.140,0.841;采用蒙特卡罗无信息变量消除(MCUVE)方法进一步对MJ-GJ-RJ样品集光谱的特征变量进行优选后,模型的RcRp分别由原来的0.796和0.864提高到0.884和0.922,模型的RMSECV和RMSEP分别由1.158和0.946减小到0.886和0.721,模型具有较好的分析精度。采用可见-近红外光谱对不同颜色冬枣的SSC进行分析时,当建模集样品与测试集样品颜色属性相似或选择性质相似的建模变量进行模型构建时,模型具有更好的通用性。  相似文献   

13.
To optimize the accuracy of near-infrared non-invasive hemoglobin (Hb) clinical detection, high-performance instrument and prepossessing algorithm have been investigated. A near-infrared spectrophotometric system was constructed adopting InGaAs detector array with 16 pixels and plane grating spectrometer to obtain high signal noise ratio (SNR) spectral data. In our experiment, we applied the device independently to collect spectra data from 91 volunteers’ fingertips non-invasively. Two prediction tests were conducted to verify the effects of preprocessing algorithms improving the accuracy of near-infrared Hb detection and exclude the occasionality of satisfactory results in a single trial. Our non-invasive Hb detection methods were based on partial least squares (PLS). In each test, PLS, MSC coupled with PLS, DOSC coupled with PLS, three methods for non-invasive Hb detection, were analyzed respectively. The results of two trials showed that only DOSC & PLS performed excellently in both predictive ability and stability, obviously better than other two methods. Relative RMSEP was 6.16% in predicting test 1, 6.08% in predicting test 2, almost reaching the requirements of clinical application. It indicates that our independent-developed high-performance instrument and the method DOSC coupled with PLS are promising in non-invasive Hb detection clinical application.  相似文献   

14.
结球甘蓝是一种富含碳水化合物的常见蔬菜,可溶性糖含量是决定其品质的重要参数。可溶性糖易溶于水,是蔬菜和水果口味的有效调节剂。作为碳水化合物,可溶性糖由三种元素C,H和O组成,其分子吸收光谱主要由被检测材料的分子中C-H,O-H和CO等基团的组合频率吸收和倍频吸收组成,包含丰富的有机物信息。因此,采用近红外光谱和化学计量学方法,探索结球甘蓝可溶性糖含量的快速检测方法。用德国布鲁克公司的MATRIX-Ⅰ型傅里叶变换近红外光谱仪采集161份结球甘蓝样本光谱数据。波数范围:12 800~4 000 cm-1(780~2 500 nm)。蒽酮比色法测量样本的可溶性糖。综合应用马氏距离法(MD)和蒙特卡洛交叉验证法(MCCV)剔除异常样本,采用Kennard-Stone(K-S)法将样本按照给定比例划分为校正集和验证集。分别使用Savitzky-Golay卷积平滑(S-G),一阶导数(FD),二阶导数(SD),多元散射校正(MSC)和变量标准化(SNV)及它们的组合共12种方法对样本进行光谱预处理,获得最佳预处理方法,提高光谱数据的信噪比。采用竞争性自适应重加权采样法(CARS)筛选偏最小二乘回归(PLS)模型中回归系数绝对值大的波数点,去掉回归系数绝对值小的波数点,以有效选择与所测特性值相关的最优波数组合,获得具有良好鲁棒性和强预测能力的校正模型。使用模型决定系数R2、交互验证均方根误差(RMSECV)、预测均方根误差(RMSEP)作为模型精度评价指标。根据蒙特卡洛交叉验证法和马氏距离剔除异常样本的原理,共剔除10个光谱或者化学值异常的样本。最终参与建模分析的样本个数为151。异常样本剔除后,通过K-S法将样本按照3∶1被分成校正集(110个样本)和验证集(41个样本)。使用原始光谱数据,预处理后的光谱数据和对应于优选波数的光谱数据,建立PLS模型。结果表明,利用MSC+FD光谱预处理可以提高建模精度,校正集R2从处理前的0.68增长到0.93,MSC+FD是本研究中理想的光谱数据预处理方法。利用CARS法共优选了84个建模波数。在12 000~10 000 cm-1波数区域内,有O-H键2级和C-H键3级倍频伸缩振动吸收,此区域主要的背景信息为水和其他含氢基团,在此区域内共包含了36个选定的波数。在8 500~6 000 cm-1区域,存在糖类和水的O-H键的1级倍频伸缩振动吸收,葡萄糖的O-H键的1级倍频伸缩振动吸收,该区域是包含反映可溶性糖成分的主要光谱区间,背景影响较小,CARS方法在此区域共选择了15个建模波数。5 800~4 000 cm-1区域与12 000~10 000 cm-1区域相似,包含的选定波数多,CARS方法在此区域选择了33个建模波数。利用CARS对参与建模的波数进行优选,减少了无关信息,降低了模型的复杂度,选择的波数不但引入了表征待测组分的光谱,同时还引入了代表背景信息的光谱,使得校正模型适应性增强。建立了结球甘蓝可溶性糖的全谱PLS模型,根据CARS波数优选结果,建立了结球甘蓝可溶性糖的CARS-PLS模型。对于全谱PLS定量模型,校正集的决定系数R2为0.93,RMSECV为0.157 2%,RMSEP为0.132 8%。对于CARS-PLS模型,校正集的决定系数R2为0.96,RMSECV为0.076 8%,RMSEP为0.059 4%。数据表明,两种模型具有相当的R2,但CARS-PLS模型的RMSECV是全谱PLS模型的1/2。RMSEP也接近1/2,CARS-PLS模型比全谱PLS定量模型所用建模变量少,模型得到简化,精度更优。用CARS-PLS模型对验证集41个样本进行预测,预测集决定系数R2为0.86,预测标准误差为0.059 4%。提供了一种工作效率较高的结球甘蓝质量无损检测方法。  相似文献   

15.
采用偏最小二乘法(PLS)和光谱Savitzky-Golay(SG)平滑方法,建立甘蔗清糖浆锤度近红外光谱分析的优化模型。基于最优单波长模型预测效果划分定标集和预测集。全谱(400—2500nm)经过SG平滑处理后用PLS方法建模。建立计算机算法平台,把483种SG平滑模式和1—40的PLS因子数任意组合分别建立PLS模型,根据预测效果选出最优模型,最优模型的SG平滑模式为二阶导数平滑、4、5次多项式类型、43平滑点数,PLS因子数为13,预测均方根偏差(RMSEP)、相对预测均方根偏差(RRMSEP)和预测相关系数(rP)分别为0.433%、0.69%和0.978。预测精度很高,并且大幅度优于未做SG平滑处理直接PLS建模的预测效果。从而表明,SG平滑模式和PLS因子数的联合大范围筛选能够有效地应用于近红外光谱分析的模型优选。  相似文献   

16.
波长选择是光谱建模分析的重要步骤。研究了近红外光谱法分析油页岩含油率过程中的波长选择方法,用以剔除光谱数据中的冗余信息和干扰信息,提高分析模型的建模效率和预测能力。分别采用相关系数法(CC)、移动窗口偏最小二乘法(MWPLS)和无信息变量消除法(UVE)对油页岩近红外漫反射光谱数据的波长区间进行了选择,研究了不同阈值、窗口宽度和噪声矩阵对上述方法的影响,建立了所选择波长处的反射率数据和样品含油率标准值间的偏最小二乘(PLS)分析模型,比较了上述方法的选择效果。结果表明:与使用全谱数据建模相比,采用上述方法筛选过的光谱数据均能提高模型的建模效率和预测能力,其中经UVE法筛选后的光谱数据仅占全谱数据总数的22.8%,模型的RMSECV却降低了9.3%,RMSEP降低了4.5%。  相似文献   

17.
基于遗传算法的安溪铁观音品质快速评价研究   总被引:2,自引:0,他引:2  
为探究一种快速无损的安溪铁观音品质评价方法,利用遗传算法(GA)对茶样的近红外光谱特征波长进行筛选,结合偏最小二乘(PLS),建立全谱段的PLS定量模型与GA-PLS模型。结果表明,傅里叶变换近红外(FT-NIR)全谱段光谱在经过平滑+二阶导数+归一化处理后,PLS模型预测性能最高,建模结果为:校正集相关系数RC=0.921,校正集均方根误差RMSEC=0.543,验证集相关系数RP=0.913,验证集均方根误差RMSEP=0.665。选用近红外光谱6 670~4 000 cm-1谱区,采用遗传算法进行特征波长筛选,参与建模数据点数从1 557缩减到408个。优选波段后,GA-PLS建模结果为:校正集相关系数RC=0.959,校正集均方根误差RMSEC=0.413,验证集相关系数RP=0.940,验证集均方根误差RMSEP=0.587。可见,GA-PLS模型的校正集和验证集的预测结果均优于全谱段PLS模型。结果说明,在传统的近红外光谱技术结合化学计量学方法的建模基础上,加入遗传算法进行波长筛选,能有效提高模型预测能力,实现方法学的创新研究,且GA-PLS品质评价模型具有较强的参考和推广价值,为提高我国茶叶品质的检测技术水平提供新的方法借鉴。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号