首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 125 毫秒
1.
红参中提取出的有效活性成分人参皂苷含量对后续产品的质量有重要的影响。传统的红参提取质量控制化学检测方法成本高,具有滞后性。已有的研究表明快速无损的近红外检测方法用于红参提取过程具有可行性,但现有方法依赖仪器自带数据处理软件,无法满足生产实际的精度和速度需求。为实现红参提取过程的快速、精确监测,提出将多种智能光谱筛选算法应用在近红外光谱建模中,并对比不同光谱筛选算法的性能和稳健性。以红参提取液中含量高的人参皂苷Rg1和含量较低的人参皂苷Rc为目标,采集了三个不同批次前两次红参提取液样本128份,在线获取1 000~2 499 nm波段近红外原始光谱吸光度数据,并同时采用国标方法高效液相色谱法测定目标人参皂苷含量,首先采用竞争适应性重加权采样法(CARS)、无信息变量消除法(UVE)、随机蛙跳算法(RF)和连续投影算法(SPA)四种波长筛选算法进行波长降维处理,然后使用筛选后的波长建立线性偏最小二乘(PLS)定量模型,并通过模型的均方根误差(RMSE)、决定系数(R2)和预测相对分析误差(RPD)等来评估模型的性能。从四种波长优选算法PLS建模结果可知,经RF优选后,建模特征波长变量下降为原来的0.67%,红参提取液中人参皂苷Rg1和Rc含量的R2都达到了0.94以上, 预测均方误差分别为0.024 6和0.013 5,预测集相对分析误差达到了4.84以上,降低了建模的难度,提高了建模的精度;将RF和CARS在原始光谱、全光谱、SNV预处理后的全光谱上建模对比,RF波长筛选算法建模模型的性能整体较好,不同的光谱范围和预处理方法下性能影响较小,稳健性好。综上表明RF是红参提取液建模相对理想的波长筛选算法,基于RF的PLS算法实现了对红参两次提取液的一次建模,可用于提取液中人参皂苷成分含量的快速检测,为药物的在线提取控制提供理论支撑。  相似文献   

2.
以油砂中钠元素为研究对象,首次应用近红外光谱,结合Lasso(least absolute shrinkage and selection operator)建模方法,建立了油砂金属钠含量的近红外光谱定量校正模型,并与传统的PLS建模方法进行比较。结果表明,两种方法建立的油砂金属钠含量校正模型都具有很高的精度,预测性能方面略有差异。在实验验证集与预测集中,PLS与Lasso算法的相关系数分别是:Rv=0.878 8,Rp=0.857 9和Rv=0.887 4,Rp=0.860 0。实验验证了使用近红外光谱快速测定油砂金属钠含量的有效性,并分析了PLS与Lasso算法的适用范围。  相似文献   

3.
为了克服单一模型预测精度很难进一步提高的不足,利用近红外光谱分析结合基于Stacking框架的异构集成学习模型实现对油页岩含油率的检测。以松辽盆地某区块所取230个油页岩岩芯样本为研究对象,使用低温干馏法测量油页岩样本的含油率,同时扫描每个样本对应的近红外光谱数据。样本使用蒙特卡洛算法进行异常样本剔除,将剔除异常样本后的213个数据按照3∶1的比例随机划分为训练集和预测集。利用去趋势加基线校正方法进行预处理消除光谱数据中噪声和基线漂移,利用随机森林算法进行波长重要性排序并保留重要波长,在此基础上采用CARS算法进行特征波长提取,进一步降低数据维度。最后,构建以PLS, SVM, RF和GBDT为初级学习器,PLS回归模型为次级学习器的Stacking集成学习模型,各初级学习器模型参数使用网格搜索进行寻优。使用决定系数和预测均方根误差作为各模型的评价指标,探究单一模型和集成学习模型对油页岩含油率预测的准确性。研究结果表明,RF-CARS方法能够有效筛选重要波长,进而提高模型效率。基于Stacking的异构集成学习模型与单一模型(SVM和PLS)和同构集成学习模型(RF和GBDT)相比有更...  相似文献   

4.
基于高斯回归分析的水稻氮素敏感波段筛选及含量估算   总被引:1,自引:0,他引:1  
水稻氮素含量的准确监测是稻田精准施肥的重要环节,水稻叶片氮素含量发生变化会引起叶片、冠层的光谱发射率发生变化,高光谱遥感是目前作物氮素无损监测的关键技术之一。以2018年-2019年湖北监利两年水稻氮肥试验为基础,分别获取水稻分蘖期、拔节期、孕穗期、扬花期、灌浆期五个生育期水稻叶片和冠层两个尺度的高光谱反射率数据及对应的叶片氮素含量数据,利用单波段原始光谱和一阶导数光谱的相关性分析、高斯过程回归(GPR)等方法筛选水稻全生育期叶片及冠层尺度氮素敏感波段。针对敏感波段,利用单波段回归分析、随机森林(RF)、支持向量回归(SVR)、高斯过程回归-随机森林(GPR-RF)、高斯过程回归-支持向量回归(GPR-SVR)和GPR构建水稻氮素监测模型,并进行精度对比,以确定水稻叶片在各生育期的氮素估算最佳模型。结果表明:GPR筛选的敏感波段符合水稻氮素含量及光谱变化的规律。相同条件下,叶片模型精度整体高于冠层模型。相关性分析模型中,叶片尺度原始光谱模型更好,冠层尺度刚好相反,冠层一阶导数光谱可以减弱稻田背景噪声的影响。其中,叶片最佳模型建模集R2为0.79,验证集R2为0.84;冠层最佳模型建模集R2为0.80,验证集R2为0.77。与相关性回归分析模型相比,机器学习模型受生育期影响小(R2>0.80,NRMSE<10%)。其中,RF比SVR更适合对GPR敏感波段建模,GPR-RF模型可以用1.5%左右的波段达到RF模型使用全部波段的精度。五种方法中,GPR模型对生育期敏感度最低、叶片及冠层尺度效果都很好(R2>0.94,NRMSE<6%)。且与其他四种机器学习方法相比,GPR模型可有效提高冠层氮素含量估算的精度和稳定性(R2增加0.02,NRMSE降低1.2%)。GPR方法可为筛选作物氮素高光谱敏感波段、反演各生育期叶片及冠层氮素含量提供方法参考。  相似文献   

5.
近年来,深度学习在数据挖掘领域研究较多,深度学习中的集成学习算法也越来越多地应用到分类和定量回归中,但是,集成学习算法在红外光谱分析领域的应用研究较少。提出一种基于Blending模型融合的集成学习定量回归算法,利用GBDT算法、线性核支持向量机(LinearSVM)和径向基核支持向量机(RBF SVM)作为基学习器,将基学习器预测结果通过LinearSVM模型完成数据融合。以公开数据库中的药片和柴油近红外光谱数据为研究对象,首先对光谱数据进行一阶导数预处理,分别采用单核支持向量回归模型、GBDT模型和Blending集成学习模型,将模型预测结果进行分析比较。药片活性物含量和硬度性质采用RBF SVM模型的预测结果最优,RMSEP最小,RPD最大;其次为Blending集成学习模型;GBDT模型预测结果最差。药片质量采用Blending集成学习模型预测的R2最高,达到0.837 4;RBF SVM的RMSEP最小,为2.140 6,RPD最大,达到7.487 8;LinearSVM的预测结果最差。对于柴油沸点、闪点和总芳香烃三种性质,Blending模型预测效果最好,优于三种单模型预测结果。对于十六烷值,GBDT模型和RBF SVM模型预测结果优于Blending集成学习模型。对于密度,仅GBDT模型优于Blending集成模型,并且,使用单模型和集成模型的预测结果均较为理想,除了LinearSVM模型R2为0.944 5,其他模型R2均高于0.99。对于冰点的预测,RBF SVM和LinearSVM的预测效果优于Blending集成学习模型。对于黏性性质的预测,仅RBF SVM的预测效果优于Blending集成算法模型。由结果可以看出,由GBDT,LinearSVM和RBF SVM集成的Blending模型由于融合了单模型的特征,与单模型相比,预测效果较优或者最优,证明集成学习Blending模型用于红外光谱定量回归具有较强的适用性,且具有较高的预测精度和泛化能力,对于进一步研究集成学习算法在红外光谱定量回归中的应用具有重要的意义。  相似文献   

6.
采用近红外(NIR)漫反射光谱法对新疆特色梨果库尔勒香梨的五种不同果(包括青头、粗皮、脱萼、宿萼、突顶果)的硬度进行测定。由于近红外光谱数据量大且原始光谱噪声明显、测定水果时散射严重等导致光谱建模时关键波长变量提取困难。以新疆库尔勒香梨为研究对象,为了有效地消除固体表面散射以及光程变化对NIR漫反射光谱的影响,首先采用标准正态变量变换(SNV)和多元散射校正(MSC)对库尔勒香梨的原始光谱进行预处理。为寻找适合近红外光谱检测库尔勒香梨硬度的最佳特征波长筛选方法,进行香梨近红外光谱的特征波长变量选择方法的比较与研究。研究比较了两种特征波长筛选方法对库尔勒香梨硬度偏最小二乘法(PLS)建模精度的影响。同时使用反向偏最小二乘(BiPLS)和遗传算法结合反向偏最小二乘(BiPLS-GA)在全光谱范围内筛选香梨硬度的特征波长变量,将校正均方根误差(RESMC)、预测均方根误差(RESMP)以及决定系数(R2)作为模型的评价标准,并最终确定最优波段选择方法及最佳预测模型。基于选择的特征波长变量建立的PLS模型(BiPLS-GA)与全光谱变量建立的PLS模型进行比较发现BiPLS-GA模型仅仅使用原始变量中6.6%的信息就获得了比全变量PLS模型更好的库尔勒香梨硬度的预测结果,其中R2,RMSEC和RMSEP分别为0.91,1.03和1.01。进一步与基于反向偏最小二乘算法(BiPLS)获得的特征变量建立的PLS模型比较发现,BiPLS-GA不仅可以去除原始光谱数据中的无信息变量,同时也能够对共线性的变量进行压缩去除,使得建模变量从301个减少到20个。极大地简化模型的同时有效地提高了模型的预测精准度和稳定性。因此该方法能够有效地用于近红外光谱数据变量的选择。证明了近红外光谱分析技术结合BiPLS-GA模型能够高效地选择出建模变量,去除与库尔勒香梨硬度无关的近红外光谱信息,显著地提高库尔勒香梨硬度定量模型的预测精度。这不仅为新疆地区特色梨果库尔勒香梨的快速、精确、无损优选分级提供一定的技术支持,同时也为基于近红外光谱分析技术预测水果内部品质的研究提供了参考。  相似文献   

7.
基于遗传算法的安溪铁观音品质快速评价研究   总被引:2,自引:0,他引:2  
为探究一种快速无损的安溪铁观音品质评价方法,利用遗传算法(GA)对茶样的近红外光谱特征波长进行筛选,结合偏最小二乘(PLS),建立全谱段的PLS定量模型与GA-PLS模型。结果表明,傅里叶变换近红外(FT-NIR)全谱段光谱在经过平滑+二阶导数+归一化处理后,PLS模型预测性能最高,建模结果为:校正集相关系数RC=0.921,校正集均方根误差RMSEC=0.543,验证集相关系数RP=0.913,验证集均方根误差RMSEP=0.665。选用近红外光谱6 670~4 000 cm-1谱区,采用遗传算法进行特征波长筛选,参与建模数据点数从1 557缩减到408个。优选波段后,GA-PLS建模结果为:校正集相关系数RC=0.959,校正集均方根误差RMSEC=0.413,验证集相关系数RP=0.940,验证集均方根误差RMSEP=0.587。可见,GA-PLS模型的校正集和验证集的预测结果均优于全谱段PLS模型。结果说明,在传统的近红外光谱技术结合化学计量学方法的建模基础上,加入遗传算法进行波长筛选,能有效提高模型预测能力,实现方法学的创新研究,且GA-PLS品质评价模型具有较强的参考和推广价值,为提高我国茶叶品质的检测技术水平提供新的方法借鉴。  相似文献   

8.
水体COD的光谱学传感技术是现代环境监测的一个重要发展方向, 与传统的分析方法相比,光谱分析技术更具有可连续监测、可在线监测和检测快速的明显优势,适合对环境水样COD的定点实时监测。分别获取水样的紫外吸收光谱和近红外光谱,通过不同的光谱预处理方法结合偏最小二乘法、多元线性回归法建立水样的COD定量预测模型,对水体COD的紫外和近红外光谱的定量预测及相关模型参数进行分析,发现用S-G平滑处理后的紫外光谱和近红外光谱建立的PLS模型均得到最佳预测效果,预测集R2分别为0.992 1和0.987 7,RMSEP分别为10.438 6和5.972 0。紫外和近红外光谱法的MLR模型预测效果较差,预测集R2分别为0.928 0和0.957 3。通过实验结果综合对比分析,紫外吸收光谱在280~310 nm谱区建模预测性能较好,近红外光谱在7 250~6 870 cm-1谱区建模预测性能较好,紫外光谱对应定量预测模型的决定系数较高,而近红外光谱的稳定性和重复性更好。研究表明光谱传感技术可用于环境实际水体COD的定量预测分析,为开发便携式水体检测设备奠定了理论基础。  相似文献   

9.
利用近红外光谱对核桃露中的重要指标脂肪含量进行定量分析,同时进行建模变量优化、建模方法比较以优选最佳模型。为消除散射对光谱造成的影响,采用标准正态变换(SNV)方法对数据进行预处理,采用遗传算法(GA)结合向后间隔偏最小二乘法(BiPLS)优选的特征波长分别作为偏最小二乘法(PLS)及最小二乘支持向量机(LS-SVM)的输入变量,建立核桃露中脂肪含量的近红外定量模型,采用决定系数(R2)、预测标准偏差(RMSEP)以及性能偏差比(RPD)对各模型进行评价,探究光谱波段选择方法对于核桃露中脂肪指标模型构建的影响,同时确定最佳建模方法。结果表明:进行变量筛选能够对模型起到优化作用,BiPLS及GA-BiPLS方法分别选择了150及30个变量点,占全光谱的10%及2%,对应了核桃露样品中脂肪成分的特征吸收峰,使得PLS模型的RMSEP值从0.049分别下降到0.043和0.040,同时模型的相关系数R2从0.964提高到0.973及0.974,性能偏差比RPD从4.88增长到5.62及6.00,主成分数也有不同程度的减少,降低模型复杂程度的同时提高了模型准确性。相比于PLS模型,核桃露脂肪指标的LS-SVM模型的R2,RMSEP及RPD值均表现出了更好的效果,分别达到0.986,0.036及6.52。说明基于最小二乘支持向量机建立的分析模型有较高的准确度及稳定性,可能是由于PLS作为一种经典的线性建模方法,在建立模型的过程中忽略了样品数据集中的非线性因素,而核桃露样品光谱测量过程中噪声、背景等因素的干扰,以及各指标成分间的相互影响,使得脂肪含量与近红外光谱信息间存在复杂非线性的变化关系,LS-SVM方法能够更为有效地对其进行描述,增强了光谱变量与指标浓度间的相关性,使得建立的模型有着更好的准确度以及普适性,说明了在实际生产中,LS-SVM方法具备优良的可行性,体现了其在核桃露饮品品质分析方面的巨大潜力。基于最小二乘支持向量机方法所建立的核桃露脂肪含量的定量分析模型,具有准确、稳定的特点,能够为核桃露生产的质量监控提供技术借鉴,同时为饮品品质的分析方法研究提供了新的思路。  相似文献   

10.
针对油脂脱臭过程中的反式脂肪酸(TFAs)含量控制问题,提出一种基于近红外光谱分析的油脂中TFAs含量快速检测方法。制备含不同TFAs的大豆油脂样本100个,利用气相色谱(GC)法精确测定其TFAs含量,扫描样本近红外光谱,然后利用不同方法对光谱数据进行降噪处理,发现多元散射校正的去噪效果最佳。为了探讨TFAs在近红外区域的吸收特性,采用多种iPLS方法对比分析,筛选出7 258~7 443/6 502~6 691/6 120~6 309 cm-1 TFAs的特征波段,再利用Kalman滤波算法进行特征波长变量的选择,优选出27个TFAs的特征波长变量;采用深度信念网络(DBN)建立校正模型,通过多次对比发现,当隐含层层数为3并且隐含层节点数为50-35-90时,DBN模型性能最佳。最后将DBN模型与PLS方法建立的反式脂肪酸含量回归模型进行对比分析,结果表明:对降噪后的全谱进行建模,DBN模型的预测效果优于PLS,DBN模型预测集R2为0.879 4、RMSEP为0.060 3、RSD为2.18%;对筛选出的特征波段建模,PLS模型的预测效果优于DBN模型;对优选出来的27个特征波长变量建模,DBN的预测效果较好,R2为0.958 4、RMSEP为0.035 0、RSD为1.31%,说明DBN模型的泛化能力更好,并且利用少量的波长变量就能达到较好的预测效果,能够满足实际检测需求,为实现油脂加工过程中TFAs含量的在线检测和调控,生产低/零TFAs油脂产品提供技术支撑。  相似文献   

11.
PLS和SMLR建模方法在水蜜桃糖度无损检测中的比较研究   总被引:3,自引:0,他引:3  
在实际应用中,一些实验条件往往不能严格控制而存在变化,从而影响近红外光谱检测模型的稳健性。文章以50个常温和50个冷藏后的奉化水蜜桃样品组成温度混合样品集,经光谱杠杆值和狄克松检验法进行异常光谱剔除后,采用偏最小二乘法(PLS)和逐步多元线性回归(SMLR)对水蜜桃糖度进行建模分析。PLS的建模结果:校正集相关系数RC=0.965, 校正均方根标准误差RMSEC=0.301°Brix,交叉验证RCV=0.812,交叉验证均方根标准误差RMSECV=0.67°Brix,标准偏差与交叉验证均方根标准误差的比值RPD=1.72;SMLR的建模结果:校正集RC=0.929,RMSEC=0.424°Brix, 交叉验证RCV=0.887, RMSECV=0.532°Brix, RPD=2.16。SMLR的预测结果要优于PLS的预测结果,在SMLR分析中,在3个不同的光谱区域4 290~7 817,7 817~10 725,4 290~10 725 cm-1的RPD值分别为1.97,1.89,2.16。试验结果表明,将不同温度条件下的样品组成温度混合样品集,用PLS和SMLR建立的模型具有较好的预测效果。  相似文献   

12.
为了探究反射光谱检测水体中毒死蜱农药的可行性,使用由ASD公司的FieldSpecPro地物波谱仪构成的高光谱采集系统在室内、室外环境获取两种不同浓度区间的毒死蜱样品的光谱数据。基于偏最小二乘(PLS)和主成分分析(PCA)算法分别对毒死蜱样品光谱数据建立全波段定量模型,结果两种模型的预测能力均较高。通过相关性分析(CA)计算相关系数来选择毒死蜱样品光谱的特征波长,其中浓度区间为5~75 mg·L-1的室内、室外实验光谱的特征波长为388,1 080,1 276 nm和356,1 322,1 693 nm,浓度区间为0.1~100 mg·L-1的室内外实验样品光谱的特征波长为367,1 070,1 276,1 708 nm和383,1 081,1 250,1 663 nm。结合PLS算法建立样品特征波长光谱数据的定量模型,结果与全波段模型相比,浓度区间为5~75 mg·L-1的室内外实验光谱PLS特征波长模型的校正集决定系数R2C分别提高至0.987 5和0.999 2,预测集决定系数R2P分别提高至0.989 4和0.994 4,校正集均方根误差RMSEC分别降低为2.841和0.714,预测集均方根误差RMSEP分别降低为1.715和1.244;浓度区间为0.1~100 mg·L-1的室内外实验光谱特征波长PLS模型的校正集决定系数R2C分别提高至0.998 3和0.998 8,预测集决定系数R2P分别提高至0.998 4和0.999 0,校正集均方根误差RMSEC分别降低为1.383和1.186,预测集均方根误差RMSEP分别降低为1.510和1.229,验证集标准差与预测均方根误差的比值(RPD)有所增加,尤其是针对浓度区间为0.1~100 mg·L-1的实验,RPD值显著增加至21.7,说明基于特征波长建立的毒死蜱样品定量模型具有较高精度的预测能力,但是通过不同浓度区间范围的对比实验发现,ASD地物光谱仪对低浓度的毒死蜱溶液预测的相对误差偏大,存在客观上的检测下限。为了保证不同试验条件下的毒死蜱农药的特征波长都得到分析,增强模型使用的普适性与鲁棒性,根据特征波长选择出4个波段,即351~393,1 065~1 086,1 245~1 281和1 658~1 713 nm作为特征波段。特征波段模型的波长变量个数共38个,相比于全波段模型的432个波长变量,模型变量精简了91.2%,其中浓度区间为5~75 mg·L-1的室内外实验光谱PLS特征波段模型的R2C分别为0.993 7和0.987 8,R2P分别为0.979 8和0.998 2,RMSEC分别为1.690和2.516,RMSEP分别为1.987和0.659;浓度区间为0.1~100 mg·L-1的室内外实验光谱特征波段PLS模型的R2C分别为0.9882和0.9807,R2P分别为0.9391和0.9936,RMSEC分别为3.345和3.942,RMSEP分别为8.996和2.663,且四种实验情况下的模型RPD值均大于2.5,满足定量分析条件。因此采用高光谱采集系统对室内和室外环境中毒死蜱农药的快速检测具有一定的可行性,此研究结果对有机磷农药等面源污染物快速检测有实际的应用价值,可为农田水体有机磷农药快速检测仪器的开发提供理论基础。  相似文献   

13.
利用多模式可调节的光学机构采集了苹果漫透射、全透射和漫反射三种检测方式的光谱,研究在不同的检测方式下苹果的光谱特征并采用PLS建立苹果可溶性固形物含量SSC预测的模型。首先分别采集每个样品赤道上四点的漫透射、全透射和漫反射光谱,然后分别使用多元散射校正MSC、基线偏移校正BOC、归一化Normalize和高斯滤波平滑GFS等方法对平均后的120个光谱做预处理,并结合竞争性自适应权重取样CARS法对漫反射光谱进行特征波长筛选,最后采用偏最小二乘法PLS回归建立预测苹果SSC的模型,并另购30个苹果验证模型性能。结果表明,苹果在三种检测方式下采集的光谱吸收峰和波谷所处的波段大致相同,但光谱强度有差异。三种光谱经3点高斯滤波平滑GFS预处理后建立预测苹果SSC含量的模型均取得很好的结果。漫透射的模型性能为Rcal=0.972,Rpre=0.967和RMSEC=0.436%,RMSEP=0.507%;全透射的模型性能为Rcal=0.964、Rpre=0.957和RMSEC=0.5%,RMSEP=0.574%;漫反射的模型性能为Rcal=0.963,Rpre=0.949和RMSEC=0.522%,RMSEP=0.536%;三种光谱经归一化预处理后融合建模的模型性能为Rcal=0.894,Rpre=0.857和RMSEC=0.836%,RMSEP=0.966%。进一步将漫反射光谱结合CARS算法筛选特征波长,使用119个变量建立模型的性能为Rcal=0.986,Rpre=0.977和RMSEC=0.323%,RMSEP=0.362%。最后将该模型导入新型多模式可调节的水果检测系统中,使用30个未参与建模的冰糖心苹果检验该模型预测苹果SSC的性能。结果显示30个外部验证集的相关系数为0.906,验证均方根误差为0.707%。进一步表明使用多模式可调节的水果内部品质检测系统采集的漫反射光谱结合光谱预处理、波段筛选算法和偏最小二乘回归方法可以建立较好的模型预测苹果可溶性固形物SSC含量。本研究为苹果的品质检测提供新的技术支持。  相似文献   

14.
可溶性固形物(SSC)和可滴定总酸(TA)含量是影响李果实品质的重要指标,经典的破坏性检测方法不适用于果实按品质分级,近红外光谱(NIRS)检测方法具有速度快、操作简便、可无损检测果实品质。为实现NIRS无损快速检测安哥诺李果实可溶性固形物和可滴定总酸含量,利用NIRS采集李果实的漫反射光谱,同时采用糖度计测定安哥诺李果实的SSC,采用滴定法测定了李果实TA含量,使用杠杆值和F概率值剔除异常样品,采用软件优化结合人工筛选光谱波段,使用了消除常数偏移量、减去一条直线、矢量归一化(SNV)、最大-最小归一化、多元散射校正(MSC)、一阶和二阶导数结合平滑处理、一阶导数结合减去一条直线和平滑处理、以及一阶导数结合SNV或MSC校正等光谱预处理方法,分别采用偏最小二乘法(PLS)和主成分分析结合反向传播人工神经网络(BP-ANN)建立李果实SSC、TA的定量分析模型。结果表明,李果实SSC和TA的最佳PLS建模效果波段范围分别为4 000~8 852和4 605~6 523 cm-1。SSC的PLS模型的最佳光谱预处理方法为MSC校正,最佳模型校正相关系数(Rc)为0.914 4,预测相关系数(Rp)为0.878 5,校正均方根误差(RMSEC)为0.91,预测均方根误差(RMSEP)为1.00。经一阶微分结合SNV和9点平滑的方法预处理后,TA的PLS模型效果最佳,Rc,Rp,RMSEC,RMSEP分别为0.860 3,0.819 6,0.80和0.86。提取了李果实SSC和TA光谱数据的主成分,并基于前10个主成分得分建立了李果实SSC和TA最佳BP-ANN定量分析模型,其Rc,Rp,RMSEC和RMSEP分别为0.976 7,0.889 7,0.75和0.99;TA的BP-ANN模型的相应参数值依次为0.974 3,0.897 7,0.62和0.83,与采用PLS算法建立的定量模型相比较,BP-ANN模型具有较高的Rc,Rp和较低的RMSEC,RMSEP,因此BP-ANN模型对SSC和TA指标的定量分析结果更佳。  相似文献   

15.
高光谱无损检测技术在果品定量无损检测中应用广泛,以冬枣、红提、香梨三种果品空间特性光谱为研究目标,探索空间特性光谱的影响因素和反演方法,为提高户外果品无损检测精度提供了一种新思路。分别提取三种果品的光谱库并计算空间特性光谱,依次使用马氏距离、浓度残差等预处理方法以及竞争性自适应权重取样算法选取特征波长,将处理后的三种果品空间特性光谱分别与品质(糖度、水分)和方位(探测角、方位角、相位角)建模,建模结果如下:三种果品(按照冬枣、红提、香梨的顺序)与糖分模型的相关系数r分别为:0.853 3,0.822 7和0.913 3;水分模型的相关系数r分别为:0.741 3,0.784 7和0.891 3;探测角模型相关系数r分别为:0.985 6,0.992 7和0.974 7;方位角模型相关系数r分别为:0.941 8,0.910 5和0.936 9;相位角模型相关系数r分别为:0.960 9,0.957 0和0.956 3。可以看出,不同果品方位模型相关性都明显高于品质模型相关性,因此方位因素是影响空间特性光谱的主要原因。使用Roujean模型和Walthall模型分别对不同方位的空间特性光谱进行反演,反演结果如下:使用Roujean模型反演三种果品(按照冬枣、红提、香梨的顺序)空间特性光谱时R2分别为0.934 4,0.928 1和0.830 6;r分别为0.990 2,0.983 9和0.969 1;RMSEP分别为0.030 9,0.048 7和0.062 7;平均模型误差分别为7.27%,11.02%和8.61%。使用Walthall模型描述不同果品空间特性光谱时R2分别为0.943 3,0.859 7和0.839 0;r分别为0.991 8,0.971 8和0.970 2;RMSEP分别为0.036 6,0.066 1和0.068 7;平均模型误差分别为6.19%,15.40%和7.84%。可以看出,Roujean模型可以很好的描述冬枣和红提的空间特性光谱,也可以较好的描述香梨空间特性光谱;Walthall模型可以很好的描述冬枣空间特性光谱,也可以较好的描述红提和香梨空间特性光谱。综上所述,在今后试验中可以使用Roujean模型反演红提和香梨的空间特性光谱,使用Walthall模型反演冬枣的空间特性光谱,进而提高户外果品户外果品无损检测精度。  相似文献   

16.
激光诱导击穿光谱技术(LIBS)用于检测时,由于谱线多且复杂,存在许多冗余的信息,这些都会对定量分析造成影响。因此,提取有效的特征变量在LIBS的定量分析中具有非常重要的意义。对CaCl2溶液中的Ca元素进行光谱特征选择方法分析,对比单变量模型、偏最小二乘回归和CART回归树定标模型的准确度和稳定性。针对水体表面的波动性较大,光谱稳定性差,同时光谱受基体效应和自吸收效应影响等问题,首先采用单变量模型得到的拟合系数(R2)仅有0.933 2,训练均方根误差(RMSEC)、预测均方根误差(RMSEP)和平均相对误差(ARE)分别为0.019 2 Wt%,0.017 7 Wt%和11.604%。经偏最小二乘回归优化后,模型R2提高到0.975 3,RMSEC,RMSEP和ARE分别降低到0.010 8 Wt%,0.013 Wt%和7.49%。为了进一步提高定量分析的准确度,建立CART回归树定标模型。该方法在构建树模型时,通过平方误差最小化准则,从复杂的光谱信息中选取最优的特征变量组合做分类决策,从而建立Ca元素的定标曲线。通过CART回归树的变量选择,特征变量个数从100个减少到6个,变量的压缩率达到了94%,显著降低了无关谱线的干扰,回归树模型的相关系数R2,RMSEC,RMSEP和ARE分别为0.997 5,0.003 5 Wt%,0.006 1 Wt%和2.500%。相较于传统的单变量模型与偏最小二乘回归,CART回归树模型具有更高的精度、更小的误差。通过对特征变量的有效筛选,剔除无关信号的干扰,显著降低了基体效应和自吸收效应对LIBS定量分析的影响,提高了定量分析的准确度和稳定性。  相似文献   

17.
结球甘蓝是一种富含碳水化合物的常见蔬菜,可溶性糖含量是决定其品质的重要参数。可溶性糖易溶于水,是蔬菜和水果口味的有效调节剂。作为碳水化合物,可溶性糖由三种元素C,H和O组成,其分子吸收光谱主要由被检测材料的分子中C-H,O-H和CO等基团的组合频率吸收和倍频吸收组成,包含丰富的有机物信息。因此,采用近红外光谱和化学计量学方法,探索结球甘蓝可溶性糖含量的快速检测方法。用德国布鲁克公司的MATRIX-Ⅰ型傅里叶变换近红外光谱仪采集161份结球甘蓝样本光谱数据。波数范围:12 800~4 000 cm-1(780~2 500 nm)。蒽酮比色法测量样本的可溶性糖。综合应用马氏距离法(MD)和蒙特卡洛交叉验证法(MCCV)剔除异常样本,采用Kennard-Stone(K-S)法将样本按照给定比例划分为校正集和验证集。分别使用Savitzky-Golay卷积平滑(S-G),一阶导数(FD),二阶导数(SD),多元散射校正(MSC)和变量标准化(SNV)及它们的组合共12种方法对样本进行光谱预处理,获得最佳预处理方法,提高光谱数据的信噪比。采用竞争性自适应重加权采样法(CARS)筛选偏最小二乘回归(PLS)模型中回归系数绝对值大的波数点,去掉回归系数绝对值小的波数点,以有效选择与所测特性值相关的最优波数组合,获得具有良好鲁棒性和强预测能力的校正模型。使用模型决定系数R2、交互验证均方根误差(RMSECV)、预测均方根误差(RMSEP)作为模型精度评价指标。根据蒙特卡洛交叉验证法和马氏距离剔除异常样本的原理,共剔除10个光谱或者化学值异常的样本。最终参与建模分析的样本个数为151。异常样本剔除后,通过K-S法将样本按照3∶1被分成校正集(110个样本)和验证集(41个样本)。使用原始光谱数据,预处理后的光谱数据和对应于优选波数的光谱数据,建立PLS模型。结果表明,利用MSC+FD光谱预处理可以提高建模精度,校正集R2从处理前的0.68增长到0.93,MSC+FD是本研究中理想的光谱数据预处理方法。利用CARS法共优选了84个建模波数。在12 000~10 000 cm-1波数区域内,有O-H键2级和C-H键3级倍频伸缩振动吸收,此区域主要的背景信息为水和其他含氢基团,在此区域内共包含了36个选定的波数。在8 500~6 000 cm-1区域,存在糖类和水的O-H键的1级倍频伸缩振动吸收,葡萄糖的O-H键的1级倍频伸缩振动吸收,该区域是包含反映可溶性糖成分的主要光谱区间,背景影响较小,CARS方法在此区域共选择了15个建模波数。5 800~4 000 cm-1区域与12 000~10 000 cm-1区域相似,包含的选定波数多,CARS方法在此区域选择了33个建模波数。利用CARS对参与建模的波数进行优选,减少了无关信息,降低了模型的复杂度,选择的波数不但引入了表征待测组分的光谱,同时还引入了代表背景信息的光谱,使得校正模型适应性增强。建立了结球甘蓝可溶性糖的全谱PLS模型,根据CARS波数优选结果,建立了结球甘蓝可溶性糖的CARS-PLS模型。对于全谱PLS定量模型,校正集的决定系数R2为0.93,RMSECV为0.157 2%,RMSEP为0.132 8%。对于CARS-PLS模型,校正集的决定系数R2为0.96,RMSECV为0.076 8%,RMSEP为0.059 4%。数据表明,两种模型具有相当的R2,但CARS-PLS模型的RMSECV是全谱PLS模型的1/2。RMSEP也接近1/2,CARS-PLS模型比全谱PLS定量模型所用建模变量少,模型得到简化,精度更优。用CARS-PLS模型对验证集41个样本进行预测,预测集决定系数R2为0.86,预测标准误差为0.059 4%。提供了一种工作效率较高的结球甘蓝质量无损检测方法。  相似文献   

18.
为提高生鲜羊肉储存期内(4,8和20 ℃环境)挥发性盐基氮(TVB-N)的近红外光谱(NIR)检测的稳定性和准确性,选取特征光谱和预测模型是关键步骤。以121个羊肉样品为实验对象,采集生鲜羊肉680~2 600 nm波段的近红外光谱。以多元散射校正(MSC)、标准正态变换(SNV)等散射校正方法,Savitzky-Golay卷积平滑(SGS)、移动平均平滑(MAS)等平滑处理方法,以及归一化(Normalization)、中心化(Centering)、标准化(Autoscaling)等尺度缩放方法分别预处理光谱数据后建立偏最小二乘法(PLS)预测模型。比较发现SGS处理的光谱建模效果最好。利用蒙特卡洛采样(MCS)法及马氏距离法(MD)消除了羊肉光谱的5个异常数据。运用光谱-理化值共生距离(SPXY)算法划分总样本的75%(87个)为校正集样本,剩余29个为验证集样本,利用竞争性自适应重加权法(CARS)、无信息变量消除法(UVE)、改进的无信息变量消除法(IUVE)和连续投影算法(SPA)提取特征光谱得到的波长个数分别为14,713,144和15。将全光谱和4种方法提取的特征波长作为输入变量建立预测模型,CARS提取的波长所建立模型的性能优于UVE、IUVE和SPA提取的波长所建立模型的性能,表明CARS方法可以有效简化输入变量并提高预测模型的性能。改进后得到的IUVE法相比于UVE法,筛选出的波长数更少且模型性能有所提升。以提取的特征波长建立PLS,支持向量机(SVM)和最小二乘支持向量机(LS-SVM)预测模型,SVM模型得到最优的校正集预测结果,其中CARS-SVM预测模型的校正决定系数(R2C)和校正均方根误差(RMSEC)分别为0.939 1和1.426 7,最优的验证集预测效果为LS-SVM预测模型得到,其中IUVE-LS-SVM预测模型的验证决定系数(R2V)和验证均方根误差(RMSEV)分别为0.856 8和1.886 2。基于近红外特征光谱建立简化、优化的生鲜羊肉储存期TVB-N预测模型,为实现快速无损检测生鲜羊肉中的TVB-N浓度提供技术支持。  相似文献   

19.
莲子是我国重要的药食同源食物,与莲子营养价值相当、便于食用的莲子粉备受消费者青睐。为保证莲子粉的品质,利用近红外光谱(NIRs)技术对掺杂小麦粉、玉米粉和地瓜粉的莲子粉进行鉴定,在样品类别已知下利用支持向量机(SVM)、最小二乘支持向量机(LS-SVM)、偏最小二乘法-判别分析(PLS-DA)模型进行判别,在样品类别未知下基于聚类算法进行判别。同时,对莲子粉中水分含量利用偏最小二乘(PLS)回归进行定量分析。结果表明,LS-SVM模型对纯莲子粉样品与掺入小麦粉、玉米粉和地瓜粉的莲子粉样品的判别率达到100%;基于聚类算法能够有效识别掺入5%地瓜粉、小麦粉和玉米粉的莲子粉样品;PLS模型对莲子粉中水分含量预测综合性能良好,其中经过标准化预处理得到模型效果最佳,其R2c,RMSEC,R2p和RMSEP分别达到0.973 2,0.111 5,0.969 5和0.118 9。近红外光谱技术能为隐蔽的莲子粉掺杂的鉴别以及莲子粉中水分含量监控提供一种快速、准确、无损检测的分析方法,为保证高档次莲子品质提供一种有益的思路。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号