首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 406 毫秒
1.
在近红外光谱的建模预测分析中,数据的冗余及共线性会严重影响模型的预测精度和稳健性。特征波长选择是提高定量分析预测精度的一种有效方法。随机蛙跳(RF)是一种依据不同的变量具有不同的被选择可能性的特征波长选择算法,近年来在特征波长提取方面展现良好的性能。该方法通过多次迭代,计算每个变量被选择的概率,以优选概率高的变量为特征波长。但由于其初始变量集V_0的产生是随机的,具有较大的不确定性,可能会包含无用或干扰信息,难以保证初始信息的有效性,使得迭代次数过大,运行时间过长。故而提出一种改进的联合区间随机蛙跳(Si-RF)特征波长选择算法,通过联合区间偏最小二乘法(SiPLS)对全谱进行变量初选,此时得到的波长对目标变量变化最为敏感,将其作为RF的初始变量子集,以解决RF运行时间较长、效率较低的问题。另一方面, RF在选择特征波长时,选择被选概率值大于阈值的变量为特征波长,但对概率值阈值的设定无理论依据,易受人为因素影响。通过对变量按被选概率值降序排列后逐次增加一个波长建立多元线性回归(MLR)模型,以验证均方根误差(RMSEV)值最低时的变量子集为特征波长,以找到预测精度最高点所包含的波长,提高预测精度。针对上述两点进行改进,将其应用于一组土壤样本近红外光谱数据集,进行特征波长选择后,建立MLR模型,与RF-MLR及全谱-PLSR模型的预测精度进行比较。结果表明:RF经过10 000次迭代,优选出10个波长点,建立的MLR模型的预测均方根误差(RMSEP)为1.6276;而改进后Si-RF只需进行1 000次迭代,优选出17个波长点,其MLR模型的RMSEP减小到0.818 4,大大提升了预测精度,提高运行效率。相较于全谱,也极大的提高了预测精度,简化模型的复杂度,证明改进的Si-RF是一种有效的特征波长选择算法。  相似文献   

2.
特征变量选择和回归方法相结合的土壤有机质含量估算   总被引:1,自引:0,他引:1  
针对高光谱数据量大、信息冗余严重的现象,应用稳定竞争性自适应重加权采样(sCARS)、连续投影算法(SPA)、遗传算法(GA)、迭代保留有效信息变量(IRIV)和稳定竞争性自适应重加权采样结合连续投影算法(sCARS-SPA),从全波段光谱数据中筛选特征变量,并利用全波段和特征波段建立偏最小二乘回归(PLSR)、支持向量机(SVM)和随机森林(RF)模型预测土壤有机质含量。结果表明, PLSR和SVM模型结合特征变量选择,不仅提高了模型运算效率,而且模型预测能力较全波段均有一定提高;RF模型采用特征变量建模,对模型精度的提高不是十分明显,但其构建模型的变量数量却显著减少,大大提高建模效率。RF模型精度优于SVM和PLSR模型,IRIV结合RF建立的土壤有机质含量预测模型,变量数仅63个,校准集和验证集模型决定系数(R~2)分别为0.941和0.96,验证集相对分析误差(R_(PD))为4.8。与全波段建模相比,特征变量选择和回归方法相结合,在保证模型精度的同时,可有效提高建模效率。  相似文献   

3.
大豆品种快速准确的鉴别,对于鉴定种子品质、净化种业市场以及保障粮食安全具有重要意义。为解决传统农作物品种鉴别方法中存在精度差和效率低等问题,采用拉曼光谱结合特征波长提取方法建立偏最小二乘(PLS)鉴别模型,对黑龙江省4个高蛋白大豆品种(黑农88、黑农98、绥农71以及绥农76)进行快速鉴别。随机蛙跳(RF)算法是一种通过迭代计算变量被选概率,以确定变量重要性的新型特征波长选择算法,可以有效剔除全光谱数据中的冗余信息。该方法存在初始变量集随机性、所需迭代次数大、阈值选取不确定的问题,因此提出一种基于最小绝对收敛与选择算子(LASSO)回归的改进随机蛙跳(MRF)算法。采用LASSO算法提取与属性变量最相关的特征波长点作为RF初始变量集F0,消除初始变量的随机性,在此基础上开始迭代计算,可以减少无用迭代次数,提高模型的预测精确度。RF算法通过设定阈值的方法选择变量,因此提取的特征波长往往具有不确定性。改进如下:首先去除被选概率为0的变量,对于排序后变量以10个波长点为间隔,每次增加1个间隔建立特征波长与大豆品种属性的偏最小二乘回归模型,当交叉验证均方根误差(RMSEC...  相似文献   

4.
将经典的卡尔曼滤波器与近红外光谱分析技术相结合,提出了一种新的特征波长变量选择方法——卡尔曼滤波法。分析了卡尔曼滤波器用于波长优选的原理,设计了波长选择算法并将其应用到大豆油脂酸价的近红外光谱检测中。首先利用偏最小二乘法(PLS)对油脂不同吸收波段建模,初步筛选出4 472~5 000 cm-1油脂酸价特征波段共132个波长点,然后进一步利用卡尔曼滤波器进行特征波长选择,从中优选出22个特征波长变量建立PLS校正模型,预测集决定系数R2、预测误差均方根RMSEP分别为0.970 8和0.125 4,与利用132个波长点建立的校正模型预测结果相当,而波长变量数减少到原来的16.67%。该波长变量选择算法是一种确定性的迭代过程,无复杂的参数设置和变量选择的随机性,物理意义明确。优选出少数对模型影响较大的特征波长变量以代替全谱建模,在简化模型的同时提高了模型的稳健性,为开发专用油脂近红外光谱分析仪器提供了重要参考依据。  相似文献   

5.
为了探究马铃薯作物叶绿素吸收特征,充分解析光谱特征波长变量,建立高精度叶绿素含量检测模型。在马铃薯发棵期(M1)、块茎形成期(M2)、块茎膨大期(M3)和淀粉积累期(M4)4个关键生长期,利用ASD便携式光谱仪采集80个样本区的314组作物冠层反射率数据,并同步采集叶片测定叶绿素含量。在光谱数据预处理之后,分析了马铃薯不同生长期的光谱反射率变化特征。利用基于模型集群思想的蒙特卡洛无信息变量消除(MC-UVE)、随机蛙跳(RF)、竞争自适应重加权采样(CARS)三种算法筛选叶绿素特征波长,建立叶绿素含量检测PLS模型。对4个生长期的314个样本,采用SPXY算法分别按照3∶1的比例划分,得到建模集240个样本、验证集74个样本。利用MC-UVE, RF, CARS三种算法筛选叶绿素特征波长,讨论迭代次数(N)和特征变量个数(LV)对MC-UVE和RF算法、迭代次数(N)对CARS算法筛选特征波长结果的影响,对迭代次数设置6个梯度,分别为N=50, 100, 500, 1 000, 5 000和10 000;对特征变量数设置4个梯度,分别为LV=15, 20, 25和30。以PLSR模型的验证集结果为评价指标,分析迭代次数(N)和特征变量数(LV)的最优参数组合。最后基于MC-UVE, RF和CARS算法筛选得到的最佳特征波长建立叶绿素检测PLSR模型,分别记为MC-UVE-PLSR, RF-PLSR, CARS-PLSR。结果表明, CARS, RF和MC-UVE三种算法的迭代次数(N)、特征变量数(LV)参数最佳组合分别为:(1)MC-UVE:迭代次数N=50特征变量数LV=30;(2)RF:迭代次数N=500、特征变量数LV=30;(3)CARS:迭代次数N=100。对比在最佳特征波长建立的MC-UVE-PLSR, RF-PLSR, CARS-PLSR叶绿素含量检测,发现RF-PLSRRR模型的性能最优,R■为0.786, RMSEV为3.415 mg·L~(-1); MC-UVE-PLS模型性能次之,R■为0.696, RMSEV为4.072 mg·L~(-1); CARS-PLS模型的性能最差,R■为0.689, RMSEV为4.183 mg·L~(-1)。以上结果说明:在筛选马铃薯叶绿素特征波长方面RF算法优于MC-UVE和CARS,得到的特征波长能够较全面地反映与马铃薯叶绿素相关的物质信息。  相似文献   

6.
研究了基于可见-近红外光谱技术的发动机润滑油含水量快速检测方法。在获取光谱信息的基础上,提出了采用不同的光谱建模方法以提高检测精度和简化分析计算。分别采用主成分分析(PCA)和连续投影算法(SPA)方法进行模型输入变量的提取。SPA最终选择了476,483,544,925,933,938,952,970和974nm共9个波长为最优变量。基于SPA选择的变量,分别应用偏最小二乘回归(PLSR)和多元线性回归(MLR)建模。效果均优于全波段PLSR模型和PCA-PLSR模型。说明SPA选择的有效变量能够包含最重要的全波段光谱信息,同时可以去除无用的信息变量。为了进一步提高检测效果,采用LS-SVM分别基于SPA选择后的有效变量和全波段光谱进行建模。两个模型的预测确定系数(Rp2)均在0.9以上。SPA-LS-SVM的效果要优于全波段LS-SVM模型的效果。SPA-LS-SVM模型的Rp2达到了0.983,剩余预测偏差(RPD)值为6.963。表明可见-近红外光谱可以用于发动机润滑油含水量的检测。  相似文献   

7.
基于近红外光谱的橄榄油品质鉴别方法研究   总被引:1,自引:0,他引:1  
目前市面上销售的橄榄油主要分为特级初榨橄榄油和普通初榨橄榄油两类,为了鉴别两种不同品质的橄榄油,提出了一种应用siPLS-IRIV-PCA算法的橄榄油品质鉴别的新方法。基于橄榄油的近红外光谱数据,应用联合区间偏最小二乘法(siPLS)对橄榄油的近红外光谱进行了波长区间优选,使用交叉验证均方根误差(RMSECV)评估模型的性能并选择最优波长区间,通过迭代保留信息变量(IRIV)算法从最优波长区间中选择特征波长,根据选择的特征波长构建主成分分析(PCA)模型。对90组特级初榨橄榄油和90组普通橄榄油样本进行了判别鉴定。PCA将1 427个波长变量作为输入变量,前两个主成分贡献率为51.891 8%和26.473 2%;siPLS-PCA将408个波长变量作为输入变量,前两个主成分贡献率为56.039 1%和36.235 5%;siPLS-IRIV-PCA将6个波长变量作为输入变量,前两个主成分贡献率为66.347 6%和32.304 3%。结果表明,与PCA和siPLS-PCA鉴别方法相比,siPLS-IRIV-PCA具有最佳的鉴别性能。  相似文献   

8.
智能优化算法应用于近红外光谱波长选择的比较研究   总被引:3,自引:0,他引:3  
近红外光谱(NIRS)是一种间接分析技术,其应用需建立相应的校正模型。为了提高模型的解释能力、预测准确度和建模效率,需要对NIRS进行波长选择,优选最小化冗余信息。智能优化算法是以生物的行为方式或物质的运动形态为背景,经过数学抽象建立算法模型,通过迭代计算来求解组合最优化问题,其核心策略是以某种目标函数为标准,基于多元校正建模并以逐步逼近的方法筛选出有效的波长点。选用蚁群优化(ACO)、遗传优化(GA)、粒子群优化(PSO)、随机青蛙(RF)和模拟退火(SA)5种智能优化算法对烟叶总氮和烟碱近红外光谱数据进行特征波长选择,结合偏最小二乘(PLS)算法,构建了多个烟叶总氮和烟碱的校正模型,结果显示:所选用两个数据集的总氮最优模型分别为PSO-PLS和GA-PLS模型,烟碱最优模型分别为GA-PLS和SA-PLS模型,五种智能优化算法所建模型预测性能并非全部优于全谱PLS模型,但是通过智能优化算法进行波长选择后建立的PLS模型大大简化,模型的预测精度、可解释性和稳定性均有所提高。同时也对优选波长进行了解释和分析,烟叶总氮特征波长优选组合为4 587~4 878和6 700~7 200 cm-1;烟叶烟碱特征波长优选组合为4 500~4 700和5 800~6 000 cm-1,优选出来的特征波长具有实际物理意义。  相似文献   

9.
小波变换和连续投影算法在火龙果总酸无损检测中的应用   总被引:1,自引:0,他引:1  
应用可见/近红外光谱技术、小波变换(WT)和连续投影算法(SPA),对火龙果总酸含量(TA)进行精确、快速的无损检测,为火龙果内部品质无损检测提供科学依据。利用Maya2000光纤光谱仪采集380~1 099 nm范围的火龙果漫反射光谱数据,通过WT消噪、SPA优选波长和偏最小二乘回归(PLSR)分析方法,建立了火龙果总酸的定量预测模型。试验结果表明:经过WT消噪联合SPA优选波长压缩光谱变量后建立的WT-SPA-PLSR模型,预测精度都高于全谱PLSR模型。由全部样本的原始光谱变量作为输入变量建立PLSR模型的预测相关系数(Rp)为0.851 394, 预测均方根误差(RMSEP)为0.086 848;全部样本的原始光谱数据使用dbN(N=2,3,…,10)小波进行分解消噪,其中消噪效果最优的是db4小波2层分解(db4-2),WT-PLSR模型的Rp为0.915 635,RMSEP为0.066 752,小波变换消噪后的光谱预测模型精度明显提高;原始光谱经过db10-3小波消噪联合SPA算法,从570个光谱变量中优选出530,545,604,626,648,676,685,695,730,897,972,1 016 nm共12个变量作为输入变量,建立WT-SPA-PLSR预测模型,模型的RP为0.882 83, RMSEP为0.077 39。SPA算法适合火龙果TA模型的光谱变量选择,能够有效提取与总酸相关度高的波长变量,增加了预测模型的精度和稳定性。研究结果表明小波变换技术联合连续投影算法的漫反射近红外光谱无损检测火龙果总酸含量具有可行性。  相似文献   

10.
应用近红外高光谱成像技术实现三文鱼肉水分含量的快速无损检测。采集来自不同部位的三文鱼肉共90个样本的高光谱图像, 提取样本感兴趣区域(ROI)的平均光谱。随机取60个样本作为建模集, 其余30个样本作为预测集。分别采用偏最小二乘回归(PLSR)和最小二乘支持向量机(LS-SVM)对全波段和水分含量建立相关性模型, 并对预测集样本的水分含量进行预测。再用一种新的变量提取方法random frog选择特征波长, 并基于特征波长分别建立水分检测的PLSR和LS-SVM模型。特征波长模型的预测精度虽然稍逊于全波段模型, 但是仅用12个变量代替了全波段的151个变量, 大大简化了模型, 更便于实际应用。PLSR和LS-SVM特征波长模型的预测相关系数(Rp)分别为0.92和0.93, 预测均方根误差(RMSEP)分别为1.31%和1.18%, 取得了满意的结果。研究表明, 近红外高光谱成像与化学计量学方法结合可以准确预测三文鱼肉的水分含量, 为鱼肉品质的快速监测提供重要的参考。  相似文献   

11.
在近红外光谱的定量分析中,由于仪器的精密程度越来越高,采集的光谱数据通常具有很高的维度.因此,波长选择对于剔除噪声及冗余变量,简化模型,提高模型的预测性能是必不可少的.近红外光谱特征波长选择方法众多,但变量间的多重共线性问题仍是导致模型效果较差的一个关键问题.变量间共线性可以通过相关系数进行分析,当相关系数高于0.8,...  相似文献   

12.
基于反射光谱技术原理研究润滑油的污染浓度预测模型。选用纯净润滑油和原态污染油为原料,采用等体积法逐一配置不同浓度的样本;调整好光纤探头与样品之间的距离及方位角并保持不变,采用脉冲氙灯为激发光源,利用波段在200~850nm范围的光谱仪对不同浓度的样本进行反射光谱测量实验。实验曲线观察分析表明,润滑油的污染浓度越高,反射光谱的强度越低。在采用变步长算法对原始实验数据进行稀疏采样的基础上,分别采用相关系数法、主成分分析法、主成分分析结合相关系数法(主成分-相关系数法)选取工作润滑油在220~780nm宽波段范围内的优势特征波长,并在所选取的优势波长处建立了润滑油污染浓度与光谱反射率的指数关系模型。测试结果表明,主成分-相关系数法选取的优势波长378.93nm,所建立的污染浓度与光谱反射率的指数回归模型能够较好地实现润滑油污染浓度大于0.06时的预测和估计。基于主成分-相关系数法选取优势特征波长所建立的指数关系回归模型,因混合介质及浓度的特异性条件,不服从低浓度均匀透明溶液中的朗伯-比尔定律,适用于较高污染浓度的润滑油质量状态估计,为进一步实现工作润滑油污染浓度的反射光谱法在线快速准确测定提供了可行性实验依据。  相似文献   

13.
高光谱成像的猕猴桃糖度无损检测方法   总被引:1,自引:0,他引:1  
猕猴桃糖度是重要的猕猴桃内部品质衡量指标。传统的糖度检测耗时且有损样品,有效无损检测猕猴桃糖度含量对于其品质分级、储藏销售具有重大意义。基于高光谱成像技术的常见果蔬品质无损检测方法多数是采用竞争性自适应重加权算法(CARS)、连续投影算法(SPA)、主成分分析(PCA)、迭代保留信息变量法(IRIV)等算法中的某个单一算法提取特征光谱变量,而这些算法单独使用易导致预测结果的稳定性不足。对此,开展了基于高光谱成像技术的猕猴桃糖度的无损检测方法研究。以四川省雅安市“红阳”猕猴桃为研究对象,依次对猕猴桃样本编号并采集其在400~1 000 nm波长范围内的高光谱图像,计算感兴趣区域的平均光谱作为样本的有效光谱信息;分别采用多元散射校正(MSC)、标准正态变量变换(SNV)、直接正交信号校正(DOSC)等3种光谱数据预处理方法分析对预测模型精度的影响,对比结果显示DOSC的预处理效果最好;对预处理后的光谱分别采用一次降维(CARS,SPA,IRIV)、一次组合降维(CARS+SPA,CARS+IRIV)算法和二次组合降维算法((CARS+SPA)-SPA,(CARS+IRIV)-SPA))等7种算法提取特征光谱变量,并分别构建了预测猕猴桃糖度的3种模型,即支持向量回归机(SVR)、最小二乘支持向量机(LSSVM)和极限学习机(ELM)模型;最后对比了基于不同特征提取方法的3种模型的预测精度。研究结果表明:ELM模型具有最好的预测性能,而SVR模型的预测性能最差;(CARS+IRIV)-SPA所选特征光谱变量输入LSSVM、ELM模型,其获得的预测结果均优于其他算法所选特征光谱变量输入对应模型所得的预测结果,证明了(CARS+IRIV)-SPA算法在提高猕猴桃糖度含量检测精度方面的有效性。对比不同方法的预测结果可知,(CARS+IRIV)-SPA-ELM对猕猴桃糖度的预测性能最优,其相关系数Rc=0.945 1,Rp=0.839 0,均方根误差RMSEC=0.450 3,RMSEP=0.598 3,预测相对分析误差RPD=2.535 1,该方法为猕猴桃糖度的检测无损化、精准化、智能化发展提供了可靠的理论依据和技术支撑。  相似文献   

14.
X射线荧光光谱分析作为一种以化学计量学为基础的定量分析技术,所建立模型优劣对结果的预测准确性显得十分重要。竞争性自适应重加权算法(CARS)采用自适应重加权采样技术,利用交互验证选出互验证均方根误差(RMSECV)值最低原则,寻出最优变量组合。为了进一步提高PLS模型的解释和预测能力,将竞争性自适应重加权算法(CARS)与X射线荧光光谱分析技术相结合,对土壤中重金属元素铅和砷进行特征波长变量筛选后建立偏最小二乘(PLS)模型。首先,利用CARS算法对铅含量密切相关的波长变量进行筛选,当采样次数为26次时,筛选出60个有效波长点;对砷含量密切相关的波长变量进行筛选,当采样次数为34次时,筛选出19个有效波长点;然后对优选出的波长点利用PLS方法分别建立土壤中铅和砷含量定量分析模型,并与经连续投影算法(SPA)及蒙特卡罗无信息变量消除(MC-UVE)方法波长变量筛选后所建立的PLS模型进行比较。结果显示:铅的CARS-PLS模型的预测集决定系数(R2)、交互验证均方根误差(RMSECV)、预测均方根误差(RMSEP)和相对预测误差(RPD)分别为0.995 5,2.598 6,3.228和9.401 1,砷的CARS-PLS模型的预测集R2,RMSECV,RMSEP和RPD分别为0.989 9,3.013 2,2.737 1和8.211 6;两元素的CARS-PLS模型性能均优于全波段PLS,SPA-PLS和MC-UVE-PLS模型。基于CARS-PLS的算法可以有效筛选出X射线荧光光谱特征波长点,在简化了建模复杂程度的同时,提高了模型的准确性和稳健性。  相似文献   

15.
为了快速检测油页岩总有机碳(TOC)含量,以松辽盆地某区块所取岩芯为研究对象,测量230个岩石样本的TOC含量和近红外光谱数据。利用蒙特卡洛法剔除异常样本14个,剩余的216个样本进行去趋势加基线校正方法预处理,采用连续投影算法(SPA)、无信息变量消除算法以及竞争自适应算法选取特征波长。使用SPXY方法对样本按照2∶1的比例划分为144个校正集和72个验证集,然后建立线性的偏最小二乘(PLS)模型以及非线性的支持向量机(SVM)模型和随机森林(RF)模型对油页岩TOC含量进行预测。采用测定系数(R2)和均方根误差(RMSE)作为模型的评价指标,探究不同特征波长选择方法对油页岩总有机碳建模的影响,比较不同建模方法对油页岩TOC含量预测的准确度。结果表明,特征波长提取能够起到优化模型的作用。SPA,UVE和CARS分别提取了16,253和65个波长,经过特征波长提取后模型测定系数均有提高,均方根误差均有下降,这说明进行特征波长优选对于简化模型、提高模型运算速度发挥着很重要的作用。此外,非线性的RF和SVM模型性能要优于线性模型PLS。这是因为油页岩中的碳存在于各类烃的中,不同类别含烃基团的吸收峰之间相互影响,使得油页岩总有机碳含量和近红外光谱数据之间存在着复杂的非线性关系,因此,非线性的SVM和RF模型能够表现出更好的效果。相比于其他模型,CARS-SVM模型验证集的测定系数(R2v)和均方根误差(RMSEV)表现出的结果较好,分别达到了0.906 6和0.222 0,该模型能够用于油页岩总有机碳含量的快速检测。研究结果说明,近红外光谱分析应用于油页岩TOC含量快速检测是可行的;建立的CARS-SVM模型能够表现出较好的预测效果,为我国油页岩TOC含量快速检测提供了一种新的方法和思路。  相似文献   

16.
高光谱成像可将图像和光谱相结合,同时获得目标对象的图像和光谱信息,已在农产品定性和定量分析检测方面得到广泛利用。利用可见-近红外高光谱成像结合化学计量学方法对贮藏期内灵武长枣果糖含量进行无损检测。采用高效液相色谱测量长枣果糖含量的化学值,可见-近红外高光谱系统采集长枣的高光谱图像,提取每个样本感兴趣区域的平均光谱;建立长枣贮藏期的径向基核函数支持向量机(radial basis kernel function support vector machine,RBF-SVM)模型;分别选用正交信号校正法(orthogonal signal correction,OSC)、多元散射校正(multiplicative scatter correction,MSC)、中值滤波(median-filter,MF)、卷积平滑(savitzky-golay,SG)、归一化(normalization,Nor)、高斯滤波(gaussian-filter,GF)和标准正态变换(standard normalized variate,SNV)等方法对原始光谱进行预处理;为减少数据量,降低维度,提高运算速度,采用反向区间偏最小二乘法(backward interval partial least squares,BiPLS)、间隔随机蛙跳算法(interval random frog,IRF)和竞争性自适应加权算法(competitive adaptive reweighted sampling,CARS)对光谱数据提取特征变量;建立全波段和特征波段的偏最小二乘回归(partial least squares regression,PLSR)和主成分回归(principle component regression,PCR)长枣果糖含量预测模型。结果表明:RBF-SVM判别模型校正集准确率为98.04%,预测集准确率为97.14%,能很好地预测长枣的贮藏期;利用BiPLS, IRF及CARS进行降维处理,提取特征波长个数为100, 63和23,占原光谱数据的80%,50.4%和18.4%;为简化模型运算过程并提高模型精度,采用CARS算法对BiPLS及IRF算法所选取的特征波长进行二次筛选,分别优选出18和15个特征波长,占原光谱数据的14.4%和12%,显著减少特征波长数;将全波段光谱与提取出的特征波长分别建立长枣果糖含量的PLSR及PCR预测模型,优选出CARS提取特征波长建立的PLSR模型效果最优,其中校正集的相关系数Rc=0.854 4,均方根误差RMSEC=0.005 3,预测集的相关系数Rp=0.830 3,均方根误差RMSEP=0.005 7,说明CARS有效地对光谱进行降维,简化了数据处理过程。研究表明,利用可见-近红外高光谱成像结合化学计量学方法及计算机编程,可以有效的实现灵武长枣果糖含量的快速无损分析,为灵武长枣内部品质的检测提供理论依据。  相似文献   

17.
水体中过高浓度的有机污染物含量危害巨大,不仅会造成严重的环境污染,而且会危害人类身体健康。化学需氧量(COD)表征了水体中有机污染物的污染程度。提出了一种将紫外(UV)光谱和近红外(NIR)光谱进行多光谱数据级融合(LLDF)和特征级融合(MLDF),进而构建基于生成对抗式网络(GANs)算法的COD浓度定量预测模型。首先按照一定的浓度梯度配制COD标准液样本,分别采集标准液的UV光谱(190~310 nm)和NIR光谱(830~2 100 nm),对获取到的UV和NIR光谱数据进行一阶导数和Savitzky-Golay (S-G)平滑的预处理,消除基线漂移和干扰噪声;基于预处理过的光谱,直接进行数据级和特征级的数据融合,结合GANs算法搭建COD浓度预测模型。并使用评价参数相关系数的平方(R2)、预测值与真实浓度值的均方根误差(RMSEP)和预测偏差来对模型进行评价。结果表明,不论是特征级融合模型还是数据级融合模型都不够理想。分析原因可知,由于UV和NIR波段数据量不均衡,导致NIR波段掩盖掉了UV光谱的模型贡献度,让光谱融合失去意义。为了避免融合失败,拟采用归一化的方法处理多光谱数据,并讨论了标准归一化(SNV)、最大最小归一化(MMN)和矢量归一化(VN)对建模的影响。将经过归一化后的UV和NIR光谱数据再次进行融合,分别作为GANs模型的输入X,将真实测量COD值作为输出值Y,建立不同归一化方法处理后的COD浓度预测模型。建模结果显示,采用不同归一化方法对多光谱数据融合模型的影响较大,不论是数据级融合模型还是特征级融合模型的预测精度较未归一化之前有明显的提升,其中采用最大最小归一化的预测模型效果提升最为明显。与单一谱源的全波长UV波段的GANs预测模型、全波长NIR波段的GANs预测模型进行对比来验证多光谱数据融合GANs预测模型的精度,结果表明:基于UV和NIR光谱的特征级光谱融合模型的R2为0.994 7,RMSEP为0.976,比数据级融合的预测模型误差降低了52.9%,预测回收率为98.4%~103.1%,远好于其他几组,模型的泛化能力更强,预测精度也更高。与单一谱源的预测模型相比,多光谱数据融合能反应更多的水体样品的化学信息,更加全面揭示水体的污染物程度,从不同的层面上反应水体中污染物的差异,为在线监测水体中COD浓度提供一定的技术支持。  相似文献   

18.
针对油脂脱臭过程中的反式脂肪酸(TFAs)含量控制问题,提出一种基于近红外光谱分析的油脂中TFAs含量快速检测方法。制备含不同TFAs的大豆油脂样本100个,利用气相色谱(GC)法精确测定其TFAs含量,扫描样本近红外光谱,然后利用不同方法对光谱数据进行降噪处理,发现多元散射校正的去噪效果最佳。为了探讨TFAs在近红外区域的吸收特性,采用多种iPLS方法对比分析,筛选出7 258~7 443/6 502~6 691/6 120~6 309 cm-1 TFAs的特征波段,再利用Kalman滤波算法进行特征波长变量的选择,优选出27个TFAs的特征波长变量;采用深度信念网络(DBN)建立校正模型,通过多次对比发现,当隐含层层数为3并且隐含层节点数为50-35-90时,DBN模型性能最佳。最后将DBN模型与PLS方法建立的反式脂肪酸含量回归模型进行对比分析,结果表明:对降噪后的全谱进行建模,DBN模型的预测效果优于PLS,DBN模型预测集R2为0.879 4、RMSEP为0.060 3、RSD为2.18%;对筛选出的特征波段建模,PLS模型的预测效果优于DBN模型;对优选出来的27个特征波长变量建模,DBN的预测效果较好,R2为0.958 4、RMSEP为0.035 0、RSD为1.31%,说明DBN模型的泛化能力更好,并且利用少量的波长变量就能达到较好的预测效果,能够满足实际检测需求,为实现油脂加工过程中TFAs含量的在线检测和调控,生产低/零TFAs油脂产品提供技术支撑。  相似文献   

19.
应用可见/近红外高光谱对细菌性角斑病早期胁迫下的黄瓜叶片中所含过氧化物酶(peroxidase,POD)活性进行检测。在380~1 030 nm光谱范围获取120个样本(健康,病害轻微感染1级和2级)的光谱曲线,并使用分光光度计法测量感染病害样本中的过氧化物酶活性值。采用单因素方差分析(analysis of variance,ANOVA)对三种不同程度早期病害胁迫下过氧化物酶活性值进行统计分析,结果表明不同程度病害胁迫下黄瓜叶片中的过氧化物活性存在显著性差异(p=0.05)。采用SPXY方法将样本分为建模集(80个样本)与预测集(40个样本)。采用random frog(RF)和回归系数法(regression coefficient,RC)方法提取特征波段,并建立过氧化物酶活性值的偏最小二乘回归(partial least square regression,PLSR)预测模型。最终得到RF-PLSR具有最佳的预测效果,预测集相关系数为0.816,预测均方根误差为11.235。研究结果表明高光谱结合化学计量学方法可以实现细菌性角斑病早期胁迫下黄瓜叶片中过氧化物酶活性的测定,为植物病害的早期无损诊断提供参考。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号