首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 140 毫秒
1.
近红外高光谱图像结合CARS算法对鸭梨SSC含量定量测定   总被引:3,自引:0,他引:3  
高光谱数据量大、 维数高且原始光谱噪声明显、 散射严重等特征导致光谱建模时关键波长变量提取困难。 基于此,提出采用竞争性自适应重加权算法(CARS)对近红外高光谱数据进行关键变量选择。 鸭梨作为研究对象。 采用决定系数r2、 预测均方根误差RMSEP和验证集标准偏差和预测集标准偏差的比值RPD值进行模型性能评估。 基于选择的关键变量建立PLS模型(CARS-PLS)与全光谱变量建立的PLS模型进行比较发现CARS-PLS模型仅仅使用原始变量中15.6%的信息获得了比全变量PLS模型更好的鸭梨SSC含量预测结果,r2pre,RMSEP和RPD分别为0.908 2,0.312 0和3.300 5。 进一步与基于蒙特卡罗无信息变量MC-UVE和遗传算法(GA)获得的特征变量建立的PLS模型比较发现,CARS不仅可以去除原始光谱数据中的无信息变量,同时也能够对共线性的变量进行压缩去除,该方法能够有效地用于高光谱数据变量的选择。 结果表明,近红外高光谱技术结合CARS-PLS模型能够用于鸭梨可溶性固形物SSC含量的定量预测。 从而为基于近红外高光谱技术预测水果内部品质的研究提供了参考。  相似文献   

2.
为提高全血血红蛋白浓度预测模型的预测精度,基于近红外光谱分析,首先对原始全血透射光谱数据分别进行均值中心化、标准化、标准正态变量变换(SNV)、多元散射校正(MSC)以及Savitzky-Golay(SG)卷积平滑结合MSC的预处理操作,最终选择预处理效果最好的SG-MSC方法作为数据预处理方法,其最大相关系数达到0.944 1。对SG平滑的平滑窗口宽度进行讨论,找出平滑效果最好的窗口宽度为27。数据预处理消除了全血吸收光谱的基线失真,提高了全血吸收光谱数据的信噪比。将190个样本(190个血红蛋白浓度对应的透射光谱数据)分为具有相近血红蛋白浓度分布的校正集和测试集,其中校正集为143个样本(对应血红蛋白浓度分布为10.6~17.3 g·dL-1),测试集为47个样本(对应血红蛋白浓度分布为10.3~17.3 g·dL-1),确保建立模型的适用性。对校正集数据预处理后利用蒙特卡洛无信息变量消除(MC-UVE)方法对其进行波长变量选择,剔除含信息量少的波长点,提高含信息量多的波长占比。设置蒙特卡洛迭代次数为1 000,最终从全血吸收光谱的700个波长变量中筛选出191个波长变量用于建立全血血红蛋白浓度偏最小二乘(PLS)回归模型。对比分析原始全血透射光谱全谱PLS模型、原始全血吸收光谱全谱PLS模型、预处理全血吸收光谱全谱PLS模型、SG-MSC-MC-UVE-PLS模型以及已有二阶导数PLS模型的模型效果,表明基于SG-MSC-MC-UVE-PLS算法的全血血红蛋白浓度预测模型效果较其他模型效果更优,预测相关系数由0.676 3提高到0.979 1,预测集均方根误差由0.898 1减小到0.220 3,最大绝对误差由2.426 1减小到0.411 2。同时,利用MC-UVE方法进行波长变量选择,在保证预测精度的前提下,筛选出建模的波长个数更少,有利于提高模型计算效率。研究结果表明,SG-MSC-MC-UVE-PLS方法能够提高全血吸收光谱信号的信噪比,简化模型结构,提高模型的预测精度和计算效率,对推动血红蛋白浓度检测技术的发展具有进步意义。  相似文献   

3.
食药植物玛咖富含多种营养成分,极具药用价值。采用近红外漫反射光谱,对采自秘鲁及云南共139份玛咖样品进行产地鉴别。采用多元信号校正结合二阶导数和Norris平滑预处理光谱,利用光谱标准偏差初步选择光谱波段(7 500~4 061 cm-1),结合主成分-马氏距离(principal component analysis-mahalanobis distance,PCA-MD)筛选出适宜的主成分数为5。基于所筛选的光谱波段及主成分数,利用“模群迭代奇异样本诊断”方法剔除2个异常样品后,分别采用竞争自适应重加权法(competitive adaptive reweighted sampling,CARS)、蒙特卡洛-无信息变量消除法(monte carlo-uninformative variable elimination,MC-UVE)、遗传算法(genetic algorithm,GA)和子窗口重排(subwindow permutation analysis,SPA)四种方法筛选光谱变量信息,利用模型集群分析(model population analysis,MPA)思想对所筛选的光谱变量信息进行评价。结果显示,RMSECV(SPA)>RMSECV(CARS)>RMSECV(MC-UVE)>RMSECV(GA),分别为2.14,2.05,2.02,1.98,光谱变量数分别为250,240,250和70。采用偏最小二乘判别分析法(partial least squares discriminant analysis,PLS-DA)对四种方法筛选的光谱变量建立判别模型,随机选择97份样品作为建模集,其余40份样品作为验证集。通过R2,RMSEC和RMSEP分析可知,R2: GA>MC-UVE>CARS>SPA,RMSEC和RMSEP: GA相似文献   

4.
由于高光谱数据量大、维数高,光谱噪声明显、散射严重等特征导致光谱建模时关键变量提取较为困难,同时,高光谱图像的获取会受非单色光、杂散光、温度等多种因素的影响,从而使高光谱数据与待测性质之间有一定非线性关系。为此,提出采用正自适应加权算法(CARS)对可见-近红外高光谱高维数据进行关键变量筛选,并与全光谱和经典变量提取方法SPA,MC-UVE,GA和GA-SPA方法进行比较。以200个库尔勒香梨为研究对象,采用SPXY方法将样本划分为校正集和预测集,校正集和预测集分别包含150个和50个样本。基于不同方法筛选的变量,分别建立线性PLS模型及非线性LS-SVM模型,r2,RMSEP和RPD用于模型性能的评估。综合比较发现,GA,GA-SPA和CARS变量筛选方法能够有效地筛选出原始高光谱数据中具有强信息且对外界影响因素不敏感的变量,适用于高光谱数据关键变量的提取,其中CARS变量筛选效果最佳,基于CARS获取的关键变量构建的非线性LS-SVM库尔勒香梨SSC含量预测模型获得了最优的预测结果,r2pre,RMSEP和RPD分别为0.851 2,0.291 3和2.592 4。研究表明,CARS方法是一种有效的高光谱关键变量筛选方法,利用高光谱数据,非线性LS-SVM模型比线性PLS模型更适合于香梨品质的定量预测。  相似文献   

5.
一种基于SCARS策略的近红外特征波长选择方法及其应用   总被引:4,自引:0,他引:4  
针对近红外光谱数据的内在特点,提出了一种基于稳定性竞争自适应重加权采样(stability competitive adaptive reweighted sampling, SCARS)策略的近红外特征波长优选方法。该方法以PLS模型回归系数的稳定性作为变量选择的依据,其过程包含多次循环迭代,每次循环均首先计算相应变量的稳定性,而后通过强制变量筛选以及自适应重加权采样技术(ARS)进行变量筛选;最后对每次循环后所得变量子集建立PLS模型并计算交互验证均方根误差(RMSECV),将RMSECV值最小的集合作为最优变量子集。利用饲料蛋白固态发酵过程近红外光谱数据集对所提方法进行了验证,并与基于PLS的蒙特卡罗无信息变量消除法(MC-UVE)和竞争自适应重加权采样(CARS)方法所得结果进行了比较。试验结果显示: 建立在SCARS方法优选的21个特征波长变量基础上的PLS模型预测效果更好,其预测均方根误差(RMSEP)和相关系数(Rp)分别为0.054 3和0.990 8;该优选策略能有效地增强固态发酵光谱数据特征波长变量选择的准确性和稳定性,提高了模型的预测精度,具有一定的应用价值。  相似文献   

6.
基于紫外-可见光谱法的水质测量中,光谱信号易受到系统噪声干扰、悬浮物散射干扰,且存在信息冗余、多重共线性等特征,导致水质COD测量中特征波长的选取产生较大偏差。因此,提出了基于嵌入式粒子群-遗传(EPSO_GA)算法的水质COD检测特征波长优化算法,以提高波长选择精度。为验证检测特征波长优化算法的可行性,采集了某高校池塘水样、生活污水和排水沟水样的光谱数据,利用EPSO_GA算法对预处理后的光谱数据选取特征波长。EPSO_GA算法采用实数编码方法实现了粒子群(PSO)优化算法和遗传(GA)优化算法的统一编码,在PSO算法中更新粒子时嵌入GA算法的选择、交叉、变异等操作,改善了这两种算法各自在光谱波长特征选取问题上的局限性。将EPSO_GA算法选取的特征波长结合偏最小二乘法(PLS)构建了EPSO_GA_PLS的水质COD预测模型,并且与传统的PSO算法、GA算法选取特征波长建立的PSO_PLS、GA_PLS和全光谱构建的PLS水质COD预测模型做了对比。结果表明:与PSO_PLS,GA_PLS和全光谱构建的PLS水质COD预测模型相比,EPSO_GA改善了PSO算法和GA算法在光谱特征波长选择中早熟和收敛速度慢的问题,降低了全光谱构建PLS水质COD预测模型的复杂度,提高了模型的预测精度。基于EPSO_GA算法建立的EPSO_GA_PLS水质COD预测模型,均方根误差降到了0.212 3,预测精度增加到0.999 3,可以快速定量检测水质COD,为紫外-可见光谱法测COD提供了更好的预测模型。  相似文献   

7.
采用近红外(NIR)漫反射光谱法对新疆特色梨果库尔勒香梨的五种不同果(包括青头、粗皮、脱萼、宿萼、突顶果)的硬度进行测定。由于近红外光谱数据量大且原始光谱噪声明显、测定水果时散射严重等导致光谱建模时关键波长变量提取困难。以新疆库尔勒香梨为研究对象,为了有效地消除固体表面散射以及光程变化对NIR漫反射光谱的影响,首先采用标准正态变量变换(SNV)和多元散射校正(MSC)对库尔勒香梨的原始光谱进行预处理。为寻找适合近红外光谱检测库尔勒香梨硬度的最佳特征波长筛选方法,进行香梨近红外光谱的特征波长变量选择方法的比较与研究。研究比较了两种特征波长筛选方法对库尔勒香梨硬度偏最小二乘法(PLS)建模精度的影响。同时使用反向偏最小二乘(BiPLS)和遗传算法结合反向偏最小二乘(BiPLS-GA)在全光谱范围内筛选香梨硬度的特征波长变量,将校正均方根误差(RESMC)、预测均方根误差(RESMP)以及决定系数(R2)作为模型的评价标准,并最终确定最优波段选择方法及最佳预测模型。基于选择的特征波长变量建立的PLS模型(BiPLS-GA)与全光谱变量建立的PLS模型进行比较发现BiPLS-GA模型仅仅使用原始变量中6.6%的信息就获得了比全变量PLS模型更好的库尔勒香梨硬度的预测结果,其中R2,RMSEC和RMSEP分别为0.91,1.03和1.01。进一步与基于反向偏最小二乘算法(BiPLS)获得的特征变量建立的PLS模型比较发现,BiPLS-GA不仅可以去除原始光谱数据中的无信息变量,同时也能够对共线性的变量进行压缩去除,使得建模变量从301个减少到20个。极大地简化模型的同时有效地提高了模型的预测精准度和稳定性。因此该方法能够有效地用于近红外光谱数据变量的选择。证明了近红外光谱分析技术结合BiPLS-GA模型能够高效地选择出建模变量,去除与库尔勒香梨硬度无关的近红外光谱信息,显著地提高库尔勒香梨硬度定量模型的预测精度。这不仅为新疆地区特色梨果库尔勒香梨的快速、精确、无损优选分级提供一定的技术支持,同时也为基于近红外光谱分析技术预测水果内部品质的研究提供了参考。  相似文献   

8.
甲醇汽油是一种清洁能源,甲醇汽油中甲醇的含量决定了汽油的性能。通过中红外光谱对甲醇汽油中甲醇含量进行定量检测和分析。首先,对采集的甲醇汽油原始中红外光谱进行平滑处理(smoothing)、多元散射校正(MSC)、基线校正(baseline)、归一化(normalization)等预处理,再建立PLS模型,对比选择最佳预处理方法,结果表明:在多元散射校正(MSC)处理后建立的PLS模型效果最好,模型的预测集相关系数r为0.918,预测均方根误差RMSEP为2.107。为进一步简化模型,提高预测精度,采用无信息变量消除(uninformative variable elimination, UVE)方法对波长进行筛选,将UVE波段筛选之后的作为模型的输入变量,采用偏最小二乘法(partial least squares, PLS)、主成分回归(principal components regression, PCR)和最小二乘支持向量机(least square support vector machine, LSSVM)三种方法分别建立甲醇汽油中甲醇含量的定量预测模型,并比较不同模型的预测效果和结果。结果表明,使用无信息变量消除可以较好提高数据的运算速度,其中,UVE-PLS模型建模效果最好,r和RMSEP分别为0.923和2.075。该实验表明中红外光谱检测甲醇汽油中甲醇含量是可行的并可以得到较好的效果;UVE是一种对甲醇汽油的中红外光谱非常有效的波段筛选方法,该模型的建立对石油化工领域具有较为重要的意义。  相似文献   

9.
建立了牛肉基于TVB-N、菌落总数、pH值和肉色参数L*多个指标的储存期预测模型,利用可见近红外光谱(Vis/NIR)技术结合区间偏最小二乘(iPLS)和遗传算法(GA)建立了各个指标的PLS预测模型,实现了多指标综合无损快速预测4 ℃下牛肉的储存期。用iPLS和iPLS-GA提取有效波长变量建立PLS预测模型,以预测相关系数和预测标准差作为模型评价标准,结果表明用iPLS-GA选择变量建立的各个指标的PLS预测模型均优于全波段和iPLS组合的PLS模型。由多个指标的预测值和储存期的预测模型,对校正集和预测集样品储存期进行预测,其预测相关系数和标准差分别是0.903, 0.897和1.88, 2.24。说明利用光谱技术结合得出的储存期预测模型可以实现多指标综合预测牛肉储存期,为无损快速检测牛肉储存期或货架期提供了一种新方法。   相似文献   

10.
为实现苹果可溶性固形物(SSC)的便携式快速检测,利用环形光纤探头和微型光谱仪搭建便携式苹果可溶性固形物光谱采集系统,结合无信息变量消除(UVE)、遗传算法(GA)、竞争性自适应加权(CARS)算法筛选基于偏最小二乘(PLS)的苹果可溶性固形物的近红外光谱特征波长。另外,采用反向区间最小二乘支持向量机(BiLS-SVM)和GA算法优选基于LS-SVM的特征波长变量,分别建立所选特征波长和全波段的PLS模型和LS-SVM模型。试验结果表明,经过GA-CARS算法从全波段1 512个波长中筛选出的50个特征波长建立的PLS模型效果最好,其预测相关系数和预测均方根误差分别为0.962和0.403°Brix。利用该检测装置结合GA-CARS筛选的特征波长,可有效简化苹果可溶性固形物近红外便携式检测模型并提高模型的预测精度,为进一步构建便携式苹果可溶性固形物检测设备奠定了基础。  相似文献   

11.
基于遗传算法的苹果糖度近红外光谱分析   总被引:12,自引:0,他引:12  
遗传算法(GA)应用在偏最小二乘法(PLS)校正模型的波段优化选择中具有显著的效果。将遗传算法用于波段选择, 能更快达到最优解, 有效提高测量精度,减少建模所用变量。文章研究了在近红外苹果糖度无损检测中,遗传算法作为模块进行波段选择,建立了GA-PLS模型;为了说明遗传算法优选波段可行性,另外建立了全谱和经验谱区的PLS定量模型,并评价了模型的稳健性。首先对傅里叶变换近红外光谱进行多元散射校正、Savitky-Golay卷积平滑后,用遗传算法优选波段(R-SGA),参与建模数据点从原始1 550减少到434个。然后采用一阶导数光谱建立GA-PLS模型,相比全谱PLS(1 550个数据点)和经验谱区PLS(717个数据点)模型具有更高的预测精度,其建模结果为RC=0.966,RMSEC=0.469,RP=0.954,RMSEP=0.797。结果表明, 遗传算法可用于PLS法建立苹果糖度校正模型前的数据优化筛选, 有效提高测量精度, 并减少建模变量。  相似文献   

12.
利用反向区间偏最小二乘法(BiPLS)定位光谱糖度若干信息区间,运用遗传算法(GA)从中选择波长点,建立了多元线性回归(MLR)模型。光谱进行卷积平滑和二阶导数处理后,将光谱(225个数据点)分割成25个子区间时,BiPLS优化结果最优。在所定位的信息区间进行GA二次选择特征变量,运行100次依次选择入选频率较高的12个波长点。为简化MLR模型,对于入选的相邻波长选择频率较高者,最后选择 638,734,752,868,910,916和938 nm作为回归变量,建立的MLR预测模型相关系数(R2)、校正均方根误差(RMSEC)和预测均方根误差(RMSEP)分别为0.984,0.364和0.471,优于常用的逐步多元线性回归的建模结果。表明BiPLS结合GA可以有效地对李子糖度可见/近红外光谱MLR回归变量进行筛选,提高了模型的精度。  相似文献   

13.
应用激光诱导击穿光谱(LIBS)技术研究了快速检测咖啡豆中咖啡因含量的可行性。将咖啡豆磨粉压成片状作为采集LIBS光谱数据的样本,应用原子吸收分光光度计测量每个样本中咖啡因的含量。应用基线校正,小波变换和归一化等数据预处理方法;针对基于全部变量的偏最小二乘(PLS)模型会出现过拟合,分别应用回归系数和主成分分析(PCA)选择特征变量,并建立了基于特征变量的PLS和BP神经网络模型。结果表明:基于回归系数所选特征变量的PLS模型中,建模集相关系数Rc=0.96,预测集Rp=0.91;基于PCA提取特征变量的PLS模型中,Rc=0.94,Rp=0.90;基于PCA所选特征变量的BP神经网络模型中,Rc=0.96,Rp=0.96。两种方法所提取特征变量均对应C,H,O,N,Na,Mn,Mg,Ca和Fe,且基于上述两种方法所选特征变量的PLS模型均对预测集样本有较好的预测结果,说明上述元素与咖啡因含量存在联系,应用回归系数和PCA选择的特征变量是有效的,但是咖啡豆内C,H,O,N,Na,Mn,Mg,Ca,Fe与咖啡因含量的确切关系需要进一步研究。基于PCA所选特征变量的BP神经网络模型有更优的预测结果,说明所选特征变量适用于不同的建模方法。研究表明LIBS技术结合化学计量学方法可以实现咖啡豆中咖啡因含量的快速检测。  相似文献   

14.
近红外光谱技术结合特征变量筛选快速检测绿茶滋味品质   总被引:11,自引:0,他引:11  
茶汤滋味是茶叶品质的核心,该研究利用近红外光谱技术快速榆测绿茶滋味品质.试验以滋味化学鉴定法作为绿茶滋味品质检测的标准方法,试验得到的滋味总得分值作为近红外光谱预测模型的参考测量值.在模型建立过程中,首先利用联合区间偏最小二乘法(sipLS)筛选特征子区间;然后,用遗传算法(GA)在特征子区间内优选特征变量.最优模型在...  相似文献   

15.
光谱数据压缩、信息变量提取是近红外应用研究的热点,是简化模型、提高预测精度的重要手段。本文以杏可见/近红外光谱为例,采用二阶导数、标准化和正交信号校正(OSC)处理以滤除光谱与浓度阵无关的信号;使用SCMWPLS选择出880,894~910和932 nm为建模区间建立PLS预测模型,其相关系数(R)、校正误差(SEC)和预测误差(SEP)分别为0.920,0.454和0.470;进行独立运行GA程序100次,依次选择入选频率较高的2个波长点888和900 nm作为回归变量,建立GA-MLR预测模型,其R, SEC, SEP分别为0.905,0.488和0.459,均优于全谱的偏最小二乘建模结果。结果显示,OSC可以滤除光谱与浓度阵无关的信号,减少建立模型所用的主因子数;SCMWPLS和GA可以寻找最优信息变量组合。该方法对于建立低维度、高精度近红外快速分析模型具有普遍参考意义。  相似文献   

16.
遗传算法结合偏最小二乘法无损评价西洋梨糖度   总被引:4,自引:0,他引:4  
基于遗传算法的波段选择法在组合优化问题上具有很大的搜索优势,适应性很广。文章将该方法应用于西洋梨糖度近红外光谱分析中,探讨数据优化筛选的可行性。光谱经多元散射校正或标准归一化处理后进行波段选择,选择结果与样品中被测成分有关, 4个品种洋梨的最佳个体染色体编码有一定共性。分别建立了四种洋梨的GA-PLS模型和全谱模型,早红考密斯、五九香、凯斯凯德和康佛伦斯的GA-PLS建模数据点分别从1 557减少到了434,496,310和496。GA-PLS/Fr-PLS模型的预测标准偏差分别为0.428/0.518,0.696/0.694,0.425/0.421和0.567/0.633, 其中早红考密斯和康佛伦斯GA-PLS模型的预测精度明显优于全谱模型,而五九香和凯斯凯德的GA-PLS模型与全谱模型相近。结果表明,遗传算法用于PLS建立西洋梨糖度校正模型前的数据优化筛选是可行的, 有效提高测量精度, 减少建模变量。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号