首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 173 毫秒
1.
近红外高光谱图像结合CARS算法对鸭梨SSC含量定量测定   总被引:3,自引:0,他引:3  
高光谱数据量大、 维数高且原始光谱噪声明显、 散射严重等特征导致光谱建模时关键波长变量提取困难。 基于此,提出采用竞争性自适应重加权算法(CARS)对近红外高光谱数据进行关键变量选择。 鸭梨作为研究对象。 采用决定系数r2、 预测均方根误差RMSEP和验证集标准偏差和预测集标准偏差的比值RPD值进行模型性能评估。 基于选择的关键变量建立PLS模型(CARS-PLS)与全光谱变量建立的PLS模型进行比较发现CARS-PLS模型仅仅使用原始变量中15.6%的信息获得了比全变量PLS模型更好的鸭梨SSC含量预测结果,r2pre,RMSEP和RPD分别为0.908 2,0.312 0和3.300 5。 进一步与基于蒙特卡罗无信息变量MC-UVE和遗传算法(GA)获得的特征变量建立的PLS模型比较发现,CARS不仅可以去除原始光谱数据中的无信息变量,同时也能够对共线性的变量进行压缩去除,该方法能够有效地用于高光谱数据变量的选择。 结果表明,近红外高光谱技术结合CARS-PLS模型能够用于鸭梨可溶性固形物SSC含量的定量预测。 从而为基于近红外高光谱技术预测水果内部品质的研究提供了参考。  相似文献   

2.
为了探讨近红外光谱分析技术检测完整烟叶化学成分的可行性,利用近红外光谱分析技术,对初烤完整烟叶的光谱采集方式及总植物碱定量分析建模方法进行了研究。以云南省昆明市不同乡镇、不同品种的初烤烟叶为研究对象,分别采用烟叶的叶尖、叶中、叶基光谱及其平均光谱建立初烤完整烟叶总植物碱近红外偏最小二乘法(PLS)定量分析模型以选择出代表完整烟叶信息的建模光谱;分别用KS和SPXY方法对样品的校正集进行选择,采用向后区间偏最小二乘法(BiPLS)、无信息变量消除法(UVE)、竞争适应性重加权采样法(CARS)等选择特征变量,对模型进一步优化。研究结果表明,采用叶尖、叶中、叶基3个部位的平均光谱建立的模型相比单独每个部位光谱所建立模型的预测精度提高了8.5%~9.5%,与全光谱建模相比,用KS-BiPLS建立模型能明显改善模型的预测能力,模型的预测精度约提高了10%,模型的校正集决定系数和均方根误差分别为0.917 4和0.226 1,检验集决定系数和预测均方根误差分别为0.902 0和0.200 7。本研究方法适用于完整的初烤烟叶,无需对样品进行预处理,对于大量的初烤烟叶,能够快速、无损测定烟叶总植物碱含量,可以节省大量的时间。同时,该研究为初烤烟叶分级、提高原料的品质提供技术支持,也将为卷烟生产的过程控制提供科学依据。  相似文献   

3.
特征变量选择和回归方法相结合的土壤有机质含量估算   总被引:1,自引:0,他引:1  
针对高光谱数据量大、信息冗余严重的现象,应用稳定竞争性自适应重加权采样(sCARS)、连续投影算法(SPA)、遗传算法(GA)、迭代保留有效信息变量(IRIV)和稳定竞争性自适应重加权采样结合连续投影算法(sCARS-SPA),从全波段光谱数据中筛选特征变量,并利用全波段和特征波段建立偏最小二乘回归(PLSR)、支持向量机(SVM)和随机森林(RF)模型预测土壤有机质含量。结果表明, PLSR和SVM模型结合特征变量选择,不仅提高了模型运算效率,而且模型预测能力较全波段均有一定提高;RF模型采用特征变量建模,对模型精度的提高不是十分明显,但其构建模型的变量数量却显著减少,大大提高建模效率。RF模型精度优于SVM和PLSR模型,IRIV结合RF建立的土壤有机质含量预测模型,变量数仅63个,校准集和验证集模型决定系数(R~2)分别为0.941和0.96,验证集相对分析误差(R_(PD))为4.8。与全波段建模相比,特征变量选择和回归方法相结合,在保证模型精度的同时,可有效提高建模效率。  相似文献   

4.
近红外光谱分析以其简便、快速、高效、低成本、绿色环保等优点,已广泛应用于诸多领域。然而,近红外光谱同时存在变量维度高、多重共线性、包含冗余信息和高频噪声等问题,直接构建预测模型不但增加建模复杂度,同时也会影响模型的预测性能和泛化能力,因此提出一种基于改进和声搜索算法(HS)的光谱特征变量选择方法。HS常用于解决特征变量优化选择问题。在应用和声搜索算法进行最优光谱变量选择时,首先通过偏最小二乘(PLS)载荷系数计算各光谱点的特征贡献度,作为和声搜索算法改进的扰动权重。算法优选光谱特征变量过程中,引入变量特征贡献度作为激励因子,采用随机遍历和激励因子共同作用的方式生成初始解向量。产生新和声向量时,应用变量特征贡献度作为惩罚项,通过加入平衡因子使选择参数随迭代次数而动态调整,从而适应光谱变量的搜索,增强搜索过程的遍历性和种群的多样性。为验证本算法的有效性,以烟叶样品烟碱、总糖、总氮三个指标的近红外光谱PLS建模应用为例,对采集的原始光谱进行预处理后,应用该方法对光谱变量进行优选,根据变量被选择的累积频次分别计算不同变量个数的模型预测性能,通过校正均方根误差(RMSEC)随变量增加的变化趋势确定最终选择的光谱特征变量。在训练集上分别建立各指标的PLS模型,应用测试集测试模型性能,并与全光谱、无信息变量消除法(UVE)和粒子群算法(PSO)进行比较。实验结果显示,应用该算法所选变量建立的烟碱、总糖和总氮三个模型的决定系数(R~2)分别为0.921 1, 0.925 7和0.941 2,预测均方根误差(RMSEP)分别为0.102 3, 1.034 6和0.053 1,与其他方法相比,光谱特征变量更少,同时R~2和RMSEP值更优。由此表明,改进的和声搜索算法能有效筛选特征光谱,降低建模复杂度,提升模型预测性能和泛化能力。  相似文献   

5.
近红外定量建模过程常以模型评价指标对样本集选择、光谱预处理方法、潜变量因子数、变量选择等参数进行逐步优选,然后采用优选参数建立模型,此建模过程并未充分考虑参数间的协同作用对模型的影响,导致模型的质量存在风险。系统建模思想将定量建模过程看作一个整体,将样本集选择、光谱预处理、变量筛选、校正等作为要素,基于要素间的关联性进行参数轨迹全局优化,优选出一组最佳建模参数来建立模型,从而保障模型质量。该研究基于系统建模思想开展了脑心通胶囊中丹酚酸B的近红外定量建模。采用高效液相色谱法对56份丹参样品中的丹酚酸B进行含量测定,同时采集其近红外光谱,采用D-最优设计样本集划分方法、光谱预处理方法、潜变量因子数及变量筛选方法作为自变量,以模型评价指标为因变量优选最佳建模参数轨迹并建立定量分析模型。结果表明,采用Kennard-Stone(K-S)算法从56份样本中选择3∶1的校正集样本、建模光谱波段为4 000~10 000 cm~(-1)、预处理方法为二阶求导和标准正则变量变换校正,潜变量因子数为7时所建立的定量分析模型效果最优。模型的校正标准偏差(RMSEC)、预测标准偏差(RMSEP)均为0.001 8,表明模型稳健且预测准确度高。校正决定系数(R~2_(cal))为0.994 0,预测决定系数(R~2_(pre))为0.995 2,相对分析误差(RPD)为9.19,表明模型可用于高质量的定量分析和预测。本研究基于系统建模思想,采用D-最优设计实现了建模参数轨迹全局优化,建立了丹酚酸B的定量分析模型并且显著提升了模型的稳健性和预测性,为高效、快速测定脑心通胶囊中丹酚酸B含量提供了方法,对脑心通胶囊中间体及成品的质量控制具有重要意义。  相似文献   

6.
基于CARS和K-S的马拉硫磷农药浓度吸收光谱预测模型研究   总被引:2,自引:0,他引:2  
利用马拉硫磷在紫外/可见光波长范围内的不同浓度梯度的吸光度光谱数据,建立其快速有效的定量预测分析模型。在预测模型的建立过程中,参与建模的波长变量和校正集样本的优劣对定量分析模型的预测能力有着决定性作用。首先对实验样本是否存在异常样本进行检查,然后将200.08~750.04 nm波长范围的光谱数据采用不同预处理方法并建立PLS模型,进而将预处理结果最优(均值中心化)的光谱数据采用竞争性自适应重加权采样(CARS)算法和蒙特卡洛无消息变量消除法(MC-UVE)分别筛选出关键波长变量并建立相应的PLS预测模型,模型结果表明, CARS算法在关键变量筛选的性能上优于MC-UVE算法;再将CARS算法筛选出的18个波长变量(为原来变量数的1.137 8%)结合Kennard-Stone (K-S)算法和蒙特卡洛交叉验证(MCCV)分别优选出的44个建模样本(原来样本数的88%)建立CARS-K-S_s-PLS和CARS-CCV_s-PLS定量预测模型,R■分别为0.998 2和0.998 9, RMSEP分别为0.863 4和1.026 2, RPD分别为24.163 5和20.330 1, CARS-K-S_s-PLS模型略优于CARS-CCV_s-PLS模型。结果表明, CARS算法能够淘汰与样本浓度相关性较弱的变量,同时有效剔除无关光谱信息, K-S算法能帮助选择更优的建模样本集,马拉硫磷农药的紫外/可见光吸收光谱结合CARS算法和K-S算法所建立的CARS-K-S_s-PLS模型能够用来定量预测马拉硫磷农药浓度。研究工作为利用光谱技术快速检测有机磷农药浓度提供一定的理论依据和实验基础,在有机磷农药快速检测领域具有良好的应用前景。  相似文献   

7.
可见光/近红外光谱模型是土壤属性预测的有效工具。波长优选在光谱建模过程中起着重要作用。文中首先利用从安徽省涡阳县采集的130个砂姜黑土土壤样本获得可见光/近红外光谱,然后利用平滑与多重散射校正联合的光谱预处理方式消除光谱中的无关变量和冗余信息以提高模型预测结果的相关性,再利用SPXY方法挑选建模集样本,分别利用连续投影算法和遗传算法进行波长优选,最后利用留一法进行交互验证建立有机质含量的主成分回归模型。研究结果显示:连续投影算法和遗传算法都可以有效地减少参与建模的波长数并提高模型的准确度,尤其是遗传算法能够更好地提高土壤有机质含量预测精度,其相关系数、预测均方根误差和相对分析误差分别达到0.9316,0.2142和2.3195。通过合适的特征波长选取,不仅计算量可以大大减少,预测精度也会有效提高。  相似文献   

8.
提出了一种基于烟叶近红外光谱(NIR)和烟叶电子鼻(EN)融合数据的烟叶年份判别的支持向量机分类模型。在NIR和EN数据融合的基础上,利用遗传算法来进行变量选择,再建立烟叶年份判别支持向量机模型,所得到的烟叶判别模型在训练集和独立测试集上都具有较高的准确率。建立的烟叶判别NIR-E-SVM模型的建模准确率达到100%,留一法准确率达到98.55%,对未知样本的预报准确率为90%。  相似文献   

9.
提出了一种基于烟叶近红外光谱(NIR)和烟叶电子鼻(EN)融合数据的烟叶年份判别的支持向量机分类模型。在NIR和EN数据融合的基础上,利用遗传算法来进行变量选择,再建立烟叶年份判别支持向量机模型,所得到的烟叶判别模型在训练集和独立测试集上都具有较高的准确率。建立的烟叶判别NIR-ESVM模型的建模准确率达到100%,留一法准确率达到98.55%,对未知样本的预报准确率为90%。  相似文献   

10.
可见光/近红外光谱模型是土壤属性预测的有效工具。波长优选在光谱建模过程中起着重要作用。文中首先利用从安徽省涡阳县采集的130个砂姜黑土土壤样本获得可见光/近红外光谱,然后利用平滑与多重散射校正联合的光谱预处理方式消除光谱中的无关变量和冗余信息以提高模型预测结果的相关性,再利用SPXY方法挑选建模集样本,分别利用连续投影算法和遗传算法进行波长优选,最后利用留一法进行交互验证建立有机质含量的主成分回归模型。研究结果显示:连续投影算法和遗传算法都可以有效地减少参与建模的波长数并提高模型的准确度,尤其是遗传算法能够更好地提高土壤有机质含量预测精度,其相关系数、预测均方根误差和相对分析误差分别达到0.931 6,0.214 2和2.319 5。通过合适的特征波长选取,不仅计算量可以大大减少,预测精度也会有效提高。  相似文献   

11.
针对高维空间下获取最优特征子集异常复杂和模型识别准确率较低的问题,提出了基于特征分层选择和融合度相结合的近红外光谱多类识别度量算法。首先引入跳跃度,构造了一种特征分层方法,将所有特征依据对样本的重要性程度划分不同的特征子集,从而避免了从原始特征数据逐个剔除无关特征构建特征子集的繁琐过程;同时又改进了样本的融合度,将其代替K最近邻分类器(KNN)中依据概率进行类别判断的方式,提高了分类器的识别精度,较好地解决了多类识别准确率较低的问题。为验证该算法的有效性,选取五类具有代表性382个烟叶样品为实验对象,构建了烟叶产地识别度量模型,并选取64个样本进行了模型测试,以预测均方根误差(RMSEP)、交互验证均方差(RMSECV)和相关系数(r)作为模型稳健性的评价指标,以产地识别准确率作为算法优劣评价标准。仿真实验结果表明,利用该算法构建的模型具有较低的RMSEP(0.117),RMSECV(0.106)和较高的r(0.973),平均识别准确率达到98.44%,性能明显优于其他算法,该算法对于高维光谱数据具有良好的识别性能。  相似文献   

12.
校正样本选择以及奇异样本剔除对于近红外光谱定量和定性建模非常重要。现有的识别奇异样本的方法一般都基于数据重心估计,需要一个经验的判断阈值,在很大程度上限制了其识别准确性和实用性。针对现有方法奇异样本识别准确率低的问题,改进了一种现有度量尺度-杠杆值,构造出一种新的基于强影响度的奇异样本识别算法。这种度量尺度在一定程度上减少了对数据重心的依赖,使正常样本更加聚集,拉开了奇异样本与正常样本的距离;同时,为了避免人工根据经验设定阈值的不合理性,引入统计学领域中跳跃度的概念,提出了一种自动阈值设定方法判别奇异样本。为了验证该算法的有效性,利用马氏距离、杠杆值-光谱残差法与该算法分别对200个代表性校正集样本中的异常样品进行剔除,然后通过偏最小二乘法(PLS)对剩余的校正集样本(以烟碱为指标)定量建模,并对60个代表性测试集样本进行预测,以交互验证均方根误差(RMSECV)、相关系数(r)和预测均方根误差(RMSEP)为评价指标比较各算法的优劣。实验对比结果表明,基于强影响度的奇异样本识别算法较现有方法明显提高了奇异样本识别的准确率,具有较低的RMSECV(0.104),RMSEP(0.112)以及较高的R(0.983),提高了模型的稳定性和预测能力。  相似文献   

13.
X射线荧光光谱分析作为一种以化学计量学为基础的定量分析技术,所建立模型优劣对结果的预测准确性显得十分重要。竞争性自适应重加权算法(CARS)采用自适应重加权采样技术,利用交互验证选出互验证均方根误差(RMSECV)值最低原则,寻出最优变量组合。为了进一步提高PLS模型的解释和预测能力,将竞争性自适应重加权算法(CARS)与X射线荧光光谱分析技术相结合,对土壤中重金属元素铅和砷进行特征波长变量筛选后建立偏最小二乘(PLS)模型。首先,利用CARS算法对铅含量密切相关的波长变量进行筛选,当采样次数为26次时,筛选出60个有效波长点;对砷含量密切相关的波长变量进行筛选,当采样次数为34次时,筛选出19个有效波长点;然后对优选出的波长点利用PLS方法分别建立土壤中铅和砷含量定量分析模型,并与经连续投影算法(SPA)及蒙特卡罗无信息变量消除(MC-UVE)方法波长变量筛选后所建立的PLS模型进行比较。结果显示:铅的CARS-PLS模型的预测集决定系数(R2)、交互验证均方根误差(RMSECV)、预测均方根误差(RMSEP)和相对预测误差(RPD)分别为0.995 5,2.598 6,3.228和9.401 1,砷的CARS-PLS模型的预测集R2,RMSECV,RMSEP和RPD分别为0.989 9,3.013 2,2.737 1和8.211 6;两元素的CARS-PLS模型性能均优于全波段PLS,SPA-PLS和MC-UVE-PLS模型。基于CARS-PLS的算法可以有效筛选出X射线荧光光谱特征波长点,在简化了建模复杂程度的同时,提高了模型的准确性和稳健性。  相似文献   

14.
应用傅里叶近红外技术建立快速定量分析烟草化学成分的数学模型 ,使用BrukerOptics公司的MPA型傅里叶变换近红外光谱仪 ,谱区扫描范围 12 0 0 0~ 4 0 0 0cm- 1 ,选择不同的谱区范围对烟碱、总糖和总氮三种组分的数学模型进行优化 ,结果显示不同谱区范围对同一组分数学模型影响有明显的差异 ,而且不同组分所选择的最佳建模谱区范围是不一样的 ,说明在模型优化过程中选择最佳谱区范围是非常关键的 ,烟碱、总糖和总氮三种组分模型的最佳谱区范围分别是 95 0 0~ 4 2 31 2cm- 1 ,75 0 2 1~ 4 2 4 6 7cm- 1 ,75 0 2 1~4 5 97 7cm- 1 ,三种组分最佳模型交叉检验的均方差 (RMSECV)分别为 0 0 815 ,0 80 8,0 0 5 6。  相似文献   

15.
Genetic algorithm (GA) has a significant effect in the band optimization selection of Partial Least Squares (PLS) correction model. Application of genetic algorithm in selection of characteristic bands can achieve the optimal solution more rapidly, effectively improve measurement accuracy and reduce variables used for modeling. In this study, genetic algorithm as a module conducted band selection for the application of hyperspectral imaging in nondestructive testing of corn seedling leaves, and GA-PLS model was established. In addition, PLS quantitative model of full spectrum and experienced-spectrum region were established in order to suggest the feasibility of genetic algorithm optimizing wave bands, and model robustness was evaluated. There were 12 characteristic bands selected by genetic algorithm. With reflectance values of corn seedling component information at spectral characteristic wavelengths corresponding to 12 characteristic bands as variables, a model about SPAD values of corn leaves acquired was established by PLS, and modeling results showed r = 0.7825. The model results were better than those of PLS model established in full spectrum and experience-based selected bands. The results suggested that genetic algorithm can be used for data optimization and screening before establishing the corn seedling component information model by PLS method and effectively increase measurement accuracy and greatly reduce variables used for modeling.  相似文献   

16.
采用二维相关光谱(2D-COS)技术,以氘代氯仿为溶剂,解析了丹参酮ⅡA和隐丹参酮标准品的近红外光谱(NIR)。丹参酮ⅡA和隐丹参酮二维相关切片谱在1 600~1 800,1 900~2 230和2 300~2 400 nm处有特征吸收,其中丹参酮ⅡA在1 640和2 140 nm处有不同于隐丹参酮的呋喃环双键一级倍频和组合频吸收,1 696 nm为丹参酮ⅡA和隐丹参酮分子中甲基伸缩振动二级倍频,1 726和1 740 nm处吸收为丹参酮ⅡA和隐丹参酮环己烯亚甲基伸缩振动二级倍频,2 146和2 220 nm为丹参酮ⅡA和隐丹参酮苯环C—C伸缩振动与C—H伸缩振动的组合频,2 300~2 400 nm处一系列峰为丹参酮ⅡA和隐丹参酮甲基伸缩振动与弯曲振动组合频吸收。以丹参酮提取物为载体,以丹参酮ⅡA和隐丹参酮光谱解析特征波段及组合间隔偏最小二乘(SiPLS)筛选特征波段分别建立偏最小二乘(PLS)定量模型,模型的决定系数R2均大于0.9,校正均方根误差(root mean of square error of calibration, RMSEC)和交叉验证均方根误差(RMSECV),预测均方根误差(RMSEP)均较小。结果表明,2D-COS技术解析特征波段与SiPLS波段筛选所建PLS模型均稳定。2D-COS技术使近红外定量模型更具解释性,可解析出结构差异特征吸收,同一波段可实现结构类似物的同时定量测定。  相似文献   

17.
为了快速检测马铃薯叶片的水分含量,并探究受到干旱胁迫时叶片含水率变化情况,利用高光谱成像对马铃薯叶片含水率进行检测和可视化研究。采集71个叶片,用烘干法对叶片水分梯度进行控制,共得到355个样本。使用高光谱分选仪器采集叶片862.9~1 704.2 nm(256个波长)的光谱成像数据,采用称重法测量含水率。利用Sample set partitioning based on joint X-Y distance(SPXY)算法将总样本按照2∶1的比例划分为建模集(240个样本)和验证集(115个样本)。对采集的数据进行光谱特征分析,本文分别用CA和RF两种算法,各筛选得到15个特征波长。基于CA筛选出相关系数高于0.96的15个波长分别为1 406.82,1 410.12,1 403.62,1 413.32,1 416.62,1 419.82,1 400.32,1 423.12,1 426.32,1 429.62,1 432.82,1 436.12,1 439.32,1 442.52和1 445.8 nm。基于RF算法筛选被选概率高于0.3的15个特征波长,按照被选择概率值从大到小排列,分别为1 071.62,1 041.12,1 222.52,1 465.22,1 397.02,1 449.02,1 034.32,1 523.22,976.42,1 172.52,979.82,1 165.82,1 037.72,1 426.32和869.8 nm。用CA和RF算法筛选到的特征波长建立PLSR模型,分别记为CA-PLSR模型和RF-PLSR模型。利用高精度模型检测结果,对马铃薯叶片含水率进行可视化分析,首先计算马铃薯叶片图像每个像素点的含水率,得到灰度图像,然后对灰度图像进行伪彩色变换,绘制出叶片含水率可视化彩色图像。为了体现马铃薯叶片烘干处理中含水率变化进程,用HSV彩色模型对样本叶片的伪彩色图像进行分割,获得分割图像结果,显示出在某含水率区间的叶片面积比例。结果显示,CA算法选取的15个波长均在1 400.3~1 450.0 nm范围内,CA-PLSR模型的建模精度(R2c)为0.975 5、建模集均方根误差(RMSEC)为2.81%,验证集精度(R2v)为0.933 2、验证集均方根误差(RMSEV)为2.31%。RF算法选取的特征波长分布范围较CA法选取范围广,具有局部“峰谷”特性,且RF-PLSR模型的建模集精度(R2c)为0.983 2、RMSEC为2.32%,验证集精度(R2v)为0.947 1、RMSEV为2.15%。选取RF-PLS模型计算马铃薯每个像素点的含水率,得到伪彩色变换图像,观察可知随着烘干时间的增加含水率逐渐下降;并能够从叶片结构角度看到,随着水分胁迫的加强,叶片从边缘开始失水,逐渐向叶片中间蔓延,其中叶茎和叶脉的含水率较其他部位高。计算得到叶片伪彩色图像中含水率大于90%,80%和70%的像素点占整个叶片图像的比例。利用高光谱成像技术可以实现马铃薯叶片的含水率检测与分布可视化表达,为监测马铃薯生长状况以及叶片含水率分析提供新的理论根据。  相似文献   

18.
以氘代氯仿为溶剂,以中药化学标准品厚朴酚为载体,采用二维相关光谱(Tow-dimensional correlation spectroscopy, 2D-COS)技术,采集近红外光谱(near infrared spectroscopy, NIR),由氘代氯仿纯溶剂与厚朴酚原始光谱的二维相关同步谱可知,厚朴酚在1 365~1 455, 1 600~1 720, 2 000~2 181和2 275~2 465 nm处有特征吸收,其中1 440 nm为酚基O—H伸缩振动基频的一级倍频谱带,1 679 nm为芳基C—H及与芳基相连的甲基C—H伸缩振动一级倍频谱带,2 117, 2 304, 2 339和2 370 nm为芳基C—H伸缩振动、弯曲振动和变形振动的组合频,2 445 nm为芳基相连的甲基C—H弯曲振动基频二级倍频谱带,这些波段为厚朴酚的特征归属。以藿香正气口服液复杂体系为载体,以厚朴酚光谱解析的特征波段与间隔偏最小二乘(interval partial least squares, iPLS)和组合间隔偏最小二乘(synergy interval partial least squares, SiPLS)筛选的特征波段分别建立偏最小二乘(partial least squares, PLS)定量模型,模型的决定系数R2calR2pre均大于0.99,校正均方根误差(root mean of square error of calibration, RMSEC),交叉验证均方根误差(root mean of square error of cross validation, RMSECV)和预测均方根误差(root mean of square error of prediction, RMSEP)均较小。结果表明,2D-COS技术解析厚朴酚所得波段建立的定量模型与iPLS和SiPLS波段筛选的模型均相对稳定,这使定量模型的波段选择更具有解释性。该研究为中药化学成分NIR光谱解析特征波段的归属提供方法参考,同时为NIR建模波段筛选提供借鉴和指导。  相似文献   

19.
润滑油是农业机械正常作业的必要物资,农业机械发动机工作的动力性、安全性、经济性以及寿命与润滑油状况有着紧密联系。污染浓度作为油液的综合评价指标,常规的实验室检测耗时长、成本高,所以开发高效的润滑油污染浓度检测技术具有重要意义。提出了一种基于近红外光谱技术的农机润滑油污染浓度的检测方法,同时针对随机蛙跳(RF)特征波长选择算法中迭代次数大,结果再现性低等缺点,提出了一种迭代保留信息变量的随机蛙跳(IRIV-RF)特征波长选择算法。该算法一方面利用迭代保留信息变量(IRIV)算法提取出强信息变量和弱信息变量,将其作为RF算法中的初始变量集,消除初始变量集的随机性对结果再现性的影响。另一方面通过对变量按被选概率值由大到小正向排序后,从首个波长开始依次增加一个波长建立偏最小二乘回归(PLSR)模型,选择交叉验证均方根误差(RMSECV)值最小时的变量子集为特征波长,消除RF算法所提取的特征波长数量的不确定性。利用近红外光谱仪采集自行配制的101份不同污染浓度的农机润滑油原始光谱数据,选用三种不同的预处理方法分别对原始光谱进行处理,确定最佳的预处理方法为变量标准化(SNV)。在此基础上通过RF,IRIV和IRIV-RF三种算法分别对全谱进行特征波长选择,并建立PLSR模型。通过对全谱-PLSR,RF-PLSR,IRIV-PLSR以及IRIV-RF-PLSR模型的预测精度进行比较,结果表明,经过IRIV-RF算法提取特征波长后所建立的PLSR模型预测精度最高,预测相关系数(Rp)为0.965 7,预测均方根误差(RMSEP)为9.0584,显著提升了预测精度与运行效率,降低模型复杂程度。IRIV-RF是一种有效的特征波长选择算法,研究证明了近红外光谱联合改进的IRIV-RF算法检测农机润滑油污染浓度的可行性,为鉴定润滑油品质提供了一种新的思路。  相似文献   

20.
在近红外光谱分析模型中全谱信息通常含有大量冗余信息,会导致模型解析时间延长、 加大模型解析难度,因此如何快速有效地选取特征波长至关重要。采用基于间隔偏最小二乘(interval partial least squares, IPLS)结合连续投影算法(successive projections algorithm, SPA)对小麦秸秆发酵过程微生物生物量进行特征波长选择,共制备85个样本,采用氨基葡萄糖法测定微生物生物量,选择68个样本作为校正集,17个样本作为验证集。首先对全谱区520个波长点根据间隔点大小10, 20, 30, 40进行分段建模,选取出4 450~4 925和9 194~9 993 cm-1两个波段范围作为特征波段,将选取出的特征波段再进行连续投影算法及遗传算法(genetic algorithm, GA)特征波长点选取,并进行综合分析对比。实验结果表明采用IPLS-SPA算法选择4 450~4 925和9 194~9 993 cm-1的组合波段具有最佳建模效果,相比于全谱建模其参与建模的波长点由520个减少到10个,模型验证集决定系数(R-Square, R2)从0.884 9提升至0.945 28,验证集均方误差根(root mean square error prediction, RMSEP)从11.104 9降至8.203 3,GA遗传算法虽取得了更优的模型精度,但其实验结果并不稳定且随机性较强,而IPLS结合SPA方法能够稳定而准确的(地)选择特征波长信息,提高模型运算速度并降低模型拟合难度,可以作为一种新的波段选择参考方法。结果表明采用近红外光谱分析方法对秸秆发酵生物量进行快速检测是可行的。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号