首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 171 毫秒
1.
用遗传区间偏最小二乘法建立苹果糖度近红外光谱模型   总被引:4,自引:2,他引:4  
为了简化苹果糖度预测模型和提高模型的精度,用遗传区间偏最小二乘法(GA-iPLS)建立苹果近红外光谱预测模型.应用结果表明,整个光谱划分为40个子区间,GA-iPLS选择其中的第4,6,8,11,18号共5个子区间联合建立苹果糖度模型.遗传区间偏最小二乘法所建的模型,其校正时的相关系数rc和交互验证均方根误差RMSECV分别为0.962和0.334 6,预测时的相关系数rp和预测均方根误差RMSEP分别为0.932和0.384 2.与全光谱模型相比,该方法建立的模型不论对校正集还是预测集,模型的预测能力都提高了许多,且模型得到了很大的简化:其实际采用的波数点个数比全光谱模型采用的波数点个数大大减少,主因子数也比全光谱少,由此建立的模型更加简洁、数据运算量也更少.  相似文献   

2.
河套蜜瓜是我国西北河套地区独具特色的果品,一直深受消费者的喜爱。糖度(sugar content)是衡量蜜瓜品质和成熟度重要指标。采用Maya 2000pro便携式光谱仪和PR-101ɑ便携式数字折光仪获取"金红宝"蜜瓜光谱信息及糖度值,研究了不同特征波长提取方法:逐步多元线性回归(SMLR)、间隔偏最小二乘法(iPLS)、反向区间偏最小二乘法(biPLS)以及联合区间偏最小二乘法(siPLS))对蜜瓜样品模型精度和预测结果的影响。结果表明:采用biPLS特征波长提取方法将全波段光谱均匀分成20个子区间,PLS因子数为14,当剔除其中8个子区间,选择的波长变量数为218时,得到的biPLS模型最佳,对应的校正集和预测集的RMSE分别为0.996 1和1.18。采用biPLS光谱波长筛选方法可以有效地提取蜜瓜糖度的特征波长,提高建模预测能力,实现蜜瓜糖度的快速检测。  相似文献   

3.
近红外光谱信息的筛选方法是近红外光谱技术简化模型和提高预测精度的重要手段,为选择近红外光谱分析中最优的建模光谱波段,提出区间组合移动窗口偏最小二乘法(SCMWPLS)。该方法通过大小连续变化的移动窗口和交叉有效性筛选出连续的建模区间。以葡萄糖溶液的近红外光谱为测试对象,分别采用所提方法以及传统的间隔偏最小二乘法(IPLS)和窗口移动偏最小二乘法(MWPLS)建立近红外光谱预测模型。所提方法与传统的间隔偏最小二乘法和窗口移动偏最小二乘法模型相比,预测均方根误差分别降低了44%和25%。  相似文献   

4.
一种近红外光谱特征子区间选择新算法   总被引:2,自引:0,他引:2  
为了简化光谱模型和提高模型精度,在传统遗传算法中引入Metropolis接受准则,提出了一种新的模拟退火-遗传区间选择算法(SAA-GA-iPLS),用于快速提取近红外光谱特征子区间,采用偏最小二乘法(PLS)建立近红外光谱模型。以黄瓜叶近红外光谱数据及其类胡萝卜素含量为例,将全光谱分为40个区间,模拟退火-遗传算法能快速优选出7个子区间(分别为第3,5,14,18,21,32,33子区间),在所选7个子区间的基础上建立了黄瓜叶类胡萝卜素PLS光谱模型。与传统遗传算法的比较结果表明:无论是建模效果还是算法执行效率,模拟退火-遗传算法均优于传统遗传算法。  相似文献   

5.
将近红外光谱技术和化学计量学相结合分析慈竹纤维素结晶度。通过区间偏最小二乘法(iPLS)、联合区间偏最小二乘法(siPLS)和反向区间偏最小二乘法(biPLS)优化建模区域,建立经多元散射校正后光谱的结晶度分析模型,并与全光谱范围350~2 500nm建立的偏最小二乘(PLS)模型进行比较。结果表明,三种改进偏最小二乘法建立的结晶度模型预测效果均优于PLS模型,并且当采用联合区间偏最小二乘法将全光谱进行30个子区间划分,选择三个子区间[8 12 19]组合时,建立的siPLS模型预测效果最好,相关系数(r)达到0.88,预测标准差(RMSEP)为0.0117。因此,采用联合区间偏最小二乘法可以有效选择建模光谱区域,提高模型预测能力,实现慈竹纤维素结晶度的快速预测。  相似文献   

6.
为实现苹果可溶性固形物(SSC)的便携式快速检测,利用环形光纤探头和微型光谱仪搭建便携式苹果可溶性固形物光谱采集系统,结合无信息变量消除(UVE)、遗传算法(GA)、竞争性自适应加权(CARS)算法筛选基于偏最小二乘(PLS)的苹果可溶性固形物的近红外光谱特征波长。另外,采用反向区间最小二乘支持向量机(BiLS-SVM)和GA算法优选基于LS-SVM的特征波长变量,分别建立所选特征波长和全波段的PLS模型和LS-SVM模型。试验结果表明,经过GA-CARS算法从全波段1 512个波长中筛选出的50个特征波长建立的PLS模型效果最好,其预测相关系数和预测均方根误差分别为0.962和0.403°Brix。利用该检测装置结合GA-CARS筛选的特征波长,可有效简化苹果可溶性固形物近红外便携式检测模型并提高模型的预测精度,为进一步构建便携式苹果可溶性固形物检测设备奠定了基础。  相似文献   

7.
黄酒糖度预测的可见-近红外光谱方法研究   总被引:5,自引:0,他引:5  
刘飞  何勇  王莉 《光学学报》2007,27(11):2054-2058
提出了用可见近红外光谱结合不同化学计量学方法预测黄酒糖度的新方法。用240个黄酒样本建模,60个样本进行预测。通过对光谱数据进行平滑、变量标准化及一阶导数等预处理,建立并比较了偏最小二乘法,小波变换与偏最小二乘法相结合,主成分分析与人工神经网络相结合以及主成分分析与最小二乘支持向量机相结合四种不同建模方法的预测精度,以相关系数r、预测标准差、偏差等为评判标准,得到黄酒糖度预测的最优模型为最小二乘支持向量机模型。该模型对黄酒糖度预测的相关系数为0.962、预测标准差为0.021、偏差为-0.001,获得了理想的预测精度。结果表明应用可见近红外光谱对黄酒糖度进行预测是可行的,且最小二乘支持向量机模型能得到最优的预测结果。  相似文献   

8.
为了提高苹果可溶性固形物含量近红外光谱校正模型的预测能力和稳健性,分别采用反向区间偏最小二乘法、遗传算法和连续投影算法,筛选苹果可溶性固形物的近红外光谱变量,并建立了偏最小二乘回归模型。利用遗传算法筛选的141个变量建立的校正模型,预测效果最好,与全谱建立的校正模型比较,预测相关系数,从0.93提高到0.96,预测均方根误差,从0.30°Brix降低到0.23°Brix。实验结果表明遗传算法结合偏最小二乘回归方法,有效地提高了苹果可溶性固形物近红外光谱检测模型的预测精度。  相似文献   

9.
以新疆艾比湖湿地保护区采集的300个荒漠土壤样品为研究对象,利用ASD Field Spec○R3HR光谱仪获取的土壤可见-近红外光谱数据以及化学分析获取的土壤全磷数据为数据源,将原始光谱数据经过卷积平滑、标准正态变量变换以及一阶微分预处理后,采用蚁群-遗传结合区间偏最小二乘法提取荒漠土壤全磷含量特征波长,构建土壤全磷含量偏最小二乘回归预测模型;并与全谱偏最小二乘、蚁群-区间偏最小二乘、遗传-偏最小二乘模型进行比较。结果表明:经蚁群-区间偏最小二乘法筛选后,荒漠土壤全磷特征波段为500~700,1 101~1 300,1 501~1 700,1 901~2 100nm;进一步采用遗传-区间偏最小二乘法进行变量选择,得到共线性最小的13个有效波长,分别为:1 621,546,1 259,573,1 572,1 527,564,1 186,1 988,1 541,2 024,1 118和1 191nm。建模方法比较显示,采用蚁群-遗传结合区间偏最小二乘法选择的特征变量,建立的模型精度最高,其次是遗传算法、蚁群算法和全光谱。蚁群-遗传结合区间偏最小二乘法建立的土壤全磷含量的模型,效验证均方根误差RMSECV以及预测集均方根误差RMSEP分别为0.122和0.108mg·g-1,效验证相关系数Rc以及预测集的相关系数Rp分别为0.535 7,0.555 9。因此,经过卷积平滑、标准正态变量变换以及一阶微分预处理,并利用蚁群-遗传结合区间偏最小二乘法建立的模型不仅简单,而且具有较高的预测精度和较好的稳健性,可以估算荒漠土壤全磷含量。  相似文献   

10.
利用傅里叶近红外光谱(FT-NIRS)测定了苹果的硬度.通过使用几种基于遗传算法和间隔偏最小二乘法的特征波长选取方法,包括动态向后间隔偏最小二乘(dynamic backward version of interval PLS,dynamic biPLS)、动态向后间隔偏最小二乘结合遗传算法(dynarmic biPLS & GA-PLS)和反复的遗传算法(iterative GA-PLS),分析了苹果硬度的特征波长.结果表明,运用遗传算法和间隔偏最小二乘选择特征波长后,不但可以降低模型的复杂度,同时能够达到提高模型预测精度的效果.在此基础上,研究分析了苹果硬度特征波长的物理化学意义.由于果胶是在苹果成熟过程中一种和硬度有很大关联的物质,通过比较苹果硬度的特征波长和果胶的特征吸收峰,发现两者具有有很好的一致性.因此,采用遗传算法和间隔偏最小二乘法得到的苹果硬度的特征波长能够反映果胶的吸收信息,从而解释了近红外技术检测苹果硬度的机理.  相似文献   

11.
利用近红外光谱技术结合组合区间偏最小二乘(SiPLS)、竞争性自适应重加权(CARS)、连续投影算法(SPA)、无信息变量消除(UVE)特征提取方法,运用深度信念网络(DBN)建立蓝莓糖度的通用检测模型,实现蓝莓糖度在线无损快速检测。采集了“蓝丰”和“瑞卡”共280个蓝莓样本的近红外光谱,采用手持折光仪测定其糖度;首先利用联合X-Y的异常样本识别方法(ODXY)检测到蓝丰和瑞卡蓝莓分别有2个和4个样本呈现异常,剔除该6个异常样本,对其余274个样本利用光谱-理化值共生距离算法(SPXY)以3∶1的比例划分出训练集和测试集;其次,对比分析卷积平滑(S-G平滑)、中心化、多元散射校正等预处理对蓝莓原始光谱的改善效果,运用SiPLS对光谱降维,筛选特征波段,利用CARS,UVE和SPA方法对特征波段进行二次筛选,以最优的特征波长建立DBN和偏最小二乘回归(PLSR)模型。结果表明,蓝莓糖度近红外检测模型的最优预处理方法为S-G平滑,SiPLS方法挑选的蓝莓糖度最优波段为593~765和1 458~1 630 nm,UVE算法从SiPLS筛选的346个变量中优选出159个最佳波长。建立蓝莓糖度DBN模型时,分析了不同隐含层数对检测模型的影响,并以交互验证均方根误差(RMSECV)作为适应度函数,利用粒子群算法(PSO)对各隐含层神经元个数在[1,100]之间寻优,发现隐含层为3层且隐含层节点数为67-43-25时,DBN模型的RMSECV达到最小,为0.397 7。无论是以全光谱还是特征波长建模,蓝莓糖度近红外DBN模型均优于常规PLSR方法;尤其以UVE方法二次筛选的特征波长建立的模型大大减少了建模变量,且模型精度更高,蓝莓糖度最优的PLSR模型测试集相关系数(RP)为0.887 5,均方根误差(RMSEP)为0.395 9,最优DBN模型RP为0.954 2,RMSEP为0.310 5。研究表明,利用SiPLS-UVE进行特征提取,结合深度信念网络方法建立的蓝莓糖度检测模型可以更好地完成蓝莓糖度在线精准分析,该方法有望应用于蓝莓及其他果蔬内部品质检测。  相似文献   

12.
基于遗传算法的安溪铁观音品质快速评价研究   总被引:2,自引:0,他引:2  
为探究一种快速无损的安溪铁观音品质评价方法,利用遗传算法(GA)对茶样的近红外光谱特征波长进行筛选,结合偏最小二乘(PLS),建立全谱段的PLS定量模型与GA-PLS模型。结果表明,傅里叶变换近红外(FT-NIR)全谱段光谱在经过平滑+二阶导数+归一化处理后,PLS模型预测性能最高,建模结果为:校正集相关系数R_C=0.921,校正集均方根误差RMSEC=0.543,验证集相关系数R_P=0.913,验证集均方根误差RMSEP=0.665。选用近红外光谱6 670~4 000cm-1谱区,采用遗传算法进行特征波长筛选,参与建模数据点数从1 557缩减到408个。优选波段后,GA-PLS建模结果为:校正集相关系数R_C=0.959,校正集均方根误差RMSEC=0.413,验证集相关系数R_P=0.940,验证集均方根误差RMSEP=0.587。可见,GA-PLS模型的校正集和验证集的预测结果均优于全谱段PLS模型。结果说明,在传统的近红外光谱技术结合化学计量学方法的建模基础上,加入遗传算法进行波长筛选,能有效提高模型预测能力,实现方法学的创新研究,且GA-PLS品质评价模型具有较强的参考和推广价值,为提高我国茶叶品质的检测技术水平提供新的方法借鉴。  相似文献   

13.
智能优化算法应用于近红外光谱波长选择的比较研究   总被引:3,自引:0,他引:3  
近红外光谱(NIRS)是一种间接分析技术,其应用需建立相应的校正模型。为了提高模型的解释能力、预测准确度和建模效率,需要对NIRS进行波长选择,优选最小化冗余信息。智能优化算法是以生物的行为方式或物质的运动形态为背景,经过数学抽象建立算法模型,通过迭代计算来求解组合最优化问题,其核心策略是以某种目标函数为标准,基于多元校正建模并以逐步逼近的方法筛选出有效的波长点。选用蚁群优化(ACO)、遗传优化(GA)、粒子群优化(PSO)、随机青蛙(RF)和模拟退火(SA)5种智能优化算法对烟叶总氮和烟碱近红外光谱数据进行特征波长选择,结合偏最小二乘(PLS)算法,构建了多个烟叶总氮和烟碱的校正模型,结果显示:所选用两个数据集的总氮最优模型分别为PSO-PLS和GA-PLS模型,烟碱最优模型分别为GA-PLS和SA-PLS模型,五种智能优化算法所建模型预测性能并非全部优于全谱PLS模型,但是通过智能优化算法进行波长选择后建立的PLS模型大大简化,模型的预测精度、可解释性和稳定性均有所提高。同时也对优选波长进行了解释和分析,烟叶总氮特征波长优选组合为4 587~4 878和6 700~7 200cm-1;烟叶烟碱特征波长优选组合为4 500~4 700和5 800~6 000cm-1,优选出来的特征波长具有实际物理意义。  相似文献   

14.
近红外(NIR)光谱一般具有较多的波长变量数,对其直接或间接地进行变量选择是提高模型稳定性能及预测性能的关键。最小角回归(LAR)是一种相对较新和有效的机器学习算法,常用于进行回归分析和变量选择。面向光谱建模应用,提出一种LAR结合遗传偏最小二乘法(GA-PLS)的变量选择方法,可有效筛选出少数特征波长点。首先在全光谱区利用LAR消除变量间的共线性得到初筛波长点,然后用GA-PLS对LAR筛选出的波长点进一步优选从而得到最终建模用的特征波长点。为验证本文方法的有效性,以药片和汽油的近红外光谱回归分析作为应用案例,对原光谱进行预处理后,采用该方法进行变量筛选,然后分别建模其中的活性成分含量和C10含量。结果显示,在这两个应用中,最终优化得到的特征波长点数均只需七个,而两者的预测决定系数R2p分别达到0.933 9和0.951 9,与全光谱、无信息变量消除法(UVE)和连续投影算法(SPA)等方法相比,特征波长点更少,同时R2p和预测均方根误差RMSEP值更优。因此,LAR结合GA-PLS,能有效地从近红外光谱中选择出信息变量从而减少建模波数,提高预测精度,拥有较好的模型解释性。该方法可为特定领域的专用光谱仪设计提供有效的波长筛选工具。  相似文献   

15.
采用近红外(NIR)漫反射光谱法对新疆特色梨果库尔勒香梨的五种不同果(包括青头、粗皮、脱萼、宿萼、突顶果)的硬度进行测定。由于近红外光谱数据量大且原始光谱噪声明显、测定水果时散射严重等导致光谱建模时关键波长变量提取困难。以新疆库尔勒香梨为研究对象,为了有效地消除固体表面散射以及光程变化对NIR漫反射光谱的影响,首先采用标准正态变量变换(SNV)和多元散射校正(MSC)对库尔勒香梨的原始光谱进行预处理。为寻找适合近红外光谱检测库尔勒香梨硬度的最佳特征波长筛选方法,进行香梨近红外光谱的特征波长变量选择方法的比较与研究。研究比较了两种特征波长筛选方法对库尔勒香梨硬度偏最小二乘法(PLS)建模精度的影响。同时使用反向偏最小二乘(BiPLS)和遗传算法结合反向偏最小二乘(BiPLS-GA)在全光谱范围内筛选香梨硬度的特征波长变量,将校正均方根误差(RESMC)、预测均方根误差(RESMP)以及决定系数(R2)作为模型的评价标准,并最终确定最优波段选择方法及最佳预测模型。基于选择的特征波长变量建立的PLS模型(BiPLS-GA)与全光谱变量建立的PLS模型进行比较发现BiPLS-GA模型仅仅使用原始变量中6.6%的信息就获得了比全变量PLS模型更好的库尔勒香梨硬度的预测结果,其中R2,RMSEC和RMSEP分别为0.91,1.03和1.01。进一步与基于反向偏最小二乘算法(BiPLS)获得的特征变量建立的PLS模型比较发现,BiPLS-GA不仅可以去除原始光谱数据中的无信息变量,同时也能够对共线性的变量进行压缩去除,使得建模变量从301个减少到20个。极大地简化模型的同时有效地提高了模型的预测精准度和稳定性。因此该方法能够有效地用于近红外光谱数据变量的选择。证明了近红外光谱分析技术结合BiPLS-GA模型能够高效地选择出建模变量,去除与库尔勒香梨硬度无关的近红外光谱信息,显著地提高库尔勒香梨硬度定量模型的预测精度。这不仅为新疆地区特色梨果库尔勒香梨的快速、精确、无损优选分级提供一定的技术支持,同时也为基于近红外光谱分析技术预测水果内部品质的研究提供了参考。  相似文献   

16.
王爽  黄敏  朱启兵 《光子学报》2014,40(3):428-432
提出了一种无信息变量消除和偏最小二乘投影分析相结合的苹果高光谱散射图像最优波段选择方法.经该算法提取后的波段降为全谱的26%,将选择后的波段作为输入变量建立了苹果硬度的偏最小二乘预测模型.预测均方根误差由6.00N降为5.73N,相关系数也有所提高,并与遗传算法作了比较.结果表明,该算法能有效消除原光谱矩阵中冗余的信息,且不存在遗传算法中的参量选择随机性等缺点.该算法为高光谱散射图像最优波段选择提供了一个理想的方法.  相似文献   

17.
基于紫外-可见光谱法的水质测量中,光谱信号易受到系统噪声干扰、悬浮物散射干扰,且存在信息冗余、多重共线性等特征,导致水质COD测量中特征波长的选取产生较大偏差。因此,提出了基于嵌入式粒子群-遗传(EPSO_GA)算法的水质COD检测特征波长优化算法,以提高波长选择精度。为验证检测特征波长优化算法的可行性,采集了某高校池塘水样、生活污水和排水沟水样的光谱数据,利用EPSO_GA算法对预处理后的光谱数据选取特征波长。EPSO_GA算法采用实数编码方法实现了粒子群(PSO)优化算法和遗传(GA)优化算法的统一编码,在PSO算法中更新粒子时嵌入GA算法的选择、交叉、变异等操作,改善了这两种算法各自在光谱波长特征选取问题上的局限性。将EPSO_GA算法选取的特征波长结合偏最小二乘法(PLS)构建了EPSO_GA_PLS的水质COD预测模型,并且与传统的PSO算法、GA算法选取特征波长建立的PSO_PLS、GA_PLS和全光谱构建的PLS水质COD预测模型做了对比。结果表明:与PSO_PLS,GA_PLS和全光谱构建的PLS水质COD预测模型相比,EPSO_GA改善了PSO算法和GA算法在光谱特征波长选择中早熟和收敛速度慢的问题,降低了全光谱构建PLS水质COD预测模型的复杂度,提高了模型的预测精度。基于EPSO_GA算法建立的EPSO_GA_PLS水质COD预测模型,均方根误差降到了0.212 3,预测精度增加到0.999 3,可以快速定量检测水质COD,为紫外-可见光谱法测COD提供了更好的预测模型。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号