首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 171 毫秒
1.
基于遗传算法的安溪铁观音品质快速评价研究   总被引:2,自引:0,他引:2  
为探究一种快速无损的安溪铁观音品质评价方法,利用遗传算法(GA)对茶样的近红外光谱特征波长进行筛选,结合偏最小二乘(PLS),建立全谱段的PLS定量模型与GA-PLS模型。结果表明,傅里叶变换近红外(FT-NIR)全谱段光谱在经过平滑+二阶导数+归一化处理后,PLS模型预测性能最高,建模结果为:校正集相关系数RC=0.921,校正集均方根误差RMSEC=0.543,验证集相关系数RP=0.913,验证集均方根误差RMSEP=0.665。选用近红外光谱6 670~4 000 cm-1谱区,采用遗传算法进行特征波长筛选,参与建模数据点数从1 557缩减到408个。优选波段后,GA-PLS建模结果为:校正集相关系数RC=0.959,校正集均方根误差RMSEC=0.413,验证集相关系数RP=0.940,验证集均方根误差RMSEP=0.587。可见,GA-PLS模型的校正集和验证集的预测结果均优于全谱段PLS模型。结果说明,在传统的近红外光谱技术结合化学计量学方法的建模基础上,加入遗传算法进行波长筛选,能有效提高模型预测能力,实现方法学的创新研究,且GA-PLS品质评价模型具有较强的参考和推广价值,为提高我国茶叶品质的检测技术水平提供新的方法借鉴。  相似文献   

2.
将经典的卡尔曼滤波器与近红外光谱分析技术相结合,提出了一种新的特征波长变量选择方法——卡尔曼滤波法。分析了卡尔曼滤波器用于波长优选的原理,设计了波长选择算法并将其应用到大豆油脂酸价的近红外光谱检测中。首先利用偏最小二乘法(PLS)对油脂不同吸收波段建模,初步筛选出4 472~5 000 cm-1油脂酸价特征波段共132个波长点,然后进一步利用卡尔曼滤波器进行特征波长选择,从中优选出22个特征波长变量建立PLS校正模型,预测集决定系数R2、预测误差均方根RMSEP分别为0.970 8和0.125 4,与利用132个波长点建立的校正模型预测结果相当,而波长变量数减少到原来的16.67%。该波长变量选择算法是一种确定性的迭代过程,无复杂的参数设置和变量选择的随机性,物理意义明确。优选出少数对模型影响较大的特征波长变量以代替全谱建模,在简化模型的同时提高了模型的稳健性,为开发专用油脂近红外光谱分析仪器提供了重要参考依据。  相似文献   

3.
提出一种偏最小二乘法(PLS)和人工神经网络(ANN)结合用于近红外光谱(NIRS)的分析方法,以提高奶粉蛋白质模型的预测精度。首先采用基于遗传算法的波长选择法(RS-GA)优化光谱数据,建立GA-PLS模型预测奶粉蛋白线性部分;然后在RS-GA法选择的波段上进行主成分分析(PCA),以主成分的得分矩阵作为ANN模型输入层,以GA-PLS预测值与真实值之差作为输出层,建立PC-ANN模型预测其非线性部分。最终预测结果为两个模型预测值之和,以模型的预测标准偏差(RMSEP)作为评价指标,以便考察新方法的有效性。同时建立线性的全谱模型(Fr-PLS),其Fr-PLS、GA-PLS和GA-PLS+PC-ANN模型的RMSEP分别为0.511,0.440和0.235。结果表明:考虑奶粉蛋白含量近红外模型的非线性部分,可以显著提高模型的预测精度,该方法也可为其它复杂体系模型精度的提高提供借鉴。  相似文献   

4.
玉米秸秆纤维素和半纤维素NIRS特征波长优选   总被引:1,自引:0,他引:1  
预处理是提高玉米秸秆生物转化利用效率的有效途径。玉米秸秆经生物炼制转化为生物燃料时,转化率与其原料内的纤维素和半纤维素含量直接相关。为了实现对预处理后玉米秸秆的生物炼制过程的有效调控,提出使用近红外光谱(NIRS)对玉米秸秆的纤维素和半纤维素含量进行快速检测,解决传统化学方法测试速度慢、成本高的问题。为了提高NIRS检测的效率和精度,将遗传算法与模拟退火算法相结合构建遗传模拟退火算法(GSA)用于预处理后玉米秸秆纤维素和半纤维素含量NIRS特征波长优选。GSA算法以NIRS波长点数为码长进行二进制编码,以偏最小二乘法(PLS)回归模型的交叉验证均方根误差为目标函数,结合温度参数设计适应度函数,基于Metropolis判别准则实现扰动解的选择复制,能够在避免早熟的同时有效提高进化后期的搜索效率。采用碱预处理、生物预处理及其相结合的方法对采集的玉米秸秆进行预处理后制备样品120个,并测定其纤维素和半纤维素含量及NIRS。使用7点Savitzky-Golay平滑结合多元散射校正和标准正则变换对光谱进行预处理后,利用Kennard-Stone法按3∶1比例划分校正集和验证集。然后,使用GSA算法对NIRS全谱进行特征波长优选(记为Full-GSA)、对协同区间偏最小二乘法(SiPLS)优选后谱区进行特征波长优选(记为SiPLS-GSA)、对反向区间偏最小二乘法(BiPLS)优选后谱区进行特征波长优选(记为BiPLS-GSA),并使用PLS回归模型和验证集对特征波长优选结果进行评测。Full-GSA以全谱1 557个波长点为基因,执行16次算法,优选出118个纤维素特征波长点和164个半纤维素特征波长点。SiPLS-GSA经SiPLS优选的纤维素和半纤维素谱区波长点数分别为388个和160个,再经GSA进一步优选后得到157个纤维素特征波长点和148个半纤维素特征波长点。BiPLS-GSA经BiPLS优选的纤维素和半纤维素谱区波长点数分别为358个和180个,再经GSA进一步优选后得到130个纤维素特征波长点和153个半纤维素特征波长点。结果表明,通过波长优选,不仅参与建模的波长点数量显著减少,而且回归模型的性能显著优于全谱建模。其中,采用Full-GSA优选的纤维素特征光谱回归性能最佳,采用SiPLS-GSA优选的半纤维素特征光谱回归性能最佳。回归模型验证集的平均相对误差(MRE)分别为1.752 4%和2.020 8%,较全谱建模分别降低了13.636 6%和25.368 4%。基于结合温度参数设计适应度函数的策略构建的GSA具有良好的全局搜索性能,适用于玉米秸秆纤维素和半纤维素含量NIRS特征波长优选。GSA以全谱每个波长点为染色体基因的编码方案适用于NIRS全谱的特征波长优选。GSA同样适用于SiPLS和BiPLS优选后谱区的特征波长优选,能够有效实现优选后谱区的波长点优选。  相似文献   

5.
基于遗传算法的苹果糖度近红外光谱分析   总被引:12,自引:0,他引:12  
遗传算法(GA)应用在偏最小二乘法(PLS)校正模型的波段优化选择中具有显著的效果。将遗传算法用于波段选择, 能更快达到最优解, 有效提高测量精度,减少建模所用变量。文章研究了在近红外苹果糖度无损检测中,遗传算法作为模块进行波段选择,建立了GA-PLS模型;为了说明遗传算法优选波段可行性,另外建立了全谱和经验谱区的PLS定量模型,并评价了模型的稳健性。首先对傅里叶变换近红外光谱进行多元散射校正、Savitky-Golay卷积平滑后,用遗传算法优选波段(R-SGA),参与建模数据点从原始1 550减少到434个。然后采用一阶导数光谱建立GA-PLS模型,相比全谱PLS(1 550个数据点)和经验谱区PLS(717个数据点)模型具有更高的预测精度,其建模结果为RC=0.966,RMSEC=0.469,RP=0.954,RMSEP=0.797。结果表明, 遗传算法可用于PLS法建立苹果糖度校正模型前的数据优化筛选, 有效提高测量精度, 并减少建模变量。  相似文献   

6.
基于连续投影算法的土壤总氮近红外特征波长的选取   总被引:13,自引:0,他引:13  
讨论了如何利用连续投影算法提取土壤总氮的近红外特征波长.使用连续投影算法对光谱数据进行初步压缩,将优选出的波长按其对总氮贡献值的大小进一步筛选,剔除不敏感的波长,降低模型的复杂度.分析85份土壤样品的近红外光谱,使用连续投影算法得到了总氮的12个波长,贡献值筛选后,波长数量减少到6个,所建模型的预测相关系数(Rp)为0.913,预测均方根误差(RMSEP)为0.011%,模型的预测精度与贡献值筛选前相当,且优于全谱偏最小二乘回归结果.结果表明结合贡献值筛选的连续投影算法能够有效选取待测成分的特征波长,文章所优选的土壤总氮的6个特征波长可以作为小型滤光片式近红外光谱仪波长选择的参考依据.  相似文献   

7.
近红外光谱分析以其简便、快速、高效、低成本、绿色环保等优点,已广泛应用于诸多领域。然而,近红外光谱同时存在变量维度高、多重共线性、包含冗余信息和高频噪声等问题,直接构建预测模型不但增加建模复杂度,同时也会影响模型的预测性能和泛化能力,因此提出一种基于改进和声搜索算法(HS)的光谱特征变量选择方法。HS常用于解决特征变量优化选择问题。在应用和声搜索算法进行最优光谱变量选择时,首先通过偏最小二乘(PLS)载荷系数计算各光谱点的特征贡献度,作为和声搜索算法改进的扰动权重。算法优选光谱特征变量过程中,引入变量特征贡献度作为激励因子,采用随机遍历和激励因子共同作用的方式生成初始解向量。产生新和声向量时,应用变量特征贡献度作为惩罚项,通过加入平衡因子使选择参数随迭代次数而动态调整,从而适应光谱变量的搜索,增强搜索过程的遍历性和种群的多样性。为验证本算法的有效性,以烟叶样品烟碱、总糖、总氮三个指标的近红外光谱PLS建模应用为例,对采集的原始光谱进行预处理后,应用该方法对光谱变量进行优选,根据变量被选择的累积频次分别计算不同变量个数的模型预测性能,通过校正均方根误差(RMSEC)随变量增加的变化趋势确定最终选择的光谱特征变量。在训练集上分别建立各指标的PLS模型,应用测试集测试模型性能,并与全光谱、无信息变量消除法(UVE)和粒子群算法(PSO)进行比较。实验结果显示,应用该算法所选变量建立的烟碱、总糖和总氮三个模型的决定系数(R~2)分别为0.921 1, 0.925 7和0.941 2,预测均方根误差(RMSEP)分别为0.102 3, 1.034 6和0.053 1,与其他方法相比,光谱特征变量更少,同时R~2和RMSEP值更优。由此表明,改进的和声搜索算法能有效筛选特征光谱,降低建模复杂度,提升模型预测性能和泛化能力。  相似文献   

8.
近红外光谱数据量大,需要进行压缩,以降低建立光谱校正模型的计算复杂度,提高模型精度和稳健性。为此,提出了一种基于离散萤火虫算法(discrete firefly algorithm)的近红外光谱波长变量筛选方法。首先采用蒙特卡罗方法剔除异常值,并应用Kennard-Stone法进行校正样本的选择。对通用萤火虫算法进行离散化处理,改进了吸引度的自适应公式,在移动公式中增加了牵引权重,以适应离散化处理的影响和优化算法,并在离散萤火虫算法中加入精英保留策略,加快算法的收敛速度。实验中找到DFA算法中的各项参数中的最佳值。通过离散萤火虫算法优选波长变量,建立发酵液中丁二酸含量的近红外光谱偏最小二乘回归(partial least squares regression)校正模型。与标准遗传算法(genetic algorithm)优选波长方法进行了比较。结果显示,基于离散萤火虫算法的波长优选方法所建立的PLS校正模型,其校正集的相关系数(R2c)为0.986,RMSEC为0.409,预测集的相关系数(R2p)为0.969,RMSEP为0.458,模型稳健性和精度都要优于全光谱建模以及遗传算法波长优选方法。显示了DFA在近红外光谱数据筛选方面的优越性。  相似文献   

9.
王动民  张军  赵滨 《光谱实验室》2006,23(5):921-925
对模拟退火算法进行了优化,并以小麦粉样品的光谱为对象,利用优化后的算法在分子含氢基团一倍频区域1400-1860nm(7144-5376cm-1)优选出了分析小麦蛋白质含量的4个特征波长,结合多元线性回归(MLR)建立了定标模型.同时,利用这个谱区的全谱数据,结合偏最小二乘法(PLS)建立了另外一个模型.经过比较,发现这两个模型具有相同的预测效果.说明优化后的模拟退火算法能很好地用于近红外光谱分析中定标波长的选取,进而建立"精而简"的模型.这对于简化定标模型及确定分立波长型仪器的定标波长具有十分重要的价值.同时,对处理其他优化组合问题也有一定的指导意义.  相似文献   

10.
采用偏最小二乘法(PLS)和光谱Savitzky-Golay(SG)平滑方法,建立甘蔗清糖浆锤度近红外光谱分析的优化模型。基于最优单波长模型预测效果划分定标集和预测集。全谱(400—2500nm)经过SG平滑处理后用PLS方法建模。建立计算机算法平台,把483种SG平滑模式和1—40的PLS因子数任意组合分别建立PLS模型,根据预测效果选出最优模型,最优模型的SG平滑模式为二阶导数平滑、4、5次多项式类型、43平滑点数,PLS因子数为13,预测均方根偏差(RMSEP)、相对预测均方根偏差(RRMSEP)和预测相关系数(rP)分别为0.433%、0.69%和0.978。预测精度很高,并且大幅度优于未做SG平滑处理直接PLS建模的预测效果。从而表明,SG平滑模式和PLS因子数的联合大范围筛选能够有效地应用于近红外光谱分析的模型优选。  相似文献   

11.
应用傅里叶近红外技术建立快速定量分析烟草化学成分的数学模型 ,使用BrukerOptics公司的MPA型傅里叶变换近红外光谱仪 ,谱区扫描范围 12 0 0 0~ 4 0 0 0cm- 1 ,选择不同的谱区范围对烟碱、总糖和总氮三种组分的数学模型进行优化 ,结果显示不同谱区范围对同一组分数学模型影响有明显的差异 ,而且不同组分所选择的最佳建模谱区范围是不一样的 ,说明在模型优化过程中选择最佳谱区范围是非常关键的 ,烟碱、总糖和总氮三种组分模型的最佳谱区范围分别是 95 0 0~ 4 2 31 2cm- 1 ,75 0 2 1~ 4 2 4 6 7cm- 1 ,75 0 2 1~4 5 97 7cm- 1 ,三种组分最佳模型交叉检验的均方差 (RMSECV)分别为 0 0 815 ,0 80 8,0 0 5 6。  相似文献   

12.
PCA-SVR联用算法在近红外光谱分析烟草成分中的应用   总被引:5,自引:0,他引:5  
由50份烟草样品的近红外漫反射光谱组成的光谱矩阵经过主成分分析降维,采用基于支持向量机回归(SVR)算法,以常规化学分析方法测定的总糖、还原糖、总氮、烟碱的含量为参考值,建立了烟草中主要成分近红外光谱定量分析定标模型,并采用留一法交叉验证(LOOCV)对模型进行验证。以内部交叉验证预测的RMSE值为判据,从核函数类型、惩罚因子C和不敏感函数ε取值等方面对定标模型进行优化,获得不同成分定标模型的优化参数。烟草总糖、还原糖、总氮、烟碱优化定标模型的RMSE值分别为1.581,1.412,0.117和0.313。同时建立了烟草以上成分的偏最小二乘回归(PLS)、多元线性回归(MLR)以及误差反向传播人工神经网络(BP-ANN)定标模型,通过内部交叉验证的RMSE值与SVR定标模型进行比较,结果表明SVR模型具有更好的预测效果。  相似文献   

13.
选取赣南脐橙果园土壤作为研究对象,探讨在4 000~7 500 cm-1范围内的光谱分析土壤全氮和有机质的可行性。采集的近红外光谱采用多元散射校正、一阶微分、二阶微分、七点平滑等多种预处理对比分析,分别建立了有机质和全氮含量偏最小二乘模型。实验得出全氮预测模型在4 000~7 500 cm-1范围内采用七点平滑(SG)进行预处理模型较为理想,校正集相关系数(rc)为0.802,校正均方根误差(RMSEC)为2.754,预测集相关系数(rp)为0.715,预测均方根误差(RMSEP)为3.077;有机质预测模型在4 000~7 500 cm-1范围内采用标准正态变量变换(SNV)预处理模型较为理想,rc为0.848,RMSEC为0.128,rp为0.790,RMSEP为0.152。研究表明近红外漫反射光谱可快速用于赣南脐橙果园的土壤中全氮和有机质含量的快速检测。  相似文献   

14.
近红外光谱技术结合RCA和SPA方法检测土壤总氮研究   总被引:1,自引:0,他引:1  
基于近红外光谱技术结合连续投影算法和回归系数分析对检测土壤总氮含量进行研究。采集农田土壤样本近红外光谱数据,土壤样本数量共394个。由于原始光谱数据量大,在500~2 500 nm光谱波长范围基础上,为简化模型,在原始光谱基础上采用连续投影算法和回归系数分析提取特征变量,以两种变量选择方法提取的特征变量作为输入,分别采用偏最小二乘回归(PLS)、 多元线性回归(MLR)和最小二乘支持向量机(LS-SVM)建模方法建立总氮预测模型,共建立了9个预测模型,最优预测集的决定系数为0.81,剩余预测偏差RPD为2.26。研究表明,基于连续投影算法和回归系数分析选择的特征波长可以应用于近红外光谱检测土壤总氮含量,同时可以大大简化模型,适合开发便携式土壤养分检测仪。  相似文献   

15.
基于可见-近红外光谱技术预测茶鲜叶全氮含量   总被引:6,自引:0,他引:6  
为快速无损监测茶树氮素营养及其生长状况,基于可见-近红外光谱技术建立了茶鲜叶全氮含量的预测模型。以茶鲜叶为对象,田间试验使用便携式光谱仪采集叶片漫反射光谱信息,通过不同预处理和统计分析,建立茶鲜叶全氮含量预测的光谱模型。试验共采集111个样品,其中86个样品作校正集,25个样品作预测集。通过一阶导数与滑动平均滤波相结合的预处理方法,用7个主成分建立的偏最小二乘模型最好,其校正集均方根误差(RMSEC)为0.097 3,预测集的相关系数为0.888 1,预测均方根误差(RMSEP)为0.130 4,预测的平均相对误差为4.339%。研究结果表明,利用可见-近红外光谱技术可以很好地预测茶鲜叶全氮含量,对于快速实时监测茶树长势和施肥管理具有重要指导意义。  相似文献   

16.
不知火杂柑可溶性固形物在线检测模型建立及优化   总被引:1,自引:0,他引:1  
应用近红外漫透射光谱检测技术对不知火杂柑的可溶性固形物(SSC)进行在线检测具有十分重要的意义。研究变量筛选方法对不知火杂柑可溶性固形物在线检测模型的影响,为实现其快速、准确的在线检测分级奠定基础。实验把形状不整、内藏瓤瓣的不知火杂柑作为研究对象,选取560~930nm的光谱,采用偏最小二乘法(PLS)建立不知火杂柑可溶性固形物的在线检测模型,并讨论不同的光谱预处理方法(卷积平滑(S-G)、一阶微分(1st derivatives)等),不同的变量筛选方法(移动窗口偏最小二乘法MWPLS、遗传算法GA、连续投影SPA)对PLS所建预测模型性能的影响。经对比,多元散射校正(MSC)能有效地消除光散射的影响,遗传算法能大大地降低了建模的波长点数,缩短了建模时间,改善模型预测精度。其最优PLS模型的RP=0.956,RMSEP=0.380,RC=0.967,RMSEC=0.340。实验表明在线检测不知火杂柑的可溶性固形物是完全可行的。  相似文献   

17.
采用可见/近红外光谱技术结合化学计量学方法对油茶籽油三元体系掺假进行定量检测研究。将菜籽油和花生油按不同比例掺入纯油茶籽油中,获得掺假样本。采集纯油茶籽油及掺假样本在350~1 800 nm范围内的可见/近红外光谱数据,随机分为校正集和预测集,并从不同建模波段、预处理方法及建模方法角度对掺假预测模型进行优化。研究结果表明,菜籽油、花生油和总掺伪量的最优建模波段及预处理方法分别为750~1 770,900~1 770 ,870~1 770 nm和多元散射校正(MSC)、标准归一化处理(SNV)和二阶微分,而最优的建模方法均为最小二乘支持向量机(LSSVM)。对于最优掺假模型,菜籽油、花生油和总掺伪量的预测集相关系数(Rp)和预测均方根误差(RMSEP)分别为0.963,0.982,0.993和2.1%,1.5%,1.8%。由此可见,可见/近红外光谱技术结合化学计量学方法可以用于油茶籽油的三元体系掺假定量检测。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号