首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 296 毫秒
1.
可见光/近红外光谱模型是土壤属性预测的有效工具。波长优选在光谱建模过程中起着重要作用。文中首先利用从安徽省涡阳县采集的130个砂姜黑土土壤样本获得可见光/近红外光谱,然后利用平滑与多重散射校正联合的光谱预处理方式消除光谱中的无关变量和冗余信息以提高模型预测结果的相关性,再利用SPXY方法挑选建模集样本,分别利用连续投影算法和遗传算法进行波长优选,最后利用留一法进行交互验证建立有机质含量的主成分回归模型。研究结果显示:连续投影算法和遗传算法都可以有效地减少参与建模的波长数并提高模型的准确度,尤其是遗传算法能够更好地提高土壤有机质含量预测精度,其相关系数、预测均方根误差和相对分析误差分别达到0.9316,0.2142和2.3195。通过合适的特征波长选取,不仅计算量可以大大减少,预测精度也会有效提高。  相似文献   

2.
可见光/近红外光谱模型是土壤属性预测的有效工具。波长优选在光谱建模过程中起着重要作用。文中首先利用从安徽省涡阳县采集的130个砂姜黑土土壤样本获得可见光/近红外光谱,然后利用平滑与多重散射校正联合的光谱预处理方式消除光谱中的无关变量和冗余信息以提高模型预测结果的相关性,再利用SPXY方法挑选建模集样本,分别利用连续投影算法和遗传算法进行波长优选,最后利用留一法进行交互验证建立有机质含量的主成分回归模型。研究结果显示:连续投影算法和遗传算法都可以有效地减少参与建模的波长数并提高模型的准确度,尤其是遗传算法能够更好地提高土壤有机质含量预测精度,其相关系数、预测均方根误差和相对分析误差分别达到0.931 6,0.214 2和2.319 5。通过合适的特征波长选取,不仅计算量可以大大减少,预测精度也会有效提高。  相似文献   

3.
一种近红外光谱特征子区间选择新算法   总被引:2,自引:0,他引:2  
为了简化光谱模型和提高模型精度,在传统遗传算法中引入Metropolis接受准则,提出了一种新的模拟退火-遗传区间选择算法(SAA-GA-iPLS),用于快速提取近红外光谱特征子区间,采用偏最小二乘法(PLS)建立近红外光谱模型。以黄瓜叶近红外光谱数据及其类胡萝卜素含量为例,将全光谱分为40个区间,模拟退火-遗传算法能快速优选出7个子区间(分别为第3,5,14,18,21,32,33子区间),在所选7个子区间的基础上建立了黄瓜叶类胡萝卜素PLS光谱模型。与传统遗传算法的比较结果表明:无论是建模效果还是算法执行效率,模拟退火-遗传算法均优于传统遗传算法。  相似文献   

4.
近红外光谱数据量大,需要进行压缩,以降低建立光谱校正模型的计算复杂度,提高模型精度和稳健性。为此,提出了一种基于离散萤火虫算法(discrete firefly algorithm)的近红外光谱波长变量筛选方法。首先采用蒙特卡罗方法剔除异常值,并应用Kennard-Stone法进行校正样本的选择。对通用萤火虫算法进行离散化处理,改进了吸引度的自适应公式,在移动公式中增加了牵引权重,以适应离散化处理的影响和优化算法,并在离散萤火虫算法中加入精英保留策略,加快算法的收敛速度。实验中找到DFA算法中的各项参数中的最佳值。通过离散萤火虫算法优选波长变量,建立发酵液中丁二酸含量的近红外光谱偏最小二乘回归(partial least squares regression)校正模型。与标准遗传算法(genetic algorithm)优选波长方法进行了比较。结果显示,基于离散萤火虫算法的波长优选方法所建立的PLS校正模型,其校正集的相关系数(R_c~2)为0.986,RMSEC为0.409,预测集的相关系数(R_p~2)为0.969,RMSEP为0.458,模型稳健性和精度都要优于全光谱建模以及遗传算法波长优选方法。显示了DFA在近红外光谱数据筛选方面的优越性。  相似文献   

5.
为了研究近红外光谱模型的优化方法,提高模型的精度.利用遗传算法对64个掺加了肉骨粉的位粉样品近红外光谱进行变量筛选,采用偏最小二乘法回归建模.并用21个样品进行外部验证.遗传算法共选取310个波长变量,相对于全谱的1556个变壁减少了80%,与全谱范围的偏最小二乘法相比,交互验证相关系数(Rcv)从0.80提高剑0.90,交.巨验证均方根误差从5.22%降低到3.62%,预测相关系数(Rv)从0.91提高到0.96,预测均方根误差从3.85%降低到2.95%.模型的稳健性和预测精度都显著提高.试验结果表明遗传算法可以改善近红外光谱法预测鱼粉中肉骨粉含量的效果.  相似文献   

6.
基于遗传算法的苹果糖度近红外光谱分析   总被引:12,自引:0,他引:12  
遗传算法(GA)应用在偏最小二乘法(PLS)校正模型的波段优化选择中具有显著的效果.将遗传算法用于波段选择,能更快达到最优解,有效提高测量精度,减少建模所用变量.文章研究了在近红外苹果糖度无损检测中,遗传算法作为模块进行波段选择,建立了GA-PLS模型;为了说明遗传算法优选波段可行性,另外建立了全谱和经验谱区的PLS定量模型,并评价了模型的稳健性.首先对傅里叶变换近红外光谱进行多元散射校正、Savitky-Golay卷积平滑后,用遗传算法优选波段(R-SGA),参与建模数据点从原始1 550减少到434个.然后采用一阶导数光谱建立GA-PLS模型,相比全谱PLS(1 550个数据点)和经验谱区PLS(717个数据点)模型具有更高的预测精度,其建模结果为RC=0.966,RMSEC=0.469,Rp=0.954,RMSEP=0.797.结果表明,遗传算法可用于PLS法建立苹果糖度校正模型前的数据优化筛选,有效提高测量精度,并减少建模变量.  相似文献   

7.
基于近红外光谱的淡水鱼新鲜度在线检测方法研究   总被引:1,自引:0,他引:1  
新鲜度是反映鱼类品质以及可否食用的重要指标,在线检测直接关系到食品质量与安全的实施应用,因此对淡水鱼新鲜度进行在线无损检测具有重要意义。应用近红外光谱对淡水鱼新鲜度进行在线检测,试验装置采用自行搭建的淡水鱼近红外光谱在线采集装置,试验时样品在输送链上以0.5m·s-1的速度运动,采集其近红外漫反射光谱(900~2 500nm),并用支持向量机(support vector machine,SVM)建立淡水鱼新鲜度在线检测模型。采用光谱理化值共生距离(sample set partitioning based on joint X-Y distance algorithm,SPXY)算法对样本集进行划分,其中校正集111条(新鲜57条,变质54条)、测试集37条(新鲜19条,变质18条),通过对比不同的光谱预处理方法对预测结果的影响,明确了一阶导结合标准化预处理为最优光谱预处理方法,经过该方法预处理后所建模型对校正集的正确识别率为97.96%,对测试集的识别率为95.92%。为了提高模型运行速度对建模所用光谱变量进行优化,分别采用遗传算法(genetic algorithm,GA)、连续投影算法(successive projection algorithm,SPA)和竞争性自适应重加权算法(competitive adaptive reweighed sampling algorithm,CARS)三种不同的特征变量选择方法对特征波长进行筛选,通过建模比较分析确定CARS为最优波长选择方法,以所选的10个特征波长建立淡水鱼新鲜度支持向量机检测模型,模型对校正集的正确识别率为100%,对测试集的识别率为93.88%。该研究可为近红外光谱用于淡水鱼新鲜度在线检测提供技术支持。  相似文献   

8.
应用遗传算法结合连续投影算法近红外光谱检测土壤有机质研究。采集浙江省文城地区农田土壤样品近红外光谱数据,土壤样品数为394个。为简化模型,采用遗传算法结合连续投影算法挑选出18个特征波长建模,应用偏最小二乘回归建立有机质预测模型,建模集的决定系数为0.81,均方根预测误差为0.22,剩余预测偏差为2.31,预测集的决定系数为0.83,均方根预测误差为0.20,剩余预测偏差为2.45。研究发现,遗传算法结合连续投影算法在简化模型同时,模型的预测评价指标同采用全谱波长建模并没有明显降低。因此,遗传算法结合连续投影算法挑选的特征波长可以应用于近红外光谱检测土壤有机质含量。  相似文献   

9.
将经典的卡尔曼滤波器与近红外光谱分析技术相结合,提出了一种新的特征波长变量选择方法——卡尔曼滤波法。分析了卡尔曼滤波器用于波长优选的原理,设计了波长选择算法并将其应用到大豆油脂酸价的近红外光谱检测中。首先利用偏最小二乘法(PLS)对油脂不同吸收波段建模,初步筛选出4 472~5 000 cm~(-1)油脂酸价特征波段共132个波长点,然后进一步利用卡尔曼滤波器进行特征波长选择,从中优选出22个特征波长变量建立PLS校正模型,预测集决定系数R~2、预测误差均方根RMSEP分别为0.970 8和0.125 4,与利用132个波长点建立的校正模型预测结果相当,而波长变量数减少到原来的16.67%。该波长变量选择算法是一种确定性的迭代过程,无复杂的参数设置和变量选择的随机性,物理意义明确。优选出少数对模型影响较大的特征波长变量以代替全谱建模,在简化模型的同时提高了模型的稳健性,为开发专用油脂近红外光谱分析仪器提供了重要参考依据。  相似文献   

10.
冰片的近红外光谱法检测   总被引:7,自引:0,他引:7  
红外光谱技术能够反映样品的综合信息 ,易于在线应用 ,所以若将该技术应用于中成药生产的在线质量监控 ,可以提高中成药的质量控制标准 ,加快中药现代化的进程。冰片作为常用的中药 ,是多种中成药的有效成分之一。文章对冰片在近红外区域的光谱特性进行了实验研究。通过测量 ,得到了冰片在近红外的特征吸收波段。在建模实验中通过建立偏最小二乘法 (PLS)校正模型得到了理想的实验结果 ,2 5个样品冰片含量的预测值和标称值间有良好的线性关系 ,预测标准偏差为 0 2 8mg·mL-1 。实验结果表明红外光谱技术可以用于中成药有效成分的检测和中成药质量控制的研究  相似文献   

11.
近红外(NIR)光谱一般具有较多的波长变量数,对其直接或间接地进行变量选择是提高模型稳定性能及预测性能的关键。最小角回归(LAR)是一种相对较新和有效的机器学习算法,常用于进行回归分析和变量选择。面向光谱建模应用,提出一种LAR结合遗传偏最小二乘法(GA-PLS)的变量选择方法,可有效筛选出少数特征波长点。首先在全光谱区利用LAR消除变量间的共线性得到初筛波长点,然后用GA-PLS对LAR筛选出的波长点进一步优选从而得到最终建模用的特征波长点。为验证本文方法的有效性,以药片和汽油的近红外光谱回归分析作为应用案例,对原光谱进行预处理后,采用该方法进行变量筛选,然后分别建模其中的活性成分含量和C10含量。结果显示,在这两个应用中,最终优化得到的特征波长点数均只需七个,而两者的预测决定系数R2p分别达到0.933 9和0.951 9,与全光谱、无信息变量消除法(UVE)和连续投影算法(SPA)等方法相比,特征波长点更少,同时R2p和预测均方根误差RMSEP值更优。因此,LAR结合GA-PLS,能有效地从近红外光谱中选择出信息变量从而减少建模波数,提高预测精度,拥有较好的模型解释性。该方法可为特定领域的专用光谱仪设计提供有效的波长筛选工具。  相似文献   

12.
为实现近红外光谱进行勾兑梨汁中原汁含量的快速检测,采用相同可溶性固形物含量的新鲜梨汁和果汁粉冲剂按照原汁含量为0%~100%进行勾兑,并结合遗传算法(GA)、粒子群算法(PSO)以及萤火虫算法(GSOFA)进行特征波长筛选,比较分析四种算法分别建立的偏最小二乘(PLS)模型。结果表明,GA-PLS,PSO-PLS,GSO-PLS,FA-PLS四种模型均能够剔除大部分波长变量,其中以FA-PLS模型效果最佳,不仅保证模型的稳健性,而且简化了模型,提高了预测的精度。为了进一步优选特征波长,利用连续投影算法(SPA)在FA基础上做进一步波长筛选,并比较全波段PLS,SPA-PLS,FA-PLS,FA-SPA-PLS模型,四种模型泛化能力为:FA-PLSPLSFA-SPA-PLSSPA-PLS,其预测均方根误差分别为0.029 1,0.033 3,0.033 9和0.137 0,相应的波长变量数量依次367,765,20和18。其中SPA-PLS波长变量最少,但预测误差远远高于其他三种模型,综合考虑预测精度与波长变量数目,FA-SPA-PLS模型不仅波长变量较少而且预测精度较高,能够有效鉴别勾兑梨汁中原汁含量。研究利用近红外光谱技术为快速鉴别勾兑果汁提供一种有益思路,并通过波长变量筛选简化定量分析模型。  相似文献   

13.
转基因水稻及其亲本叶片的可见/近红外光谱分析   总被引:1,自引:0,他引:1  
应用可见/近红外光谱技术实现了转基因水稻叶片的快速识别和叶绿素含量(SPAD)的快速检测。建立偏最小二乘-支持向量机(LS-SVM)鉴别模型,校正集的正确率为100%,同时应用连续投影算法(SPA)提取有效波长,建立SPA-LS-SVM鉴别模型,只用了全变量的0.3%进行建模,其预测集的正确率达到87.27%。在定量分析中,各模型的最优结果均来自经过正交信号校正(OSC)的光谱数据,经过SPA处理后的模型均优于最优的全波段PLS模型,说明SPA是一种有效的波长选择方法。最优SPAD值预测模型为SPA-LS-SVM,其相关系数(r)和预测均方根误差(RMSEP)分别为0.902 2和1.312 1,获得了满意的结果。这说明提出的SPA-LS-SVM方法能快速识别转基因水稻叶片并对SPAD值进行准确预测,为实现大田活体鉴别与连续监测提供了新方法。  相似文献   

14.
《光谱学快报》2012,45(9):553-562
Abstract

The spectral wavelength selection method is important in near-infrared spectroscopy. Eliminating redundant information and extracting useful information can improve the prediction accuracy and modeling efficiency of the quantitative analysis model for spectral analysis to obtain a near-infrared calibration model with strong predictability and good robustness. This paper proposes a wavelength selection method for near-infrared spectroscopy by combining the partial least squares and false nearest neighbor methods. In this method, the correlation between the characteristic wavelength variables and the measured index is assessed by means of a similarity-based distance measure of the characteristic wavelength variable, and the characteristic wavelength is selected according to the order of the correlation. The method was used to select characteristic wavelengths from the near-infrared spectrum of waste liquid to establish a prediction model for the chemical oxygen demand. Compared with the full-spectrum partial least squares and interval partial least squares based models, the number of characteristic wavelength variables is reduced from 1557 to 176, and the prediction accuracy of the model is improved. This method both simplifies the model and achieves higher prediction accuracy. Therefore, this study provides a novel solution for wavelength selection for multivariate calibration in near-infrared spectroscopy.  相似文献   

15.
木材抗弯强度是评价木材力学性质的重要指标,其快速准确预测具有工程应用价值和科学意义。重点研究了使用近红外光谱分析光谱特征优选的卡尔曼滤波(KF)方法进行PLS建模,完成木材抗弯强度的预测。试验用126个蒙古栎无疵试样,依据国家标准《木材物理力学性质试验方法》测量抗弯强度得到力学真值;在900~1 700 nm波段进行近红外光谱采集,一阶导数与S-G卷积结合进行光谱预处理;然后,将光谱及抗弯力学样本视为动态系统,光谱冗余波长视为噪声信号,通过KF迭代得到系数矩阵和标准方差,并运用二者比值实现特征优选;最后建立蒙古栎的偏最小二乘(PLS)抗弯强度近红外模型。结果表明,经过KF优选后,光谱变量数由117减小到18个,预测模型的相关系数=0.81、预测误差均方根RMSEP=6.59;为了进一步验证方法有效性,与无信息变量消除法(UVE)、连续投影方法(SPA)特征选择方法进行了对比,KF特征优选后的预测相关系数r分别提高了0.05和0.16,预测误差均方根RMSEP降低了2.33和7.66,采用KF特征选择建立的模型预测结果最佳。KF作为特征方法可有效选择近红外光谱特征波长,降低模型维度,提高模型的适用性与准确性。  相似文献   

16.
可见/近红外光谱技术是土壤成分检测的有效工具。波长筛选对可见/近红外模型土壤属性的预测精度有重要影响。以宁夏吴忠地区75个水稻土样为研究对象,利用可见/近红外光谱技术采集土壤样品光谱,采用SPXY (Sample set partitioning based on joint X-Y distance)方法选取了校正集和预测集样本,比较了分别采用Savitzky Golay平滑(SG smoothing)、多元散射校正(Multiple scatter correction,MSC)、标准正态变量变换(Standard normal variate,SNV)3种预处理方法对光谱数据处理后建立土壤碱解氮偏最小二乘法模型和原始光谱数据建模的效果。在此基础上,分别采用遗传算法(Genetic gorithms,GA)、连续投影算法(Successive projections algorithm,SPA)、竞争性自适应重加权算法(Competitive adaptive reweighted Sampling,CARS)、随机蛙跳(Random frog,RF)进行波长筛选,最后应用偏最小二乘法建立基于不同波长筛选方法的土壤碱解氮含量预测模型。研究表明,由于仪器性能稳定,样品的颗粒度比较小和均匀,本次实验原始光谱数据建模效果最好;各种波长筛选方法均可有效减少参与建模的波长数,且连续投影算法优于全谱建模,所选波长数仅为全谱波长数的1%,其预测决定系数(R2)、预测均方根误差和相对分析误差值分别为0.726,3.616,1.906。这表明连续投影算法可以有效筛选水稻土碱解氮敏感波段,为土壤碱解氮传感器开发提供技术支持。  相似文献   

17.
在近红外光谱的定量分析中,由于仪器的精密程度越来越高,采集的光谱数据通常具有很高的维度。因此,波长选择对于剔除噪声及冗余变量,简化模型,提高模型的预测性能是必不可少的。近红外光谱特征波长选择方法众多,但变量间的多重共线性问题仍是导致模型效果较差的一个关键问题。变量间共线性可以通过相关系数进行分析,当相关系数高于0.8,表明存在多重共线性。据此,以变量间相关系数为选择标准,提出一种以所选变量之间共线性最小化的波长选择方法,称之为最小相关系数法(MCC)。该方法以光谱数据的相关系数矩阵为基础,挑选出与其他波长相关系数平均值和标准差均较小的波长为候选建模波长集合,使得集合内波长之间线性相关性最小,进而消除模型变量之间共线性。然后通过标准回归系数优选对因变量影响较大的波长,获得预测模型。为了验证所提出算法的有效性,对该方法进行了测试。利用两组公开的近红外光谱数据集(柴油数据集、土壤数据集),通过MCC算法进行波长选择,并与常用的几个波长选择方法,如:连续投影算法(SPA)、竞争性自适应重加权采样法(CARS)、随机蛙跳算法(RF)、迭代保留信息变量法(IRIV)进行比较。实验结果表明,MCC算法获得了良好的预测性能,MCC算法的预测精度相比于SPA,CARS和RF三种算法具有明显的优势,而MCC算法的预测精度与IRIV算法不相上下。因此,最小相关系数法可实现高效降维,提高模型的预测精度,是一种有效的波长选择算法。  相似文献   

18.
近红外光谱预测稻谷水分含量特征谱区选择及其效率分析   总被引:1,自引:0,他引:1  
对364份水分含量在2.24%~32.66%之间的“冈优916”稻谷样品,经均值中心化、一阶微分、标准归一化和多元散射校正等预处理后,采用分段间隔法、组合分段法、滑动窗口法和反向分段法等进行特征谱区选择,分别使用偏最小二乘法(PLS)和主成分回归(PCR)两种定量分析方法,获得稻谷含水量近红外光谱预测模型最佳的特征谱区。首次给出了分段间隔法、组合分段法、滑动窗口法和反向分段法等传统的特征谱区选择方法的计算复杂度的计算公式,并对比分析了这几种特征谱区选择方法的程序运行效率。结果表明:采用PLS建模对稻谷含水量光谱的预测性能优于PCR建模,但PLS建模的效率低于PCR建模;在PLS建模中,采用反向分段法对稻谷光谱含水量的预测性能最好,其预测集的相关系数RP为0.995 6,预测均方根偏差RMSEP为0.78%;其次是滑动窗口法,其RP为0.994 3,RMSEP为0.89%;但这两种特征谱区选择方法的程序运行效率较低,反向分段法的平均运行时间为4.87 h,滑动窗口法的平均运行时间为29.82 h。该研究结果为今后在并行计算或分布式计算上开发近红外光谱预测模型的快速算法提供参考。  相似文献   

19.
针对近红外光谱应用,提出了一种基于高斯过程(GP)模型的波长选择算法,即联合区间高斯过程(synergy interval gaussian process,siGP)算法。首先将全光谱区域划分为一系列无重复且间距相等的区间,再选取最优的若干个区间联合建立GP模型,由于GP模型具有非线性处理能力,因此该方法可以减少非线性的影响。以红曲菌固态发酵过程中过程参数水分含量和pH值的检测为例,新算法对水分含量、pH值的预测集相关系数(rp)分别为0.956 4和0.977 3,预测均方根误差(RMSEP)分别为0.012 7和0.161 0,参与建模的数据点由全谱的1 500个分别减少到225个、375个,在对独立样本的预测上,表现出较好的精度。与传统联合区间偏最小二乘(siPIS)波长选择算法对比,siGP算法预测效果更好:对水分含量和pH值,r_p在GP模型预测时提高了3.37%和3.51%,RMSEP在GP模型预测时提高了29.4%和34.8%。表明siGP结合GP模型能够有效选择波长区间以及提高近红外模型的准确性,对进一步实现近红外光谱技术在线检测具有参考价值。  相似文献   

20.
近红外技术广泛应用于食品、药品等生产过程和产品质量检测,具有样品无需预处理、成本低、无破坏性、测定速度快等优点。但是,全光谱数据维数高、冗余信息多,直接应用于建模会导致模型复杂性高、稳定性差等问题。siPLS是最常见的光谱数据降维方法,但是难以处理光谱数据的共线性问题。LASSO是一种相对新的数据降维方法,但在小样本应用中具有不稳定性。针对siPLS和LASSO在近红外光谱数据应用中存在的问题,提出了基于siPLS-LASSO的近红外特征波长选择方法,并将其应用于秸秆饲料蛋白固态发酵过程pH值监测。该方法首先采用siPLS算法,实现对光谱波长最佳联合子区间的优选;然后,对优选联合子区间使用LASSO算法进行特征波长选择,在此基础上建立PLS校正模型。同时,将siPLS-LASSO方法与其他传统特征波长选择方法进行了对比。结果表明:建立在siPLS-LASSO方法优选33个特征波长基础上的PLS模型预测结果更好,其预测方差(RMSEP)和相关系数(Rp)分别为0.071 1和0.980 8;所提siPLS-LASSO方法有效选取了特征波长,提高了模型预测性能。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号