首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 171 毫秒
1.
有监督主成分回归法在近红外光谱定量分析中的应用研究   总被引:5,自引:0,他引:5  
介绍了运用有监督主成分回归法建立近红外光谱定量分析模型的原理和方法.利用该方法先进行近红外光谱定量分析建模的波长信息选择,达到降低光谱数据维数的目的,然后建立数学模型,并用其分析预测集样品.文中以66个小麦样品为实验材料,随机选择其中40个样品建立小麦样品中蛋白质含量的近红外光谱定量分析模型,首先优选出4个波长点:4 632,4 636,5 994,5 997 cm-1,利用这4个波长点处光谱信息建立主成分回归模型预测26个样品的蛋白质含量,其结果与凯氏定氮法分析结果的相关系数为0.991,平均相对误差为1.5%.该方法从大量光谱数据中筛选出最重要的部分波长信息,实现了"少而精"的波长点选择,对建立抗共线性信息干扰的光谱定量分析模型,同时对指导专用近红外分析仪器设计中波长点的选择等方面都有一定的意义.  相似文献   

2.
介绍了运用MAXR回归法建立傅里叶变换近红外光谱定量分析模型的原理和方法。以此方法,由Matlab语言设计程序,进行近红外光谱定量分析建模的波长信息选择。并以小麦样品为实验材料,建立了蛋白质含量的近红外光谱定量分析模型,其中优选出2个和3个波长点处光谱信息建立的多元回归模型的预测结果与凯氏定氮法分析结果相关系数分别为0.977 1和0.976 5,标准差分别为0.335和0.340。MAXR回归法在进行波长信息,选择时可建立分别包含1,2,…,k个波长点信息的最优回归模型,且计算量适中,因此是一种实用的选择“最优”波长信息的回归方法。该方法不仅可少而精选择波长信息,建立抗共线性信息干扰的光谱定量分析模型,而且对于特定样品、特定待分析组分,选择最优波长信息建模分析的工作,可指导专用近红外分析仪器的设计。  相似文献   

3.
SVM回归法在近红外光谱定量分析中的应用研究   总被引:15,自引:9,他引:6  
研究了基于统计学习理论的支持向量机(SVM)回归法在近红外光谱定量分析中的应用。以66个小麦样品为实验材料,由33个小麦样品作为校正样品,采用4种不同核函数方法对小麦样品蛋白质含量与小麦样品近红外光谱进行SVM回归建模。以所建4种不同SVM回归模型对33个小麦预测样品的蛋白质含量进行了预测;不同回归模型的预测结果与凯氏定氮法确定的蛋白质含量的标准化学值间的相关系数均在0.97以上,平均绝对误差小于0.32。为了考察SVM回归校正模型的预测效果,同所建PLS回归模型的预测结果进行了比较,表明所建预测小麦样品蛋白质含量的SVM回归模型亦可通过近红外光谱进行实际样品的定量分析,且有较好的分析效果。  相似文献   

4.
傅里叶变换近红外光谱信息资源共享的基础研究   总被引:1,自引:0,他引:1  
为了实现农产品傅里叶变换近红外光谱库信息资源的共享 ,使光谱库的信息资源达到充分利用 ,首先研究了仪器间光谱信息的准确表达 ,即仪器到仪器光谱信息间的映射 ;并以映射光谱研究了用于不同仪器上进行定量分析的无标样建模方法。对于 2 2个小麦样品蛋白质含量 ,无标样建模模型预测值与凯氏定氮结果的相关系数r =0 94 1,平均相对误差为 3 2 8% ;为了考察无标样建模模型定量分析的使用性 ,同时亦对 2 2个小麦样品的蛋白质含量采用有标样建模定量分析 ,模型预测值与凯氏定氮结果的相关系数r =0 96 3,平均相对误差为 2 4 %。有标样建模与无标样建模的模型分析结果的比较 ,为不同仪器间光谱信息的可共享性提供了依据。由此根据不同仪器建立的光谱信息库的库信息即可转化为另一仪器的映射光谱信息 ,保证了光谱库信息资源在不同仪器上的共享利用  相似文献   

5.
傅里叶变换近红外全谱回归分析的应用研究   总被引:1,自引:0,他引:1  
文章以66个小麦样品为实验材料,其中33个为建模集,剩余33个为预测集,利用广义逆矩阵直接确定傅里叶变换近红外全谱分析回归模型中的回归系数,建立了用于蛋白质定量分析的近红外全谱回归模型。用此模型对预测集中的样品进行预测,结果与凯氏定氮法测定结果间的相关系数为r=0.979 9,平均相对误差为1.76%,表明由广义逆矩阵方法所建近红外全谱定量分析回归模型有较好的分析结果。所建模型不仅可用于对样品的实际分析,而且可根据回归模型中各个系数了解各个波长点处的光谱信息对模型预测值的贡献,从而可理解并解释傅里叶变换近红外全谱回归模型的物理学与化学意义。  相似文献   

6.
近红外光谱温度修正定量分析模型的研究   总被引:9,自引:3,他引:6  
以小麦粉末样品为实验材料,研究了环境温度对近红外光谱定量分析结果的影响。将环境温度作为外部变量,使用不同温度下的45个样品建立了测定小麦蛋白质含量的温度修正模型,预测不同温度下的小麦样品的蛋白质含量,结果同以22 ℃恒温下45个样品建立的模型进行了比较。分析结果表明:温度修正模型的预测标准差(SEP)平均为0.333,而恒温模型(22 ℃)的预测标准差随着环境温度与建模时温度差的增大而增大,当环境温度4 ℃时,SEP=0.601 6。温度修正模型可以有效的提高近红外光谱定量分析精度。  相似文献   

7.
特征根回归法近红外光谱定量分析研究   总被引:2,自引:0,他引:2  
本文以大豆样品为实验材料,研究了特征根回归法近红外光谱定量分析。用40个大豆样品的近红外光谱数据建立了测定大豆蛋白质含量的特征根回归模型,预测另外32个大豆样品的蛋白质含量,结果同PLS回归方法进行了比较,表明特征根回归模型可用于生物样品的近红外光谱定量分析。特征根回归法是对PCR建模方法改进的又一种化学计量学定量分析校正方法,该方法在对样品光谱提取主成份时考虑了待分析组分的作用,因此所建立的定量分析模型有好的分析效果。研究结果进一步表明,以样品近红外光谱建立定量分析模型,提取主成份时充分考虑被定量分析成份的作用是完全必要的。  相似文献   

8.
短波近红外光谱的整粒小麦蛋白质PLS方法的定量分析   总被引:11,自引:0,他引:11  
利用漫反射法获得的整粒小麦短波近红外光谱(833~1111nm),采用化学计量学中的偏最小二乘法(PLS)方法,选取不同的波长范围对光谱进行信息提取和分析,给出了不同因子数时PLS方法进行蛋白质分析的结果及其因子数与预测标准偏差平方和(PRESS)关系曲线,确定了最佳回归因子数。并通过选取最佳回归因子和不同波段,对整粒小麦的蛋白质成分进行了定量分析,比较了不同波长范围对分析的影响,并从中获得了较好的预测结果,实验表明,合理选择光谱范围可减少非主要信息的干扰,并以此来提高成分分析精度的方法是切实可行的,在实际应用中有一定的参考价值。  相似文献   

9.
近红外漫反射光谱法测定整粒小麦单株蛋白质含量   总被引:18,自引:2,他引:16  
应用近红外漫反射光谱技术(波长为1 100~2 498 nm,分辨率为2 nm),以整粒小麦为材料建立适合于小麦单株分析的蛋白质含量分析系统。首先选取籽粒蛋白质含量具有梯度差异的小麦样品,然后对样品扫描得到原始光谱信息,通过散射校正及数学处理来消除原始光谱噪声,最后分别采用多元线性回归、主成分分析法和偏最小二乘法法建立回归方程。结果表明,优化各项参数后,光谱经过标准乘性散射校正和一阶导数处理后,回归分析采用修正的偏最小二乘法(MPLS)得到的定标模型效果最佳。最终得到的预测方程定标相关系数(RSQ)、交叉验证标准误差(SECV)、交叉验证相关系数(1-VR)分别为0.94,0.42,0.87。数学模型经过验证样品集检验,预测相关系数达到0.88。该模型达到了快速、无损分析单株小麦的要求,非常适合于品质育种的早代选择。  相似文献   

10.
Elastic net是对最小二乘方法的一种改进,在最小二乘法的基础上增加了L1和L2惩罚,具有变量选择和模型可提高预测精度的良好性质。此研究以89个小麦样品为实验材料,通过Elastic net方法优选光谱主成分,建立近红外光谱与小麦中蛋白质含量之间的定量分析模型,考证了Elastic net优选主成分建立定量分析模型的可行性。实验中将89个小麦样品随机分成两组,60个样品做建模集,其余29个做预测集。60个样品所建模型预测29个样品的蛋白质含量,预测值和化学测量值间的相关系数(r)为0.9849,平均相对误差为2.48%。为进一步考察该方法建模的可行性和稳定性,对89个样品分别进行5次随机划分,60个样品做为建模集,29个样品做为预测集,5次建模所选光谱的主成分基本一致;同时与PCR和PLS方法作对比,结果显示5次所建模型的预测效果明显好于PCR,且与PLS方法相近。鉴于Elastic net具有变量选择的功能,且所建模型具有较好的预测效果,表明该方法是一种可行的建立化学计量学定量分析模型的方法。  相似文献   

11.
近红外光谱分析技术对检测样品无损伤且检测速度快、精度高,因此被广泛应用在了药品检测、石油化工等领域,尤其近年来机器学习和深度学习建模方法的深入应用使其具备了更准确的检测性能。然而,样品的近红外光谱数据具有比较高的维度且存在谱间重合、共线性和噪声等问题,对近红外光谱模型的性能产生消极影响,此时样品有效特征波长的筛选极为重要。为了提高近红外光谱定量和定性分析模型的准确性和可靠性,提出了一种近红外光谱变量选择方法,其结合了最小角回归(LAR)和竞争性自适应重加权采样(CARS)的优点,具有更优的性能。该方法利用LAR初步筛选样品全谱区的特征波长,接着利用CARS对筛选出来的特征波长进一步选择,从而有效去除无关特征波长。为验证该方法的有效性,从定量和定性分析两个方面评价该方法。在定量分析实验中,以FULL,LAR,CARS,SPA和UVE作为对比方法,以药品样品数据集为实例建立PLS回归分析模型,经LAR-CARS筛选出的变量建立的PLS模型在药品数据集表现出较高的预测决定系数和较低的预测标准偏差。在定性分析实验中,以SVM,ELM,SWELM和BP作为对比方法、不同比例训练集的药品数据集为实例建立分类模型,经LAR-CARS筛选出的变量建立的SVM分类模型精度最高达100%。从实验结果可见,LAR-CARS可有效的筛选出表征样品特征的波长,利用其筛选出的波长建立的定量、定性分析模型具有更好的鲁棒性,可用于样品光谱的特征波长筛选。  相似文献   

12.
A novel thickness measurement method for surface insulation coating of silicon steel based on NIR spectrometry is explored.The NIR spectra of insulation coating of silicon steel were collected by acousto-optic tunable filter (AOTF) NIR spectrometer.To make full use of the effective information of NIR spectral data,discrete binary particle swarm optimization (DBPSO) algorithm was used to select the optimal wavelength variates.The new spectral data,composed of absorbance at selected wavelengths,were used to create the thickness quantitative analysis model by kernel partial least squares (KPLS) algorithm coupled with Boosting.The results of contrast experiments showed that the Boosting-KPLS model could efficiently improve the analysis accuracy and speed.It indicates that Boosting-KPLS is a more accurate and robust analysis method than KPLS for NIR spectral analysis.The maximal and minimal absolute error of 30 testing samples is respectively -0.02 μm and 0.19 μm,and the maximal relative error is 14.23%.These analysis results completely meet the practical measurement need.  相似文献   

13.
应用近红外(NIR)光谱技术结合化学计量学法建立测定蛹虫草菌丝体中腺苷、蛋白、多糖和虫草酸4种主要有效成分含量的定量分析模型,可应用于蛹虫草高产突变株的筛选和发酵条件的优化。468株蛹虫草突变株在不同的摇瓶发酵条件下进行发酵,收集菌丝体粉末样品并采集NIR光谱,同时采用常规方法分别测定样品的4种有效成分含量。偏最小二乘法(PLS)用于建立NIR光谱与有效成分含量间相关模型。采用蒙特卡罗偏最小二乘法(MCPLS)识别异常样本和选择合适的校正集样本数;采用移动窗口偏最小二乘法(MWPLS)筛选波长变量;以逼近度(Da)为考察指标,选择最有效的光谱预处理方法和最适的PLS隐变量数,最终得到测定蛹虫草菌丝体中腺苷、蛋白、多糖和虫草酸含量的最优PLS模型,其校正集样本参考值与预测值间相关系数(Rc)分别为0.92943,0.98479,0.90785和0.85131;预测集误差(RMSEP)为0.66714,0.02065,0.01131和0.01159,表明模型具有很好的拟合度和预测性能,应用该方法进行蛹虫草诱变筛选和发酵条件的优化是可行的。  相似文献   

14.
近红外(NIR)光谱一般具有较多的波长变量数,对其直接或间接地进行变量选择是提高模型稳定性能及预测性能的关键。最小角回归(LAR)是一种相对较新和有效的机器学习算法,常用于进行回归分析和变量选择。面向光谱建模应用,提出一种LAR结合遗传偏最小二乘法(GA-PLS)的变量选择方法,可有效筛选出少数特征波长点。首先在全光谱区利用LAR消除变量间的共线性得到初筛波长点,然后用GA-PLS对LAR筛选出的波长点进一步优选从而得到最终建模用的特征波长点。为验证本文方法的有效性,以药片和汽油的近红外光谱回归分析作为应用案例,对原光谱进行预处理后,采用该方法进行变量筛选,然后分别建模其中的活性成分含量和C10含量。结果显示,在这两个应用中,最终优化得到的特征波长点数均只需七个,而两者的预测决定系数R2p分别达到0.933 9和0.951 9,与全光谱、无信息变量消除法(UVE)和连续投影算法(SPA)等方法相比,特征波长点更少,同时R2p和预测均方根误差RMSEP值更优。因此,LAR结合GA-PLS,能有效地从近红外光谱中选择出信息变量从而减少建模波数,提高预测精度,拥有较好的模型解释性。该方法可为特定领域的专用光谱仪设计提供有效的波长筛选工具。  相似文献   

15.
This work was undertaken to establish a quantitative analysis model which can rapid determinate the content of linalool, linalyl acetate of Xinjiang lavender essential oil. Totally 165 lavender essential oil samples were measured by using near infrared absorption spectrum(NIR), after analyzing the near infrared spectral absorption peaks of all samples, lavender essential oil have abundant chemical information and the interference of random noise may be relatively low on the spectral intervals of 7100-4 500 cm(-1). Thus, the PLS models was constructed by using this interval for further analysis. 8 abnormal samples were eliminated. Through the clustering method, 157 lavender essential oil samples were divided into 105 calibration set samples and 52 validation set samples. Gas chromatography mass spectrometry (GC-MS) was used as a tool to determine the content of linalool and linalyl acetate in lavender essential oil. Then the matrix was established with the GC-MS raw data of two compounds in combination with the original NIR data. In order to optimize the model, different pretreatment methods were used to preprocess the raw NIR spectral to contrast the spectral filtering effect, after analysizing the quantitative model results of linalool and linalyl acetate, the root mean square error prediction(RMSEP) of orthogonal signal transformation (OSC) was 0.226, 0.558, spectrally, it was the optimum pretreatment method. In addition, forward interval partial least squares (FiPLS) method was used to exclude the wavelength points which has nothing to do with determination composition or present nonlinear correlation, finally 8 spectral intervals totally 160 wavelength points were obtained as the dataset. Combining the data sets which have optimized by OSC-FiPLS with partial least squares(PLS) to establish a rapid quantitative analysis model for determining the content of linalool and linalyl acetate in Xinjiang lavender essential oil, numbers of hidden variables of two components were 8 in the model. The performance of the model was evaluated according to root mean square error of cross-validation (RMSECV) 9 root mean square error of prediction (RMSEP). In the model, RESECV of linalool and linalyl acetate were 0.170 and 0.416, respectively; RMSEP were 0.188 and 0.364. The results indicated that raw data was pretreated by OSC and FiPLS, the NIR-PLS quantitative analysis model with good robustness, high measurement precision; it could quickly determine the content of linalool and linalyl acetate in lavender essential oil. In addition, the model has a favorable prediction ability. The study also provide a new effective method which could rapid quantitative analysis the major components of Xinjiang lavender essential oil.  相似文献   

16.
可见/近红外光谱技术是土壤成分检测的有效工具。波长筛选对可见/近红外模型土壤属性的预测精度有重要影响。以宁夏吴忠地区75个水稻土样为研究对象,利用可见/近红外光谱技术采集土壤样品光谱,采用SPXY (Sample set partitioning based on joint X-Y distance)方法选取了校正集和预测集样本,比较了分别采用Savitzky Golay平滑(SG smoothing)、多元散射校正(Multiple scatter correction,MSC)、标准正态变量变换(Standard normal variate,SNV)3种预处理方法对光谱数据处理后建立土壤碱解氮偏最小二乘法模型和原始光谱数据建模的效果。在此基础上,分别采用遗传算法(Genetic gorithms,GA)、连续投影算法(Successive projections algorithm,SPA)、竞争性自适应重加权算法(Competitive adaptive reweighted Sampling,CARS)、随机蛙跳(Random frog,RF)进行波长筛选,最后应用偏最小二乘法建立基于不同波长筛选方法的土壤碱解氮含量预测模型。研究表明,由于仪器性能稳定,样品的颗粒度比较小和均匀,本次实验原始光谱数据建模效果最好;各种波长筛选方法均可有效减少参与建模的波长数,且连续投影算法优于全谱建模,所选波长数仅为全谱波长数的1%,其预测决定系数(R2)、预测均方根误差和相对分析误差值分别为0.726,3.616,1.906。这表明连续投影算法可以有效筛选水稻土碱解氮敏感波段,为土壤碱解氮传感器开发提供技术支持。  相似文献   

17.
模型传递使在特定条件下建立的模型能够应用于新的样品状态、环境条件或仪器状态。本研究在中药金银花中试在线水提过程中,以水提液中的绿原酸含量为研究对象,建立绿原酸含量的近红外定量模型。针对由金银花来源不同带来的模型失效问题,从光谱背景校正的角度出发,提出以KS算法挑选待传递样本中的代表性样本,结合正交信号回归(OSR)光谱背景校正方法,对不同来源样本的近红外光谱进行光谱背景校正,并深入探讨OSR方法实现近红外定量模型在不同来源中试样本间传递的应用原理。经模型传递后,模型对新批次样本预测的RSEP由14.91%下降到7.11%,RPD由2.95上升到5.36,预测准确度明显提高。实验证明,选择代表性样本的KS算法结合OSR光谱背景校正的模型传递方法不仅能减小不同来源原料药之间的偶然误差,同时消除了中试制剂过程和算法本身的系统误差,因此能够有效地改善因样本来源差异而造成的模型失效现象。该研究充分阐释了OSR模型传递方法的应用原理,以光谱背景校正与挑选代表性样本回归的方法实现了近红外定量模型在不同来源原料药中试样本之间的模型传递,增强了模型应对原料药批次间变动的能力,提高了模型的稳健性,为多来源原料药中试在线制剂过程中有效成分含量的快速实时监测提供了有效方法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号