共查询到18条相似文献,搜索用时 46 毫秒
2.
传统的柑橘黄龙病检测方法存在准确度低、稳定性差等问题,该文提出了一种基于最小角回归结合核极限学习机(Leastangleregressioncombinedwithkernelextremelearningmachine,LAR-KELM(RBF))的近红外柑橘黄龙病鉴别方法。该方法将光谱数据通过小波变换进行预处理,然后用最小角回归(LAR)算法进行光谱波长的筛选,最后通过核极限学习机(KELM(RBF))实现样本的分类。实验采用柑橘叶片的近红外光谱数据,验证了LAR-KELM(RBF)算法的性能,其分类准确度最高为99.91%,标准偏差为011。不同规模训练集的实验结果表明,LAR-KELM(RBF)模型较极限学习机(ELM)、波形叠加极限学习机(SWELM)、反向传播神经网络(BP(2层))、KELM(RBF)和支持向量机(SVM)模型分类准确度高、稳定性强,能够广泛应用于柑橘黄龙病的检测鉴别。 相似文献
3.
蒙特卡洛-偏最小二乘回归系数法用于近红外光谱变量筛选 总被引:1,自引:0,他引:1
提出了一种蒙特卡洛-偏最小二乘回归系数法用于近红外光谱的变量筛选。方法主要包含如下几步:(1)采用蒙特卡洛采样方式,建立多个子集;(2)对每个子集建模,计算其回归系数,并按回归系数绝对值大小对各子模型中的变量进行排序;(3)按频数统计方法对波长排序;(4)对上步中排序后的波长以逐步累加进入最佳变量子集的方式进行交互验证,用以选择最佳变量集。将方法用于生物样品溶液和烟草样品近红外光谱的变量筛选,最终分别从原始的1234及1557个变量中选择了27和68个特征变量,对独立测试集进行预测的RMSEP分别从全谱变量的0.02716和0.06411降低为0.02372和0.03977。方法可有效地对近红外光谱进行变量筛选。 相似文献
4.
针对近红外光谱分析技术中模型通用性较差的问题,提出了一种新的模型传递方法——最小角回归结合一元线性直接校正法(Leastangleregressioncombinedsimplelinearregressiondirectstandardization,LAR-SLRDS)。该方法首先采用小波变换对样品光谱数据进行预处理,然后利用LAR实现样品全谱区光谱特征波长点的筛选,最后利用SLRDS对筛选出来的变量进行校正。采用汽油和药品样本的近红外光谱数据验证LAR-SLRDS性能,汽油数据集C7、C8、C9和C10成分的光谱差异为0.0028、0.0027、0.0026和0.0027,预测标准差为0.4106、0.8492、1.0349和1.2158;药品数据集活性、硬度和重量成分的光谱差异为0.0300、0.0318和0.0336,预测标准差为1.9338、0.4402和2.1309。结果表明,LAR-SLRDS算法不仅能够消除主、从仪器光谱之间存在的差异,实现模型传递,而且能够提高PLS定量模型的准确性和稳定性,具有广泛的应用潜力。 相似文献
5.
6.
组合生成算法与多元线性回归相结合用于近红外光谱波长的优选 总被引:6,自引:0,他引:6
分立波长型近红外光谱分析仪是光谱分析仪器中较为普及的一种快速成份定量分析仪。如滤光片型、发光二极管型等。该类分析仪器研发的一个主要问题是如何针对于待测物质主要成份进行近红外光谱解析。找到最优定标波长组合用于建立稳健的定标模型。常用的波长选择方法为相关光谱结合逐步多元线性回归方法,该方法依据各参与定标波长所对应的t检验值进行最优定标波长的判别,但在实际应用中定标模型的定标精度和预测精度相差较大,具有很大的不准确性。为了实现定标波长的优选引入了组合数学中的组合生成算法。可以在较短的时间内完成最优波长组合的选取,结果是令人满意的。 相似文献
7.
近红外光谱技术结合竞争自适应重加权采样变量选择算法快速测定土壤水解性氮含量 总被引:1,自引:0,他引:1
为了能够快速准确地掌握整个昆明地区土壤水解性氮含量的情况,收集963个不同类型的土壤样品,采用竞争自适应重加权采样(Competitiveadaptivereweightedsampling,CARS)变量选择方法筛选波长变量,并建立水解性氮的偏最小二乘法(Partialleastsquares,PLS)分析模型。结果表明,采用CARS方法优选波长变量后,模型参数有所改善,交互验证标准偏差(Rootmeansquareerrorofcrossvalidation,RMSECV)由31.63降至25.55,交互验证相关系数(Correlationcoefficientofcrossvalidation,Rcv)由078提升至0.84,且模型外部验证结果与内部交叉验证结果基本一致。研究结果表明近红外光谱技术结合CARS分法,在大量代表性样品建模下,能够有效建立昆明地区不同土壤类型的水解性氮含量的近红外数学模型,方法可推广应用于土壤其他组分的近红外检测,具有重要的指导意义。 相似文献
8.
变量选择经常被用于优化近红外光谱线性校正模型,消除冗余信息,提升回归的准确性和可解释性。该文研究并设计了一种基于蒙特卡洛的方法,用于评估不同线性校正方法在变量选择的子空间中能达到的最优程度,寻找变量选择对线性校正模型的优化极限。该方法通过获得验证指标——预测均方根误差(RMSEP)的分布图,揭示变量选择方法在数据集上的优化效果与优化极限。将该方法应用于3组样品的近红外光谱建模研究,结果表明:在烟草-果胶数据集上的可优化率约为24.98%,RMSEP降低了15.2%;在小麦-蛋白质数据集上的可优化率约为13.90%,RMSEP降低了9.5%;在玉米-淀粉数据集上的可优化率约为14.05%,RMSEP降低了57.1%。应用该方法可以快速得到变量选择方法在模型上的优化极限,为变量选择方法的设计、应用和评估提供参考。 相似文献
9.
基于群体智能的灰狼优化(GWO)算法具有参数少、结构简单、易于实现的优点,但在光谱领域的应用较少。该研究将GWO算法引入近红外光谱的变量筛选中,以玉米数据为例,考察了GWO算法中狼群性能、迭代次数、狼群数量及运算效率,并建立了偏最小二乘(PLS)模型对玉米样品中蛋白质、脂肪、水分以及淀粉含量的测定。结果显示,GWO算法运算效率很高,经过参数调优后建立PLS模型,其蛋白质、脂肪、水分及淀粉的保留变量数分别为19、19、14、34,预测均方根误差(RMSEP)从全波长PLS建模的0.2458、0.1224、0.3398、1.1058分别下降到0.1477、0.0801、0.1762、0.7398,分别下降了40%、35%、48%、33%,相关系数也相应地提高。因此,GWO算法不仅优化速度快,选择变量数少,还可以显著提高PLS模型的预测精度,是一种近红外光谱变量选择的有效方法。 相似文献
10.
《分析科学学报》2021,37(5)
本文着重探讨小波变换及其它光谱预处理方法对连续投影算法(SPA)波长筛选优化及建模效果的影响。以158个不同茶叶样本作为研究对象,将各种预处理方法单独或组合后与SPA结合使用,并通过偏最小二乘法(PLS)建立咖啡碱定量模型。其中一阶微分(WT-1~(st)D)-SPA组合建立的模型最佳,预测相关系数达到0.9481,均方根误差达到0.3053,验证集相对分析误差达到3.1959,建模变量由1038减小为10,其挑选出的波长数10和通过交叉验证确定的最佳PLS成分数7也比较接近,并包含在茶叶咖啡碱主要吸收谱带范围内。结果表明,小波变换结合WT-1~(st)D方法在消除光谱部分散射误差和高频噪声的同时,能有效提高茶叶光谱的分辨率,有助于SPA算法筛选出更少、代表性和独立性更优的特征波长组合,并极大地改善了模型的精度,为茶叶中咖啡碱的近红外分析建模提供了一种快速、简便的方法。 相似文献
11.
《Analytical letters》2012,45(13):2238-2254
A new variable selection method called ensemble regression coefficient analysis is reported on the basis of model population analysis. In order to construct ensemble regression coefficients, many subsets of variables are randomly selected to calibrate corresponding partial least square models. Based on ensemble theory, the mean of regression coefficients of the models is set as the ensemble regression coefficient. Subsequently, the absolute value of the ensemble regression coefficient can be applied as an informative vector for variable selection. The performance of ensemble regression coefficient analysis was assessed by four near infrared datasets: two simulated datasets, one wheat dataset, and one tobacco dataset. The results showed that this approach can select important variables to obtain fewer errors compared with regression coefficient analysis and Monte Carlo uninformative variable elimination. 相似文献
12.
组合偏最小二乘回归方法在近红外光谱定量分析中的应用 总被引:3,自引:1,他引:3
针对近红外光谱数据局部效应显著,变量个数多,彼此间常存在严重的复共线性,并多与样品组分含量呈非线性关系,构建一种组合非线性偏最小二乘回归(E-S-QPLSR)方法。它采用无重复采样技术(subag-ging),从训练样本中生成若干子样,然后每个子样通过二次多项式偏最小二乘回归(QPLSR),建立其子模型,并实现对训练样本因变量的定量预测,再将它们交由线性PLS算法用于计算各子模型的组合权系数。将该法应用于80个玉米样品的水组分含量与其近红外光谱的定量关系建模,效果良好,显示出很强的学习能力,所建模型的预报性能也优于其它方法。 相似文献
13.
Jiyong Shi Xuetao Hu Xiaobo Zou Jiewen Zhao Wen Zhang Xiaowei Huang Yaodi Zhu Zhihua Li Yiwei Xu 《Journal of Chemometrics》2016,30(8):442-450
A new heuristic and parallel simulated annealing algorithm was proposed for variable selection in near‐infrared spectroscopy analysis. The algorithm employs a parallel mechanism to enhance the search efficiency, a heuristic mechanism to generate high‐quality candidate solutions, and the concept of Metropolis criterion to estimate accuracy of the candidate solutions. Several near‐infrared datasets have been evaluated under the proposed new algorithm, with partial least squares leading to improved analytical figures of merit upon wavelength selection. Improved robust and predictive regression models were obtained by the new algorithm. The method could also be helpful in other chemometric activities such as classification or quantitative structure‐activity relationship problems. 相似文献
14.
近红外光谱快速测定高浓度烟酰胺 总被引:2,自引:0,他引:2
利用烟酰胺在乙醇溶液中波段范围为9001-8060cm^-1和7443-7144cm^-1的近红外一阶导数吸收光谱,经过中心化、矢量归一化预处理,应用偏最小二乘法回归来消除溶剂乙醇的近红外吸收干扰,建立了快速高浓度烟酰胺的方法。54个样本作为校正集,PLS最佳回归因子数为4时,决定系数等于0.997;线性范围为0.13-0.70mol/L。本方法应用于9个待测样品,预测相对偏差小于2.9%,结果令人满意,同时还讨论了一些影响回归精度的因素。 相似文献
15.
基于交互式自模型混合物分析的近红外光谱波长变量优选方法 总被引:1,自引:1,他引:1
为了提高近红外光谱定量分析的预测精度和建模效率,提出了一种基于交互式自模型的混合物分析的波长优选方法,根据光谱各波长变量的纯度值和标准差值,选择含有用信息的波长变量,并引入相关权函数解决变量间共线性问题.通过依次迭代选择的变量建立定量校正模型,由交互验证均方根预测误差(RMSECV)确定最佳波长变量个数.应用该波长变量优选方法对具有不同葡萄糖含量的两组(四成分葡萄糖水溶液实验和人体血浆实验)近红外光谱数据进行分析,两组数据中分别只选择了全部变量的0.3%建立定量校正模型,其验证集葡萄糖浓度的均方根预测误差(RMSEP)分别减少为669和15 mg/L.与全谱范围及优选波段建立的定量校正模型比较,本方法能够通过波长变量优选最小化冗余信息、提高预测精度及建模效率. 相似文献
16.
17.
Gentiana rigescens is one of the most important traditional Chinese medicines because of its therapeutic effects in protecting the liver and promoting bile discharge, anti‐hypertension, and spasm and pain relief. To enhance quality control, a comprehensive assessment of G. rigescens from different geographic origins by Fourier‐transform infrared (FTIR) in combination with chemometrics was conducted. Through pretreatment by the second derivative, spectrum standard deviation and Monte Carlo uninformative variable elimination (MC‐UVE), the characteristic FTIR spectra were selected and an identification model of the different geographic origins of G. rigescens was built by partial least squares discriminant analysis (PLS‐DA). The validation results showed that the accuracy rates of the model were 100%, 97.22%, and 100% for samples from Yunnan, Guizhou, and Sichuan, respectively. On the basis of the correlation between characteristic spectral points and the contents of swertiamarin, gentiopicroside, sweroside, and loganic acid, quantitative models were established by partial least squares regression (PLSR). The measured and predicted values were not significantly different as assessed through the paired t test (p > 0.05). Additionally, the characteristic spectra were interpreted, and 93 common peaks were selected. FTIR analysis combined with chemometric methods could accurately identify the different geographic origins of G. rigescens and rapidly predict the content of swertiamarin, gentiopicroside, sweroside, and loganic acid, thus providing a comprehensive method of evaluating traditional Chinese medicines. 相似文献
18.
Near infrared (NIR) spectrometry was used for the rapid characterization of quality parameters in desi chickpea flour (besan). Partial least square regression, principal component regression (PCR), interval partial least squares (iPLS), and synergy interval partial least squares (siPLS) were used to determine the protein, carbohydrate, fat, and moisture concentrations of besan. Spectra were collected in reflectance mode using a lab-built predispersive filter-based instrument from 700 to 2500?nm. The quality parameters were also determined by standard methods. The root mean square error (RMSE) for the calibration and validation sets was used to evaluate the performance of the models. The correlation coefficients for moisture, fat, protein, and carbohydrates in chickpea flour exceeded 0.96 using PLS and PCR models using the full spectral range. Wavelengths from 2100 to 2345?nm had the lowest RMSE for quality parameters by iPLS. The error was further decreased by 0.41, 0.1, and 1.1% for carbohydrates, fats, and proteins by siPLS. The NIR spectral regions yielding the lowest RMSE of prediction were 1620–2345?nm for carbohydrates, 1180–1590?nm and 1860–2094?nm for fat, and 1700–2345?nm for proteins. The study shows that chickpea flour quality parameters were accurately determined using the optimized wavelengths. 相似文献