首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 125 毫秒
1.
光谱数据变换和光谱特征波长提取是二种重要的光谱预处理方法,对消除环境等干扰具有重要的作用。以往文献主要对比研究不同的光谱数据变换方法,光谱特征波长提取方法的对比研究以及二者的组合研究较少。为了获取适宜的光谱预处理方法,提高潮间带沉积物氮的最小二乘支持向量机(LSSVM)模型精度,研究了4种光谱变换方法与3种特征波长提取方法组合对沉积物氮LSSVM模型精度的影响,以期实现潮间带沉积物氮的精确预测。研究结果表明,多元散射校正(MSC)或标准正态变换(SVN)光谱变换方法提高了光谱与氮含量的相关性,最高相关系数分别达到0.69和0.71;并且提高了LSSVM模型的预测精度,模型的预测R~2和RPD分别为0.88, 0.87和2.78, 2.69。无信息变量消除(UVE)特征波长提取方法也提高了LSSVM模型的预测精度,模型预测R~2和RPD分别0.89和2.70。但是, UVE提取的特征波长并不都与氮含量具有高相关性。此外,组合运用UVE特征波长提取方法和MSC或SVN光谱变换方法,也提高了模型预测精度,但并不优于单独运用UVE特征波长提取方法或单独运用MSC及SVN光谱变换方法。研究结果可为潮间带沉积物氮估算和光谱数据预处理提供技术参考。  相似文献   

2.
结球甘蓝是一种富含碳水化合物的常见蔬菜,可溶性糖含量是决定其品质的重要参数。可溶性糖易溶于水,是蔬菜和水果口味的有效调节剂。作为碳水化合物,可溶性糖由三种元素C,H和O组成,其分子吸收光谱主要由被检测材料的分子中C-H,O-H和CO等基团的组合频率吸收和倍频吸收组成,包含丰富的有机物信息。因此,采用近红外光谱和化学计量学方法,探索结球甘蓝可溶性糖含量的快速检测方法。用德国布鲁克公司的MATRIX-Ⅰ型傅里叶变换近红外光谱仪采集161份结球甘蓝样本光谱数据。波数范围:12 800~4 000 cm-1(780~2 500 nm)。蒽酮比色法测量样本的可溶性糖。综合应用马氏距离法(MD)和蒙特卡洛交叉验证法(MCCV)剔除异常样本,采用Kennard-Stone(K-S)法将样本按照给定比例划分为校正集和验证集。分别使用Savitzky-Golay卷积平滑(S-G),一阶导数(FD),二阶导数(SD),多元散射校正(MSC)和变量标准化(SNV)及它们的组合共12种方法对样本进行光谱预处理,获得最佳预处理方法,提高光谱数据的信噪比。采用竞争性自适应重加权采样法(CARS)筛选偏最小二乘回归(PLS)模型中回归系数绝对值大的波数点,去掉回归系数绝对值小的波数点,以有效选择与所测特性值相关的最优波数组合,获得具有良好鲁棒性和强预测能力的校正模型。使用模型决定系数R2、交互验证均方根误差(RMSECV)、预测均方根误差(RMSEP)作为模型精度评价指标。根据蒙特卡洛交叉验证法和马氏距离剔除异常样本的原理,共剔除10个光谱或者化学值异常的样本。最终参与建模分析的样本个数为151。异常样本剔除后,通过K-S法将样本按照3∶1被分成校正集(110个样本)和验证集(41个样本)。使用原始光谱数据,预处理后的光谱数据和对应于优选波数的光谱数据,建立PLS模型。结果表明,利用MSC+FD光谱预处理可以提高建模精度,校正集R2从处理前的0.68增长到0.93,MSC+FD是本研究中理想的光谱数据预处理方法。利用CARS法共优选了84个建模波数。在12 000~10 000 cm-1波数区域内,有O-H键2级和C-H键3级倍频伸缩振动吸收,此区域主要的背景信息为水和其他含氢基团,在此区域内共包含了36个选定的波数。在8 500~6 000 cm-1区域,存在糖类和水的O-H键的1级倍频伸缩振动吸收,葡萄糖的O-H键的1级倍频伸缩振动吸收,该区域是包含反映可溶性糖成分的主要光谱区间,背景影响较小,CARS方法在此区域共选择了15个建模波数。5 800~4 000 cm-1区域与12 000~10 000 cm-1区域相似,包含的选定波数多,CARS方法在此区域选择了33个建模波数。利用CARS对参与建模的波数进行优选,减少了无关信息,降低了模型的复杂度,选择的波数不但引入了表征待测组分的光谱,同时还引入了代表背景信息的光谱,使得校正模型适应性增强。建立了结球甘蓝可溶性糖的全谱PLS模型,根据CARS波数优选结果,建立了结球甘蓝可溶性糖的CARS-PLS模型。对于全谱PLS定量模型,校正集的决定系数R2为0.93,RMSECV为0.157 2%,RMSEP为0.132 8%。对于CARS-PLS模型,校正集的决定系数R2为0.96,RMSECV为0.076 8%,RMSEP为0.059 4%。数据表明,两种模型具有相当的R2,但CARS-PLS模型的RMSECV是全谱PLS模型的1/2。RMSEP也接近1/2,CARS-PLS模型比全谱PLS定量模型所用建模变量少,模型得到简化,精度更优。用CARS-PLS模型对验证集41个样本进行预测,预测集决定系数R2为0.86,预测标准误差为0.059 4%。提供了一种工作效率较高的结球甘蓝质量无损检测方法。  相似文献   

3.
针对天然气燃烧过程的近红外光谱数据,采用了一种融合波长选择和异常光谱检测的定量分析方法。该方法根据偏最小二乘(PLS)模型的系数及预测误差的统计分布,在实现波长选择的同时,完成异常光谱样本的检测。与PLS、先用留一法将异常样本删除后PLS建模(LOO-PLS)、基于PLS的无信息变量消除法(UVE-PLS)以及先用留一法将异常样本删除后使用UVE-PLS建模(LOO-UVE-PLS)相比较,该方法将甲烷预测模型的预测均方根误差(RMSEP)分别降低了14.33%,14.33%,10.96%和12.21%;将一氧化碳预测模型的RMSEP分别降低了67.26%,72.58%,11.32%和4.52%;将二氧化碳预测模型的RMSEP分别降低了5.95%,19.7%,36.71%和4.04%。实验表明,该方法建立的分析物预测模型具有较高的预测能力和较好的稳健性,在大大减少所选波长数量,降低模型复杂度的同时,还能有效地检测出异常光谱样本,减小两者之间的相互影响。  相似文献   

4.
为了快速检测油页岩总有机碳(TOC)含量,以松辽盆地某区块所取岩芯为研究对象,测量230个岩石样本的TOC含量和近红外光谱数据。利用蒙特卡洛法剔除异常样本14个,剩余的216个样本进行去趋势加基线校正方法预处理,采用连续投影算法(SPA)、无信息变量消除算法以及竞争自适应算法选取特征波长。使用SPXY方法对样本按照2∶1的比例划分为144个校正集和72个验证集,然后建立线性的偏最小二乘(PLS)模型以及非线性的支持向量机(SVM)模型和随机森林(RF)模型对油页岩TOC含量进行预测。采用测定系数(R2)和均方根误差(RMSE)作为模型的评价指标,探究不同特征波长选择方法对油页岩总有机碳建模的影响,比较不同建模方法对油页岩TOC含量预测的准确度。结果表明,特征波长提取能够起到优化模型的作用。SPA,UVE和CARS分别提取了16,253和65个波长,经过特征波长提取后模型测定系数均有提高,均方根误差均有下降,这说明进行特征波长优选对于简化模型、提高模型运算速度发挥着很重要的作用。此外,非线性的RF和SVM模型性能要优于线性模型PLS。这是因为油页岩中的碳存在于各类烃的中,不同类别含烃基团的吸收峰之间相互影响,使得油页岩总有机碳含量和近红外光谱数据之间存在着复杂的非线性关系,因此,非线性的SVM和RF模型能够表现出更好的效果。相比于其他模型,CARS-SVM模型验证集的测定系数(R2v)和均方根误差(RMSEV)表现出的结果较好,分别达到了0.906 6和0.222 0,该模型能够用于油页岩总有机碳含量的快速检测。研究结果说明,近红外光谱分析应用于油页岩TOC含量快速检测是可行的;建立的CARS-SVM模型能够表现出较好的预测效果,为我国油页岩TOC含量快速检测提供了一种新的方法和思路。  相似文献   

5.
为提高全血血红蛋白浓度预测模型的预测精度,基于近红外光谱分析,首先对原始全血透射光谱数据分别进行均值中心化、标准化、标准正态变量变换(SNV)、多元散射校正(MSC)以及Savitzky-Golay(SG)卷积平滑结合MSC的预处理操作,最终选择预处理效果最好的SG-MSC方法作为数据预处理方法,其最大相关系数达到0.944 1。对SG平滑的平滑窗口宽度进行讨论,找出平滑效果最好的窗口宽度为27。数据预处理消除了全血吸收光谱的基线失真,提高了全血吸收光谱数据的信噪比。将190个样本(190个血红蛋白浓度对应的透射光谱数据)分为具有相近血红蛋白浓度分布的校正集和测试集,其中校正集为143个样本(对应血红蛋白浓度分布为10.6~17.3 g·dL-1),测试集为47个样本(对应血红蛋白浓度分布为10.3~17.3 g·dL-1),确保建立模型的适用性。对校正集数据预处理后利用蒙特卡洛无信息变量消除(MC-UVE)方法对其进行波长变量选择,剔除含信息量少的波长点,提高含信息量多的波长占比。设置蒙特卡洛迭代次数为1 000,最终从全血吸收光谱的700个波长变量中筛选出191个波长变量用于建立全血血红蛋白浓度偏最小二乘(PLS)回归模型。对比分析原始全血透射光谱全谱PLS模型、原始全血吸收光谱全谱PLS模型、预处理全血吸收光谱全谱PLS模型、SG-MSC-MC-UVE-PLS模型以及已有二阶导数PLS模型的模型效果,表明基于SG-MSC-MC-UVE-PLS算法的全血血红蛋白浓度预测模型效果较其他模型效果更优,预测相关系数由0.676 3提高到0.979 1,预测集均方根误差由0.898 1减小到0.220 3,最大绝对误差由2.426 1减小到0.411 2。同时,利用MC-UVE方法进行波长变量选择,在保证预测精度的前提下,筛选出建模的波长个数更少,有利于提高模型计算效率。研究结果表明,SG-MSC-MC-UVE-PLS方法能够提高全血吸收光谱信号的信噪比,简化模型结构,提高模型的预测精度和计算效率,对推动血红蛋白浓度检测技术的发展具有进步意义。  相似文献   

6.
LSSVM模型下的近红外光谱联合区间波长筛选方法   总被引:2,自引:0,他引:2  
针对传统近红外光谱波长选择方法忽略模型中非线性因素的缺陷,采用具有非线性处理能力的最小二乘支持向量机,结合间隔策略的波长选择方法和联合区间的思想,提出了一种非线性模型下的波长筛选算法—联合区间最小二乘支持向量机(synergy interval least squares support vector machines, siLSSVM)。以苹果糖度近红外光谱数据为例,与传统siPLS波长筛选方法相比,新算法的预测集均方根误差(RMSEP)在PLS模型和LSSVM模型预测时分别提高了37.43%和47.88%,预测集相关系数(RP)在PLS模型和LSSVM模型预测时分别增加了6.04%和7.31%。实例表明,对于存在非线性因素较强的光谱数据,siLSSVM算法能够有效的挑选最优波长区间与提高模型的预测精度和鲁棒性,为近红外光谱在非线性因素下筛选波长提供了新前景。  相似文献   

7.
采用高光谱成像技术结合不同的特征提取方法,实现了对草莓可溶性固形物含量的检测。通过提取154颗成熟无损伤草莓的高光谱图像的874~1 734 nm范围光谱信息,对941~1 612 nm光谱采用移动平均法(moving average,MA)进行预处理。基于残差法剔除19个异常样本后将剩余135个样本分为建模集(n=90)和预测集(n=45)。采用连续投影算法(successive projections algorithm, SPA),遗传偏最小二乘算法(genetic algorithm-partial least squares, GAPLS)结合连续投影算法(GAPLS-SPA),加权回归系数(weighted regression coefficient, Bw)以及CARS法(competitive adaptive reweighted sampling)选择特征波长分别提取14,17,24与25个特征波长,并采用主成分分析(principal component analysis, PCA)与小波变换(wavelet transform, WT)分别提取20与58个特征信息。分别基于全波段光谱、特征波长与特征信息建立PLS模型。所有模型都取得了较好的效果,基于全波段光谱的PLS模型与基于WT提取的特征信息的PLS模型的效果最优,建模集相关系数(rc)与预测集相关系数(rp)均高于0.9。结果表明高光谱成像技术结合特征提取方法可用于草莓可溶性固形物含量的检测。  相似文献   

8.
为了实现快速检测果珍中的二氧化钛含量,提出了应用近红外光谱技术结合化学计量学的快速检测方法。研究采用了320份果珍样本进行光谱特性的检测,其中200个样本用来建模,120个样本进行预测。首先比较了标准正态变量校正(SNV)、变量标准化(Normalize)、多元散射校正(MSC)等6种不同的数据预处理方法对偏最小二乘法(PLS)建模预测效果的影响。然后将PLS模型与应用主成分(PC)建立的主成分-神经网络校正(PC-ANN)模型进行比较。结果表明,MSC预处理的效果最好,PLS模型的最佳主成分数为7,预测值与标准值的相关系数R2达0.900 8,预测标准误差RMSEP为0.05。PC-ANN模型预测值与标准值的R2为0.868 4,RMSEP为0.04。说明PLS模型比PC-ANN模型的预测效果好。同时本研究也说明能够应用可见/近红外技术对二氧化钛进行快速定量测定。  相似文献   

9.
为了克服单一模型预测精度很难进一步提高的不足,利用近红外光谱分析结合基于Stacking框架的异构集成学习模型实现对油页岩含油率的检测。以松辽盆地某区块所取230个油页岩岩芯样本为研究对象,使用低温干馏法测量油页岩样本的含油率,同时扫描每个样本对应的近红外光谱数据。样本使用蒙特卡洛算法进行异常样本剔除,将剔除异常样本后的213个数据按照3∶1的比例随机划分为训练集和预测集。利用去趋势加基线校正方法进行预处理消除光谱数据中噪声和基线漂移,利用随机森林算法进行波长重要性排序并保留重要波长,在此基础上采用CARS算法进行特征波长提取,进一步降低数据维度。最后,构建以PLS, SVM, RF和GBDT为初级学习器,PLS回归模型为次级学习器的Stacking集成学习模型,各初级学习器模型参数使用网格搜索进行寻优。使用决定系数和预测均方根误差作为各模型的评价指标,探究单一模型和集成学习模型对油页岩含油率预测的准确性。研究结果表明,RF-CARS方法能够有效筛选重要波长,进而提高模型效率。基于Stacking的异构集成学习模型与单一模型(SVM和PLS)和同构集成学习模型(RF和GBDT)相比有更...  相似文献   

10.
基于高光谱的GA和SPA算法对赣南脐橙叶绿素定量分析   总被引:4,自引:0,他引:4  
用遗传算法(GA)和连续投影算法(SPA)分别提取了赣南脐橙叶片高光谱图像的有效信息,对叶绿素的含量用偏最小二乘法(PLS)进行建模定量分析。高光谱图像标定后,提取感兴趣区域(ROI)的平均光谱,用GA和SPA算法分别选出了27和8条特征波长,然后用PLS对叶绿素含量建模。GA-PLS与SPA-PLS模型得到的预测集相关系数分别为0.80和0.83,均方根误差分别为2.45和2.30。结果表明:SPA-PLS模型具有较高的优势,可以结合高光谱技术对赣南脐橙叶绿素含量快速、无损的定量分析。  相似文献   

11.
为实现近红外光谱进行勾兑梨汁中原汁含量的快速检测,采用相同可溶性固形物含量的新鲜梨汁和果汁粉冲剂按照原汁含量为0%~100%进行勾兑,并结合遗传算法(GA)、粒子群算法(PSO)以及萤火虫算法(GSO & FA)进行特征波长筛选,比较分析四种算法分别建立的偏最小二乘(PLS)模型。结果表明,GA-PLS,PSO-PLS,GSO-PLS,FA-PLS四种模型均能够剔除大部分波长变量,其中以FA-PLS模型效果最佳,不仅保证模型的稳健性,而且简化了模型,提高了预测的精度。为了进一步优选特征波长,利用连续投影算法(SPA)在FA基础上做进一步波长筛选,并比较全波段PLS,SPA-PLS,FA-PLS,FA-SPA-PLS模型,四种模型泛化能力为:FA-PLS>PLS>FA-SPA-PLS>SPA-PLS,其预测均方根误差分别为0.029 1,0.033 3,0.033 9和0.137 0,相应的波长变量数量依次367,765,20和18。其中SPA-PLS波长变量最少,但预测误差远远高于其他三种模型,综合考虑预测精度与波长变量数目,FA-SPA-PLS模型不仅波长变量较少而且预测精度较高,能够有效鉴别勾兑梨汁中原汁含量。研究利用近红外光谱技术为快速鉴别勾兑果汁提供一种有益思路,并通过波长变量筛选简化定量分析模型。  相似文献   

12.
高光谱图像信息的柑橘叶片光合色素含量分析技术研究   总被引:2,自引:0,他引:2  
暗箱环境下采集柑橘叶片高光谱图像,采用阈值法提取整叶有效光谱信息区域的平均光谱,比对分析了柑橘叶片光谱信息不同预处理方法和光谱PLS、BPNN和LS-SVM预测模型对叶绿素a、叶绿素b和类胡萝卜素等光合色素含量的预测精度。结果显示,采用MSC对原始光谱进行预处理和LS-SVM建模对叶绿素a含量的预测效果较好,Rp达0.898 3,RMSEP为0.140 4;采用SNV光谱预处理和LS-SVM模型对叶绿素b含量的预测其Rp为0.912 3,RMSEP为0.042 6;采用MAS预处理和PLS模型对于类胡萝卜素含量预测的Rp和RMSEP分别为0.712 8和0.062 4。结果表明:采用高光谱图像信息可较好地进行柑橘叶片叶绿素a,叶绿素b和类胡萝卜素等光合色素含量的预测,为进一步研究柑橘叶片光合色素含量与组分构成的非损伤实时检测提供了依据。  相似文献   

13.
基于CARS和K-S的马拉硫磷农药浓度吸收光谱预测模型研究   总被引:2,自引:0,他引:2  
利用马拉硫磷在紫外/可见光波长范围内的不同浓度梯度的吸光度光谱数据,建立其快速有效的定量预测分析模型。在预测模型的建立过程中,参与建模的波长变量和校正集样本的优劣对定量分析模型的预测能力有着决定性作用。首先对实验样本是否存在异常样本进行检查,然后将200.08~750.04 nm波长范围的光谱数据采用不同预处理方法并建立PLS模型,进而将预处理结果最优(均值中心化)的光谱数据采用竞争性自适应重加权采样(CARS)算法和蒙特卡洛无消息变量消除法(MC-UVE)分别筛选出关键波长变量并建立相应的PLS预测模型,模型结果表明, CARS算法在关键变量筛选的性能上优于MC-UVE算法;再将CARS算法筛选出的18个波长变量(为原来变量数的1.137 8%)结合Kennard-Stone (K-S)算法和蒙特卡洛交叉验证(MCCV)分别优选出的44个建模样本(原来样本数的88%)建立CARS-K-S_s-PLS和CARS-CCV_s-PLS定量预测模型,R■分别为0.998 2和0.998 9, RMSEP分别为0.863 4和1.026 2, RPD分别为24.163 5和20.330 1, CARS-K-S_s-PLS模型略优于CARS-CCV_s-PLS模型。结果表明, CARS算法能够淘汰与样本浓度相关性较弱的变量,同时有效剔除无关光谱信息, K-S算法能帮助选择更优的建模样本集,马拉硫磷农药的紫外/可见光吸收光谱结合CARS算法和K-S算法所建立的CARS-K-S_s-PLS模型能够用来定量预测马拉硫磷农药浓度。研究工作为利用光谱技术快速检测有机磷农药浓度提供一定的理论依据和实验基础,在有机磷农药快速检测领域具有良好的应用前景。  相似文献   

14.
提出了一种基于偏最小二乘增量式神经网络的近红外光谱定量分析模型。该模型采用典型三层反向传播神经网络(BPNN),不同波长吸光度和成分浓度是模型的输入和输出。在使用历史样本训练之前先进行偏最小二乘(PLS)回归,所得自变量和因变量的历史负荷矩阵分别用于确定模型输入层和输出层的初始权值,且自变量的主成分个数作为隐层的节点数。当获得新的样本时,对新数据与历史负荷矩阵组合后进行PLS回归,将所得新的负荷矩阵与历史负荷矩阵融合后作为模型输入层和输出层新的初始权值,接着使用新样本对模型进行训练来实现增量式更新。将所提模型与PLS、BPNN、基于PLS的BPNN、递归PLS在天然气燃烧烟气近红外光谱数据上测定后比较。对于烟气中二氧化碳浓度的预测,所提模型的预测均方根误差(RMSEP)分别降低了27.27%,58.12%,19.24%和14.26%;对于烟气中一氧化碳浓度的预测,所提模型的RMSEP分别降低了20.65%,24.69%,18.54%和19.42%;对于烟气中甲烷浓度的预测,此模型的RMSEP分别降低了27.56%,37.76%,8.63%和3.20%。实验结果表明,所提模型不仅通过PLS对BPNN结构和初始权重的优化,使模型具有较强的预测能力,而且能在已建模型信息的基础上,不访问旧数据而用新增样本即可完成自身的增量式更新,从而使模型具有较好的稳健性和泛化性。  相似文献   

15.
为了提高对蓝莓果渣的开发利用,探索了近红外光谱测定三种蓝莓(北陆、蓝美1号、灿烂)果渣中花色苷含量的可行性。通过DA7200采集三种蓝莓果渣的近红外光谱,利用PCA-MD对北陆、蓝美1号、灿烂果渣分别剔除1, 4和8个异常样本。运用K-S划分样本集得到校正集(686个样本)和验证集(171个样本)。对样本集分别进行归一化、变量标准化(SNV)、多元散射校正(MSC)、 Norris一阶导数(NFD)、 Norris二阶导数(NSD)、 SG卷积一阶导数(SGCFD)、 SG卷积二阶导数(SGCSD)、 Savitzky-Golay(SG)卷积平滑、正交信号校正预处理,并建立相应全谱PLS模型。比较并选择MSC、 SGCSD、 SG卷积平滑、正交信号校正,进行预处理方法顺序组合的比较,结果显示,全谱PLS模型中最优预处理方法为正交信号校正+SGCSD+SG卷积平滑,其R■为0.940 0、R■为0.886 7、 RMSEC为0.722 5、 RMSECV为0.246 2、 RMSEP为1.000 5、 RPD为2.970 8。利用SPA和CARS对预处理过的光谱数据分别进行波长变量的筛选,依次建立PLS回归模型,并定量分析其对蓝莓果渣花色苷的预测能力。在所有预处理方法进行波长变量筛选中, SPA与CARS算法均可以有效地筛选出波长变量,但SPA筛选出的波长变量,无法全部建立PLS回归模型,而CARS算法筛选出的波长变量,均可建立PLS回归模型。数据表明, CARS-PLS最佳组合为正交信号校正+MSC+SG卷积平滑+SGCSD,选择波长数为25个,相较于原始光谱,其R■从0.900 8增长到0.940 3,R■从0.881 8增长到0.885 7, RMSEC从0.929 1减少到0.720 9, RMSECV从0.317 6减少到0.245 6, RMSEP从1.021 8减少到1.004 9, RPD从2.908 8增长到2.957 5。近红外光谱的蓝莓果渣花色苷含量测定中,正交信号校正表现出强大的去噪效果, CARS算法具有简化模型、适用性较好和预测精度较高等优点。研究结果表明,应用近红外光谱技术可以较好地实现三种不同品种蓝莓果渣中花色苷含量的测定,可为蓝莓果渣品质分级提供一种快速、支持大样本量的检测方法。  相似文献   

16.
通过偏最小二乘法(PLS)分别建立去皮前后苹果硬度的近红外回归模型.采用光谱附加散射校正(MSC)、微分处理(Derivative)、直接正交信号校正(DOSC)等预处理方法和基于遗传算法(GA)的有效波段选择方法来消除果皮对模型精度的影响.结果表明,苹果果皮对近红外光谱分析模型的预测能力有很大影响,但仅通过常规的光谱预处理方法(MSC、Derivative)很难有效消除.文章提出的遗传算法结合直接正交信号校正(GA-DOSC)方法能有效消除果皮的影响,不但使所建模型的波长点和最佳主因子数分别由1480和5降到36和1;其相关系数r由0.753提高到0.805,更重要的是模型的预测相对误差RSDp从16.71%显著下降到12.89%,并接近采用苹果果肉建模的预测性能(12.36%),达到了对苹果硬度的近红外无损检测要求.  相似文献   

17.
牛肉丸是一种口感独特的肉类深加工食品。不法商贩为了谋取利益,在牛肉中掺入猪肉、鸡肉等廉价肉制作肉丸冒充纯牛肉丸售卖。传统的肉品掺假检测方法费时费力,成本高昂。高光谱成像技术具有快速无损、低成本等优点,因此对牛肉丸中掺假猪肉和鸡肉进行高光谱成像检测。首先分别制作纯牛肉丸和混有掺假肉猪肉和鸡肉的牛肉丸,掺假肉占原料肉质量比例分别为5%, 10%, 15%, 20%, 25%。采集所有肉丸样本的高光谱信息并提取光谱数据。分别采用1~(st) Der, 2~(nd) Der, MC, MSC, SG和SNVT六种预处理方法对所提取光谱进行预处理,建立全波段下偏最小二乘(PLS)掺假含量预测模型,并比较模型预测效果得出最佳预处理方法。对最佳预处理方法处理后的光谱数据进行特征波长的筛选,筛选方法有:连续投影法(SPA)、竞争性自适应重加权算法(CARS)、联合区间偏最小二乘法(siPLS),并创新性地联用siPLS与CARS的联合区间偏最小二乘-竞争性自适应重加权算法(siPLS-CARS)。最后比较不同波长筛选方法下的模型预测效果。研究表明,牛肉丸掺猪肉和鸡肉PLS预测模型最佳预处理方法分别为MSC和1~(st) Der。SPA, CARS和siPLS-CARS分别筛选了掺猪肉样品光谱中的13, 51和32个特征波长, siPLS将全光谱分为14个子区间,联合第1, 3, 7, 13子区间进行建模,其中CARS筛选波长后的PLS预测模型效果最好,R_C和R_P分别为0.981 4和0.972 1, RMSECV和RMSEP分别为0.016 3和0.020 3。SPA, CARS和siPLS-CARS分别筛选了掺鸡肉光谱中的15, 61和28个特征波长, siPLS将全光谱分为15个子区间,联合第7, 8, 11, 12子区间进行建模,最佳波长筛选方法也是CARS,此时PLS预测模型R_C和R_P分别为0.990 2和0.987 8, RMSECV和RMSEP分别为0.012 3和0.012 6。siPLS-CARS相比于siPLS不仅缩减了特征波长数量,且提高了模型预测的精度;相比于CARS筛选出的波长更少,但精度略低。掺鸡肉样品预测模型效果整体优于掺猪肉样品。研究结果表明高光谱成像技术可以实现牛肉丸中掺假的含量预测,为牛肉丸掺假快速检测提供理论基础。  相似文献   

18.
基于高光谱成像技术的油菜叶片SPAD值检测   总被引:11,自引:0,他引:11  
以油菜叶片为研究对象,利用高光谱成像技术,成功建立了叶绿素相对值SPAD值的预测模型。共采集了160个油菜叶片样本在380~1030 nm范围内的高光谱图像。选择500~900 nm之间的平均光谱作为油菜叶片样本的光谱。利用蒙特卡罗最小二乘法(monte carlo partial least squares, MC-PLS)剔除了13个异常样本,基于剩余的147个样本光谱数据与SPAD测量值进行分析,采用了不同的方法建立了多种预测模型,包括:全光谱的偏最小二乘法(partial least squares, PLS)模型,连续投影算法(successive projections algorithm, SPA)选择特征波长的PLS预测模型,“红边”位置(λred)的简单经验估测模型,三种植被指数R710/R760,(R750-R705)/(R750-R705)和R860/(R550*R708)分别建立的简单经验估测模型,以及基于这三种植被指数的PLS预测模型。建模结果显示,全光谱的PLS模型预测效果最为精确,其预测相关系数rp为0.833 9,预测均方根误差RMSEP为1.52。而使用SPA算法选出的8个特征波长所建立的PLS模型其预测结果可达到与全光谱的PLS模型非常接近的水平,而且在保证一定精度的条件下减少了大量运算,节省了运算时间,大幅提高了建模的速度。而基于红边位置和选择的三种植被指数而建立的简单经验估计模型其预测结果虽与基于全光谱的PLS预测模型有一定差距,但模型简单、运算量小,适合用于对精度要求不高的场合,对后续的便携仪器设备开发有一定的指导作用。  相似文献   

19.
为实现畜禽粪便高效、安全资源化利用,快速、准确定量表征分析畜禽粪便中钙(Ca)元素含量具有重要意义。以我国畜禽养殖比较集中地区的代表性畜禽粪便样本为对象,探讨了LIBS快速、定量分析其Ca元素含量模型构建和通过GA筛选变量优化模型的可行性。采集光谱的仪器参数设置如下:采集点数、激光能量、压制样压力、光斑大小和延迟时间分别为80个,15%,20 T,400 μm和1 μs。建模结果表明:采用基于Ca元素特征波长所建三种线性模型精度较低;基于全谱的PLS所建模型中,R2v和RPD分别为0.85和2.13;选用化学计量学方法-遗传算法进行变量筛选可显著减少建模变量信息,提高建模效率,经GA优选所得12个变量所建PLS模型中R2v和RPD为0.90和3.04,具有较高精度和实际应用价值。研究表明,将激光诱导击穿光谱技术和遗传算法相结合可定量分析畜禽粪便中Ca元素含量。  相似文献   

20.
甲醇汽油是一种清洁能源,甲醇汽油中甲醇的含量决定了汽油的性能。通过中红外光谱对甲醇汽油中甲醇含量进行定量检测和分析。首先,对采集的甲醇汽油原始中红外光谱进行平滑处理(smoothing)、多元散射校正(MSC)、基线校正(baseline)、归一化(normalization)等预处理,再建立PLS模型,对比选择最佳预处理方法,结果表明:在多元散射校正(MSC)处理后建立的PLS模型效果最好,模型的预测集相关系数r为0.918,预测均方根误差RMSEP为2.107。为进一步简化模型,提高预测精度,采用无信息变量消除(uninformative variable elimination, UVE)方法对波长进行筛选,将UVE波段筛选之后的作为模型的输入变量,采用偏最小二乘法(partial least squares, PLS)、主成分回归(principal components regression, PCR)和最小二乘支持向量机(least square support vector machine, LSSVM)三种方法分别建立甲醇汽油中甲醇含量的定量预测模型,并比较不同模型的预测效果和结果。结果表明,使用无信息变量消除可以较好提高数据的运算速度,其中,UVE-PLS模型建模效果最好,r和RMSEP分别为0.923和2.075。该实验表明中红外光谱检测甲醇汽油中甲醇含量是可行的并可以得到较好的效果;UVE是一种对甲醇汽油的中红外光谱非常有效的波段筛选方法,该模型的建立对石油化工领域具有较为重要的意义。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号