首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到15条相似文献,搜索用时 140 毫秒
1.
有关调和油快速准确定量检测的研究对于调和油质量控制具有重要意义。以往对调和油定量分析的研究大多集中于二元、三元和四元调和油,对更高元数调和油的研究很少,难以满足调和油检测需求。该研究的目的是探讨近红外光谱结合化学计量学对五元调和油中各单组分油进行定量分析的可行性。由玉米油、大豆油、稻米油、葵花油和芝麻油配制成51个五元调和油样品,并采集各样品12 000~4 000 cm-1范围内的近红外透射光谱。首先,采用光谱-理化值共生距离(SPXY)算法将调和油样品划分为38个校正集和13个预测集样品。其次,考察了主成分回归(PCR)、偏最小二乘(PLS)、支持向量回归(SVR)、人工神经网络(ANN)、极限学习机(ELM)等五种多元校正方法对五元调和油各组分定量分析的建模效果。然后,在最佳建模方法的基础上比较了SG平滑、标准正态变量(SNV)、多元散射校正(MSC)、一阶导数(1st Der)、二阶导数(2nd Der)和连续小波变换(CWT)六种光谱预处理方法,并讨论了预处理方法有效地原因。最后,在最佳预处理方法的基础上进一步利用竞争自适应重加权采样(CARS)和蒙特卡罗无信息变量消除法(MCUVE)筛选与预测组分相关的变量。结果显示,在五种建模方法中,PLS是最佳的建模方法,对玉米油、大豆油、稻米油、葵花油和芝麻油五种组分的预测均方根误差(RMSEP)分别为5.564 4,5.559 2,3.592 6,7.421 8和4.193 0。经过光谱预处理-变量选择,再建立PLS模型,对五种组分的RMSEP分别降低至1.955 3,0.562 4,1.145 0,1.619 0和1.067 1,预测相关系数(Rp)均高于0.98,表明采用合适的光谱预处理和变量选择方法,可以明显提高五元调和油中各单组分油定量分析的预测准确度。该研究为多组分调和油的快速无损定量检测提供了一种参考。  相似文献   

2.
柑橘叶片叶绿素含量的准确检测对柑橘营养状况和生长态势具有极其重要的意义。研究了快速无损诊断柑橘叶片中叶绿素含量的方法,以期为拉曼光谱检测技术用于柑橘叶片叶绿素含量检测提供参考。采集不同冠层高度和不同地理分布的柑橘叶片120片,拭去叶片表面的灰尘,用去离子水对其清洗、晾干装入密封袋中并用标签分类标注。然后对柑橘叶片进行拉曼光谱采集,参数设置如下:分辨率为3 cm-1,积分时间为15 s;激光功率为50 mW。分别采用BaselineWavelet、迭代限制最小二乘(IRLS)和不对称最小二乘(ALS)三种算法对柑橘叶片的拉曼光谱背景进行扣除,使用偏最小二乘(PLS)方法建立定量模型;四种光谱预处理方法归一化(Normalization),Savitzky-Golay卷积平滑(SG smoothing, SG平滑)、多元散射校正(MSC)和Savitzky-Golay一阶导数(SG 1st Der)对扣除背景后的光谱进行进一步的优化处理。结果表明:采用原始光谱、BaselineWavelet、IRLS、ALS背景扣除处理后的光谱建立PLS模型,模型的相关系数r分别为0.858,0.828,0.885和0.862,交互验证均方根误差(RMSECV)分别为5.392,5.870,4.934和5.336,最佳因子数分别为8,3,8和8;IRLS背景扣除处理后的PLS模型的RMSECV最小,相关系数最高,建模效果最好。分别采用SG平滑、归一化、MSC和SG 1st Der预处理方法对IRLS背景扣除后光谱进行预处理并建立PLS模型,结果表明:IRLS光谱及其结合SG平滑、归一化、MSC和SG 1st Der四种预处理方法的PLS模型的R分别为0.885,0.897,0.852,0.863和0.888,RMSECV分别为4.934,4.715,5.595,5.182和4.962;最佳因子数分别为8,8,8,8和5;IRLS-SG平滑后PLS模型的RMSECV最小,模型效果最优。对IRLS-SG平滑预处理后的PLS模型展开验证,预测相关系数r为0.844,预测均方根误差(RMSEP)为5.29,预测精确度较高。采用拉曼光谱结合三种光谱背景扣除方法和四种预处理方法对柑橘叶片叶绿素含量进行定量分析表明:采用IRLS背景扣除结合SG平滑预处理后的PLS模型最优,建模集r为0.897,RMSECV为4.715;预测集r为0.844,RMSEP为5.29,预测精度较高。拉曼光谱结合背景扣除方法可以为柑橘叶片叶绿素含量的定量分析提供一种快速简便的分析方法。  相似文献   

3.
为了提高对蓝莓果渣的开发利用,探索了近红外光谱测定三种蓝莓(北陆、蓝美1号、灿烂)果渣中花色苷含量的可行性。通过DA7200采集三种蓝莓果渣的近红外光谱,利用PCA-MD对北陆、蓝美1号、灿烂果渣分别剔除1, 4和8个异常样本。运用K-S划分样本集得到校正集(686个样本)和验证集(171个样本)。对样本集分别进行归一化、变量标准化(SNV)、多元散射校正(MSC)、 Norris一阶导数(NFD)、 Norris二阶导数(NSD)、 SG卷积一阶导数(SGCFD)、 SG卷积二阶导数(SGCSD)、 Savitzky-Golay(SG)卷积平滑、正交信号校正预处理,并建立相应全谱PLS模型。比较并选择MSC、 SGCSD、 SG卷积平滑、正交信号校正,进行预处理方法顺序组合的比较,结果显示,全谱PLS模型中最优预处理方法为正交信号校正+SGCSD+SG卷积平滑,其R■为0.940 0、R■为0.886 7、 RMSEC为0.722 5、 RMSECV为0.246 2、 RMSEP为1.000 5、 RPD为2.970 8。利用SPA和CARS对预处理过的光谱数据分别进行波长变量的筛选,依次建立PLS回归模型,并定量分析其对蓝莓果渣花色苷的预测能力。在所有预处理方法进行波长变量筛选中, SPA与CARS算法均可以有效地筛选出波长变量,但SPA筛选出的波长变量,无法全部建立PLS回归模型,而CARS算法筛选出的波长变量,均可建立PLS回归模型。数据表明, CARS-PLS最佳组合为正交信号校正+MSC+SG卷积平滑+SGCSD,选择波长数为25个,相较于原始光谱,其R■从0.900 8增长到0.940 3,R■从0.881 8增长到0.885 7, RMSEC从0.929 1减少到0.720 9, RMSECV从0.317 6减少到0.245 6, RMSEP从1.021 8减少到1.004 9, RPD从2.908 8增长到2.957 5。近红外光谱的蓝莓果渣花色苷含量测定中,正交信号校正表现出强大的去噪效果, CARS算法具有简化模型、适用性较好和预测精度较高等优点。研究结果表明,应用近红外光谱技术可以较好地实现三种不同品种蓝莓果渣中花色苷含量的测定,可为蓝莓果渣品质分级提供一种快速、支持大样本量的检测方法。  相似文献   

4.
为提高全血血红蛋白浓度预测模型的预测精度,基于近红外光谱分析,首先对原始全血透射光谱数据分别进行均值中心化、标准化、标准正态变量变换(SNV)、多元散射校正(MSC)以及Savitzky-Golay(SG)卷积平滑结合MSC的预处理操作,最终选择预处理效果最好的SG-MSC方法作为数据预处理方法,其最大相关系数达到0.944 1。对SG平滑的平滑窗口宽度进行讨论,找出平滑效果最好的窗口宽度为27。数据预处理消除了全血吸收光谱的基线失真,提高了全血吸收光谱数据的信噪比。将190个样本(190个血红蛋白浓度对应的透射光谱数据)分为具有相近血红蛋白浓度分布的校正集和测试集,其中校正集为143个样本(对应血红蛋白浓度分布为10.6~17.3 g·dL-1),测试集为47个样本(对应血红蛋白浓度分布为10.3~17.3 g·dL-1),确保建立模型的适用性。对校正集数据预处理后利用蒙特卡洛无信息变量消除(MC-UVE)方法对其进行波长变量选择,剔除含信息量少的波长点,提高含信息量多的波长占比。设置蒙特卡洛迭代次数为1 000,最终从全血吸收光谱的700个波长变量中筛选出191个波长变量用于建立全血血红蛋白浓度偏最小二乘(PLS)回归模型。对比分析原始全血透射光谱全谱PLS模型、原始全血吸收光谱全谱PLS模型、预处理全血吸收光谱全谱PLS模型、SG-MSC-MC-UVE-PLS模型以及已有二阶导数PLS模型的模型效果,表明基于SG-MSC-MC-UVE-PLS算法的全血血红蛋白浓度预测模型效果较其他模型效果更优,预测相关系数由0.676 3提高到0.979 1,预测集均方根误差由0.898 1减小到0.220 3,最大绝对误差由2.426 1减小到0.411 2。同时,利用MC-UVE方法进行波长变量选择,在保证预测精度的前提下,筛选出建模的波长个数更少,有利于提高模型计算效率。研究结果表明,SG-MSC-MC-UVE-PLS方法能够提高全血吸收光谱信号的信噪比,简化模型结构,提高模型的预测精度和计算效率,对推动血红蛋白浓度检测技术的发展具有进步意义。  相似文献   

5.
采用偏最小二乘法(PLS)和光谱Savitzky-Golay(SG)平滑方法,建立甘蔗清糖浆锤度近红外光谱分析的优化模型。基于最优单波长模型预测效果划分定标集和预测集。全谱(400—2500nm)经过SG平滑处理后用PLS方法建模。建立计算机算法平台,把483种SG平滑模式和1—40的PLS因子数任意组合分别建立PLS模型,根据预测效果选出最优模型,最优模型的SG平滑模式为二阶导数平滑、4、5次多项式类型、43平滑点数,PLS因子数为13,预测均方根偏差(RMSEP)、相对预测均方根偏差(RRMSEP)和预测相关系数(rP)分别为0.433%、0.69%和0.978。预测精度很高,并且大幅度优于未做SG平滑处理直接PLS建模的预测效果。从而表明,SG平滑模式和PLS因子数的联合大范围筛选能够有效地应用于近红外光谱分析的模型优选。  相似文献   

6.
紫米是生活中常见的食材,具有丰富的营养价值。由于紫米价格较高导致染色紫米大量流入市场。本文使用太赫兹时域光谱技术结合化学计量学方法探索紫米掺假的快速检测方法。采用太赫兹时域光谱技术(THz-TDS)采集0~7 THz范围内紫米掺假的光谱数据,并选择0.5~2.5 THz波段的吸收系数谱和折射率谱进行分析并采用化学计量学方法对光谱数据进行建模分析。分别采用Savitzky-Golay卷积平滑(SG Smoothing,SG平滑)、基线校正(Baseline)、归一化(Normalization)、多元散射校正(MSC)等方法进行光谱预处理,结合偏最小二乘判别分析(PLS-DA)对紫米、紫米掺染色大米和紫米掺染色黑米进行定性分析。定性分析结果显示,通过主成分分析(PCA)的三种样品平面分布存在明显差异;经过基线校正的光谱数据建立的PLS-DA模型效果最佳,误判率为0。接着使用偏最小二乘法(PLS)结合SG平滑、 Baseline、 Normalization、 MSC等预处理方法分别对紫米中掺染色大米和紫米中掺染色黑米的光谱数据建立PLS定量模型。结果显示,采用基线校正预处理方法的PLS建模效果最佳,紫米掺染色大米的预测集相关系数为0.936,预测集均方根误差(RMSEP)为0.095。紫米掺染色黑米的预测集相关系数为0.914,预测集均方根误差为0.096。为对比分析线性(PLS)与非线性(LS-SVM)两种定量模型方法的预测精度,采用相同预处理方法后的紫米掺假含量光谱数据建立最小二乘支持向量机(LS-SVM)预测模型,选用径向基函数(RBF)作为核函数。结果表明采用基线校正处理后LS-SVM模型效果最佳,紫米中掺染色大米的预测集均方根误差(RMSEP)为0.092,预测集相关系数(R_p)为0.979;紫米中掺染色黑米的预测集均方根误差(RMSEP)为0.093,预测集相关系数(R_p)为0.948。对比发现对紫米掺假的含量建立LS-SVM预测模型较PLS模型的稳定性更好、精确度更高。研究表明,太赫兹时域光谱结合化学计量学方法可为紫米掺假的定性定量分析提供快速精确的分析方法。  相似文献   

7.
提高土壤全氮含量检测的精确性对于精准农业具有非常重要的意义。本文基于近红外光谱技术,对光谱数据预处理方法进行研究。以土壤全氮含量为检测对象,采用平滑+一阶导数、基线校正+归一化、一阶导数+归一化等方法对采集样品的光谱数据进行预处理方法干预,并运用PLS算法分别建立土壤全氮含量的预测模型,分析不同种预处理方法对于近红外光谱建模精度的影响。实验结果表明应用基线校正+归一化处理后建模得到的预测均方根误差RMSEP为0.025,决定系数R~2为0.98,预测精度最佳。  相似文献   

8.
平滑、导数、基线校正对近红外光谱PLS定量分析的影响研究   总被引:16,自引:1,他引:15  
基于偏最小二乘法 ,利用平滑、导数、基线校正预处理手段 ,对近红外光谱进行了定量分析 ,比较了分析结果 ,给出了不同预处理方法的PRESS值和RMSEC的值 ,比较并选取了最佳预处理方法。在平滑预处理方法中 ,比较了不同平滑点数对预测的影响 ,确定了最佳平滑点数 ,通过采用PLS回归分析 ,与原始光谱数据回归比较 ,结果令人满意。  相似文献   

9.
茶是世界上最受欢迎的饮料之一,而氮素(N)是影响茶叶品质的主要成分之一,因此快速准确地估算N素含量至关重要。由于测定N含量的化学方法繁琐耗时,利用高光谱对茶鲜叶中N含量进行预测,利用连续小波转换(CWT)提取的小波系数,探究CWT不同分解层数对于N素含量的估测能力,并讨论了不同波长选择算法所建模型的预测效果。首先,采集广东省英德市茶园的151个茶鲜叶样品高光谱数据,将获得的原始光谱通过卷积平滑(SG)、去趋势(Detrending)、一阶导数(1st)、多元散射校正(MSC)和标准正态变量变换(SNV)五种预处理方法进行预处理并作为参考。其次,采用连续小波对原始光谱进行初步处理生成多尺度小波系数,并进行相关性分析, 分别利用连续投影算法(SPA)、竞争性自适应加权采样法(CARS)和变量组合集群分析(VCPA)方法进一步优化CWT变换后光谱数据的变量空间,最后,以特征变量为输入使用PLSR建立了N素定量监测模型,并对比不同尺度不同方法估算N素的效果。结果表明,连续小波分析方法可有效提升茶鲜叶光谱对N素含量的估测能力,明显优于常规光谱处理方法。经连续小波分解后,对茶鲜叶N素的预测能力随分解尺度的增加整体呈逐步降低的趋势,其中在1~6尺度连续小波变换后的光谱与茶鲜叶N素存在良好的相关性,表明小尺度的连续小波分解可有效应用于茶鲜叶N含量的监测。基于CWT(1)-VCPA方法建立的模型精度最高,且变量数相比于全波段减少了99.34%,其建模与预测R2达到0.95和0.90,相比于传统光谱处理方法,精度提升了11% ,证明CWT-VCPA可以有效降低光谱维度并大幅提升模型精度。实现了茶叶N素含量的高效量化预测,为评估茶叶的其他成分提供了可靠技术参考。  相似文献   

10.
化学需氧量(COD)是水体有机污染的一项重要指标,如何快速准确检测水体的COD含量尤为重要。机器学习在水质反演领域应用日益增多,并取得了较多的研究成果,高光谱遥感具有光谱空间分辨率高、成像通道多等优势,使其在水体COD反演方面有着极大的潜力。利用不同的高光谱预处理方法对原始高光谱数据进行处理,并利用处理前后的高光谱数据对比研究了不同机器学习模型、不同高光谱预处理方法对水体COD的反演性能。首先利用ZK-UVIR-I型原位光谱水质在线监测仪在扬州宝带河实地收集了1 548组COD和对应的高光谱数据(400~1 000 nm)样本,为降低光谱噪音干扰以及消除光谱散射影响,分别使用Savitzky-Golay(SG)平滑、多元散射校正数据(MSC)以及SG平滑结合MSC对原始光谱进行预处理。其次,将样本集随机划分为训练集和测试集,其中训练集占比80%,测试集占比20%。对预处理后的训练集全波段光谱基于线性回归、随机森林(random forest)、AdaBoost、XGBoost四种机器学习方法建立COD高光谱反演模型,并选取了决定系数(R2)、均方根误差(RMSE)、相对分析误差(RPD)三种指标在测试集数据中评估高光谱反演模型的精度。结果表明,随机森林、AdaBoost、XGBoost均优于线性回归,无论光谱处理与否,通过XGBoost建立的反演模型预测能力均为最佳,其中使用XGBoost对经过SG平滑和MSC处理后的光谱数据进行建模的反演模型精度最高,其R2达到0.92,RMSE为7.1 mg·L-1,RPD为3.4。考虑到原始光谱可能存在冗余,通过主成分分析法(PCA)对经过SG平滑和MSC处理后的光谱进行降维,并选取累计贡献率达到95%的前十个主成分作为模型的输入变量。通过XGBoost建立反演模型,结果表明经过PCA后的反演模型不仅精度有所上升,RPD达到3.8,而且模型的训练时间也由72 s缩短到2.9 s。以上研究可为该水域及类似水域的高光谱水质反演模型的建立提供新的方法及思路。  相似文献   

11.
采用FTIR/ATR光谱,偏最小二乘法(PLS)和Savitzky-Golay(SG)平滑方法建立甘蔗糖蜜锤度的快速测定方法和光谱分析的优化模型。基于全谱4500—600cm-1,利用计算机算法平台,把483种SG平滑模式和1—40的PLS因子数任意组合分别建立PLS模型。根据预测效果,最优模型为原谱平滑,2、3次多项式类型,45平滑点数,PLS因子数为6,预测均方根偏差(RMSEP)、预测相关系数(rp)和相对预测均方根偏差(RRMSEP)分别为0.978%、0.902%和1.05%,预测精度很高,并且大幅度优于未做SG平滑处理直接用PLS建模的预测效果。从而表明,FTIR/ATR光谱能够应用于甘蔗糖蜜锤度的快速准确测定,SG平滑模式和PLS因子数的联合大范围筛选能够有效地应用于FTIR/ATR光谱分析的模型优选。  相似文献   

12.
高光谱成像技术的柑橘植株叶片含氮量预测模型   总被引:11,自引:0,他引:11  
氮素是果树生长发育的一种大量必需元素,及时准确地监控果树的氮营养状况,对果树的合理施肥、增产、优化果实品质以及减缓过量施氮引起的水资源污染具有重要意义。利用高光谱成像技术结合多变量统计学方法,建立了柑橘植株叶片的含氮量预测模型。研究步骤为:高光谱扫描、提取平均光谱曲线、预处理原始光谱数据、采用连续投影法提取特征波段和建立含氮量预测模型。从SG平滑、SNV、MSC、1-Der等11种预处理方法中筛选出的较优预处理方法是SG平滑、Detrending和SG平滑-Detrending。对应这三种最优预处理方法,先采用连续投影法挑选出各自的特征波长,然后将各特征波段下的光谱反射率作为偏最小二乘、多元线性回归和反向传播人工神经网络模型的输入,各自建立三个预测模型。从以上获得的9个预测模型中,得出两个最优模型SG平滑-Detrending-SPA-BPNN(Rp:0.851 3,RMSEP:0.188 1)和Detrending-SPA-BPNN(Rp:0.8609,RMSEP:0.159 5)。结果表明,利用高光谱数据测定柑橘叶片含氮量具有可行性。这为实时、准确地监控柑橘植株生长过程中叶片含氮量的变化以及合理科学的氮肥施加提供了一定的理论基础。  相似文献   

13.
木材的种类识别是木材加工和贸易的一个重要环节,传统的木材种类识别方法主要有显微检测法和木材纹理识别法,其操作繁琐,耗时长,成本高,不能满足当前需求。本研究利用木材的近红外光谱(NIRS)结合模式识别方法,以期实现木材种类的快速准确识别。采用近红外光谱结合主成分分析法(PCA)、偏最小二乘判别分析法(PLSDA)和簇类独立软模式法(SIMCA)三种模式识别对58种木材进行种类鉴别研究;5点平滑、标准正态变量变换(SNV)、多元散射校正(MSC)、Savitzky-Golay一阶导数(SG 1st-Der)和小波导数(WD)五种光谱预处理方法用于木材光谱的预处理;校正集和测试集样品的正确识别率(CRR)用于模型的评价。采用PCA方法,通过样品的前三个主成分空间分布图分辨木材种类的聚类情况。在建立PLSDA模型,原始光谱的正确识别率最高,分别为88.2%和88.2%;5点平滑处理的光谱校正集和测试集的CRR分别为88.1%和88.2%;SNV处理的光谱校正集和测试集的CRR分别为84.4%和84.5%;MSC处理的光谱校正集和测试集的CRR分别为83.1%和84.2%;SG 1st-Der处理的光谱校正集和测试集的CRR分别为81.8%和82.7%;WD(小波基为“Haar”,分解尺度为80)处理的光谱校正集和测试集的CRR分别为87.3%和87.2%。可知,在PLSDA模型中,木材光谱未经预处理种类识别效果最后好。在建立SIMCA模型过程中,原始光谱的校正集和测试集的CRR分别为99.7%和99.4%;5点平滑处理的光谱校正集和测试集的CRR分别为100%和100%;SNV处理的光谱校正集和测试集的CRR分别为99.5%和99.1%;MSC处理的光谱校正集和测试集的CRR分别为99.0%和98.4%;SG 1st-Der的光谱校正集和测试集的CRR分别为81.8%和82.7%;WD处理的光谱校正集和测试集的CRR分别为100%和100%。可知,在SIMCA模型中,木材光谱经平滑和小波导数处理后的识别效果最好,且光谱的校正集和测试集CRR都为100%。采用三种模式结合五种不同的预处理方法对木材近红外光谱进行定性建模识别时,由于木材样本属性复杂,主成分分布图相互交织,PCA无法识别出58种木材;原始光谱的PLSDA模型可以得到较好的判别模型,但校正集和测试集的CRR只有88.2%和88.2%;木材光谱经过5点平滑或WD预处理后的SIMCA模型可达到最好的识别效果,校正集和测试集的CRR均为100%,且WD-SIMCA模型因子数比5点平滑SIMCA模型小,模型更为简化,故WD-SIMCA为58种木材种类识别的最优模型。研究表明光谱预处理方法可以有效的提高木材种类识别精度,有监督模式识别方法SIMCA可以用来建立有效的木材识别模型,近红外光谱结合模式识别可以为木材种类的识别提供一种快速简便的分析方法。  相似文献   

14.
针对光谱数据局部效应显著,变量个数多,彼此间常存在严重的复共线性,构建了一种基于分段正交信号校正(piecewise OSC)的偏最小二乘(PLS)回归,即POSC-PLS方法。它以近邻分段方式进行逐个波长点的正交信号校正,剔除光谱矩阵中所含的各种噪声信号,将去噪后的光谱矩阵作为新的自变量矩阵,再利用偏最小二乘方法建立校正模型。将该法应用于多环芳香烃电子吸收光谱的多组分定量关系建模,效果良好。所建模型的预报性能优于其他方法,而且模型所需PLS成分数减少,模型更简洁。  相似文献   

15.
针对油菜籽经过核辐照处理后其光谱反射特性会发生改变的特点,提出了应用可见/近红外光谱技术进行油菜籽的快速无损鉴别。利用偏最小二乘法和BP神经网络建立鉴别模型,并比较了不同光谱预处理方法、主成分数据变换方式及隐含层节点数对模型预测结果的影响。实验采用五种剂量辐照(50, 100, 150, 200Gy和不经核辐照处理)的油菜籽共135个样本进行建模,49个进行预测。结果显示,最优模型是原始光谱数据先经过中值滤波平滑法、附加散射校正及一阶求导法预处理。经PLS方法提取6个主成分经自然对数变换后,选取神经网络隐含层结点数为4个或9个。最优模型对是否经过核辐照处理的样本识别率达100%,对核辐照剂量预测精度为85.71%, 说明提出的方法可以用于评估核辐照处理对油菜籽光谱特性产生的明显影响。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号