首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 125 毫秒
1.
近红外光谱具有高维小样本的特点,变量选择是提高定量分析模型稳健性和可解释性的一种有效方法。确定独立筛选(SIS)是一种基于边际相关性的超高维数据变量选择方法,广泛用于基因微阵列数据的变量选择。SIS具有将数据维度降低至样本大小规模的能力,其降维能力与LASSO相当,在相当宽泛的近似条件下,由于具有安全筛选性质,所有重要变量被保留的概率趋于1。基于确定独立筛选偏最小二乘(SIS-SPLS)的变量选择是一种迭代式的SIS变量选择方法,首先利用SIS方法完成光谱重要变量的初选;然后根据重要变量的边际相关性大小进行逐步前向选择:建立偏最小二乘回归模型,依据贝叶斯信息准则(BIC)确定最终的变量选择结果。SIS-SPLS以逐步前向选择的方式实现对重要变量的增量式筛选,随着潜变量个数的增加及因变量残差的逐步减小,SIS-SPLS方法选择的变量个数将趋于稳定。然而仅以边际相关性对变量重要性进行评价,当光谱变量个数远大于样本数时,该方法也存在选择的变量过多、变量选择结果不够稳健等问题。为进一步提高小样本情况下变量选择的稳健性,将集成学习引入SIS-SPLS方法之中,提出了一种集成SIS-SPLS变量选择方法(Ensemble-SISPLS)。该方法首先对校正集样本进行自助重采样,对采样得到的每一个校正子集分别使用SIS-SPLS方法进行变量筛选,通过投票机制并设置频次阈值对所有校正子集的变量选择结果进行集成,选择出现频次大于给定阈值的变量并建立偏最小二乘回归模型,计算5折交叉验证均方根误差。对频次阈值和潜变量个数两个关键参数使用网格搜索法进行优选,根据子模型的交叉验证均方根误差和变量个数对子模型性能进行综合评价,以最优子模型包含的变量作为最终的变量选择结果。分别在Corn数据集和当归数据集上进行变量选择实验,比较Ensemble-SISPLS,SIS-SPLS和UVE-PLS三种变量选择方法的性能。其中当归数据集共77个样本,样本采自甘肃岷县和渭源县,使用Nicolet-6700型近红外光谱仪扫描得到所有样本的近红外光谱并对当归中的阿魏酸含量进行预测。Ensemble-SISPLS方法在Corn数据集上选择的变量个数、RMSEP和决定系数分别为22,0.000 8和0.999 8;SIS-SPLS方法在Corn数据集上选择的变量个数、RMSEP和决定系数分别为97,0.007 3和0.998 8。Ensemble-SISPLS方法在当归数据集上选择的变量个数、RMSEP和决定系数分别为24,0.018 1和0.996 3;SIS-SPLS方法在当归数据集上选择的变量个数、RMSEP和决定系数分别为38,0.022 6和0.994 3。结果表明,该方法进一步提高了变量选择结果的稳健性和预测能力。Ensemble-SISPLS变量选择方法有效结合了SIS-SPLS较强的变量选择能力和集成学习良好的泛化能力,提高了变量选择的稳健性。此外,由于在子模型的预测能力和变量个数之间进行了折中,一定程度上减少了选择变量的个数,提高了模型的可解释性。  相似文献   

2.
为了提高对蓝莓果渣的开发利用,探索了近红外光谱测定三种蓝莓(北陆、蓝美1号、灿烂)果渣中花色苷含量的可行性。通过DA7200采集三种蓝莓果渣的近红外光谱,利用PCA-MD对北陆、蓝美1号、灿烂果渣分别剔除1, 4和8个异常样本。运用K-S划分样本集得到校正集(686个样本)和验证集(171个样本)。对样本集分别进行归一化、变量标准化(SNV)、多元散射校正(MSC)、 Norris一阶导数(NFD)、 Norris二阶导数(NSD)、 SG卷积一阶导数(SGCFD)、 SG卷积二阶导数(SGCSD)、 Savitzky-Golay(SG)卷积平滑、正交信号校正预处理,并建立相应全谱PLS模型。比较并选择MSC、 SGCSD、 SG卷积平滑、正交信号校正,进行预处理方法顺序组合的比较,结果显示,全谱PLS模型中最优预处理方法为正交信号校正+SGCSD+SG卷积平滑,其R■为0.940 0、R■为0.886 7、 RMSEC为0.722 5、 RMSECV为0.246 2、 RMSEP为1.000 5、 RPD为2.970 8。利用SPA和CARS对预处理过的光谱数据分别进行波长变量的筛选,依次建立PLS回归模型,并定量分析其对蓝莓果渣花色苷的预测能力。在所有预处理方法进行波长变量筛选中, SPA与CARS算法均可以有效地筛选出波长变量,但SPA筛选出的波长变量,无法全部建立PLS回归模型,而CARS算法筛选出的波长变量,均可建立PLS回归模型。数据表明, CARS-PLS最佳组合为正交信号校正+MSC+SG卷积平滑+SGCSD,选择波长数为25个,相较于原始光谱,其R■从0.900 8增长到0.940 3,R■从0.881 8增长到0.885 7, RMSEC从0.929 1减少到0.720 9, RMSECV从0.317 6减少到0.245 6, RMSEP从1.021 8减少到1.004 9, RPD从2.908 8增长到2.957 5。近红外光谱的蓝莓果渣花色苷含量测定中,正交信号校正表现出强大的去噪效果, CARS算法具有简化模型、适用性较好和预测精度较高等优点。研究结果表明,应用近红外光谱技术可以较好地实现三种不同品种蓝莓果渣中花色苷含量的测定,可为蓝莓果渣品质分级提供一种快速、支持大样本量的检测方法。  相似文献   

3.
小波阈值降噪模型在红外光谱信号处理中的应用研究   总被引:2,自引:1,他引:1  
针对近红外光谱经常受到噪声干扰的特点,提出了利用小波阈值降噪方法进行光谱数据的降噪处理,以山羊绒表面油脂的近红外光谱检测为例,对比分析了三种小波阈值降噪模型(Penalty阈值降噪模型、Brige-Massart阈值降噪模型、缺省阈值降噪模型)的降噪性能。对降噪后的光谱数据采用偏最小二乘和支持向量机回归相结合建立了校正和预测模型,通过对比校验参数R2,RMSEC,RMSEP,分析评价了三种小波阈值降噪模型的降噪效果。结果表明: 三种降噪模型都能在一定程度上降低光谱信号的噪声,提高信噪比,改善光谱预测模型的精度,其中,Brige-Massart阈值降噪模型和缺省阈值降噪模型的降噪效果明显优于Penalty阈值降噪模型,与原始光谱信号建模的预测精度(R2=0.793,RMSEC=0.233,RMSEP=0.225)相比较,经过Brige-Massart阈值降噪模型降噪后的光谱信号建模的预测精度(R2=0.882,RMSEC=0.144,RMSEP=0.136)和经过缺省阈值降噪模型降噪后的光谱信号建模的预测精度(R2=0.876,RMSEC=0.151,RMSEP=0.142)均有较大程度的改善和提高,说明提出的小波阈值降噪方法能有效地降低原始光谱噪声作用,使光谱数据多变量分析模型更具有代表性和稳健性, 从而可以提高模型的预测精度。  相似文献   

4.
近红外光谱数据量大,需要进行压缩,以降低建立光谱校正模型的计算复杂度,提高模型精度和稳健性。为此,提出了一种基于离散萤火虫算法(discrete firefly algorithm)的近红外光谱波长变量筛选方法。首先采用蒙特卡罗方法剔除异常值,并应用Kennard-Stone法进行校正样本的选择。对通用萤火虫算法进行离散化处理,改进了吸引度的自适应公式,在移动公式中增加了牵引权重,以适应离散化处理的影响和优化算法,并在离散萤火虫算法中加入精英保留策略,加快算法的收敛速度。实验中找到DFA算法中的各项参数中的最佳值。通过离散萤火虫算法优选波长变量,建立发酵液中丁二酸含量的近红外光谱偏最小二乘回归(partial least squares regression)校正模型。与标准遗传算法(genetic algorithm)优选波长方法进行了比较。结果显示,基于离散萤火虫算法的波长优选方法所建立的PLS校正模型,其校正集的相关系数(R2c)为0.986,RMSEC为0.409,预测集的相关系数(R2p)为0.969,RMSEP为0.458,模型稳健性和精度都要优于全光谱建模以及遗传算法波长优选方法。显示了DFA在近红外光谱数据筛选方面的优越性。  相似文献   

5.
便携式近红外仪检测牛奶中脂肪、蛋白质及干物质含量   总被引:6,自引:0,他引:6  
采用便携式近红外光谱仪,结合偏最小二乘回归法,研究了牛奶脂肪、蛋白质和干物质含量的测定方法,建立了近红外漫反射定最分析模型.结果显示,脂肪、蛋白质和干物质模型相关系数(R2)分别为0.98,0.95,0.98,建模集标准残差(RMSEC)分别为0.187,0.105,0.217,验证集标准残差(RMSEP)分别为0.1...  相似文献   

6.
在近红外光谱数据分析中,全光谱数据具有波长点多、冗余量大、共线性关系严重的特点,导致了部分波长点对建立校正模型没有积极作用,甚至还会降低模型的预测能力。波长选择被证明是有效避免上述问题的重要方法。针对近红外光谱的特性,提出了一种基于直接正交信号校正(DOSC)与蒙特卡罗方法(Monte Carlo,MC)结合的波长选择算法。与大多数根据波长的“重要性”进行选择的方法不同,MC-DOSC依据波长的“不重要”性进行选择。波长“不重要”性通过DOSC的权重w来度量。首先将w归一化作为波长被滤除的概率,以此建立波长选择的概率模型,并使用蒙特卡罗随机抽样得到N个波长子集的集合。在每一次抽样过程中,用选择的波长点建立PLS模型,计算相应的交叉验证均方根误差(RMSECV)。经过N次随机抽样后,以RMSECV最小时的PLS模型对应的波长子集作为备选子集。将备选子集包含的光谱数据作为新的光谱阵,重复上述过程直到RMSECV不再下降为止。迭代停止后,将RMSECV最小的备选子集作为最佳波长子集。采用玉米数据集和汽油数据集对该算法进行测试,同时与蒙特卡罗无信息变量消除法(MCUVE)、遗传算法(GA)、竞争性自适应权重取样法(CARS)三种算法进行比较。实验结果表明:该算法能大幅度减少波长点个数,并且相应的PLS模型的预测能力也提高了。玉米数据集的实验运行结果,波长点个数从全光谱的700个减少到15个,预测集相关系数从0.828 2提高到0.931 4,RMSEP从0.109 8减少到0.071 3。汽油数据集的实验运行结果,波长点个数从全光谱的301个减少到31个,预测集相关系数从0.987 5提高到0.993 9,RMSEP从0.255 5减少到0.178 8。该算法在2个数据集中的表现均优于对比的三种算法。  相似文献   

7.
针对近红外光谱波长选择问题,在团队进步算法(TPA)的基础上,提出一种改进团队进步算法(iTPA)的波长变量选择方法,将分子光谱的波段按照与其相应的理化值建模得到的评价值函数大小降序排列,顺序分为精英组、普通组和垃圾回收组。当新生波段选择学习行为时,若其产生于普通组,则需要向精英组样板的方向调节;若其产生于精英组,则需要改进其更新方向,向垃圾回收组样板的反方向调节。垃圾回收组成员的评价值不像精英组和普通组随着更新的过程一直上升,而是一直处于极低的状态,为产生于精英组的新生波段在学习时提供一个准确的更新方向,从而提升算法的全局寻优能力。通过不断的迭代更新,逐步提升整体评价值,最终选取评价值最高的波段作为筛选波段。该算法对玉米的淀粉和蛋白质含量数据集进行了实验测试,并与TPA、遗传算法(GA)、主成分分析(PCA)以及全谱方法进行了对比。实验结果表明,所提算法能够找出全谱范围内波长的最优组合,并且可以解释各含量的化学特性。玉米淀粉数据集运行的效果相比于全光谱,变量个数从700个减少到17.55个左右(50次试验求平均),模型的RMSEC从0.335 7降到0.260 9,校正集预测精度提升了22.3%,模型的RMSEP从0.391 4下降到0.334 4左右,预测集预测精度提升了14.6%;在玉米蛋白质数据集运行的效果相比于全光谱,变量个数从700个减少到19.6个左右(50次试验求平均),模型的RMSEC从0.147 4降到0.101 9,校正集预测精度提升了30.1%,模型的RMSEP从0.178 9下降到0.117 7,预测集预测精度提升了34.2%。  相似文献   

8.
张宗福 《应用声学》2014,22(5):1568-1571
针对传统香农-奈奎斯特采样定理指出在保证原始信号重构精度的前提下,采样频率必须为原始信号频率的2倍,提出了一种基于压缩感知理论和改进的自适应正交匹配追踪算法的稀疏信号重构方法;首先引入了压缩感知模型和信号重构目标函数,然后在对经典正交匹配追踪类算法进行分析和总结的基础上,为克服其不足,设计了一种二次筛选支配原子集的方法,即通过计算信号的QR分解并计算具有最大势能的原子从而得到能量候选原子集,通过计算余量与原子的相关性选出相关性最大的原子从而得到相关候选原子集,并将能量候选原子集和相关候选原子集的交集作为最终支配原子集;最后定义了具体的采用自适应正交匹配算法实现信号重构的算法;在Matlab仿真环境下试验,结果表明:文章方法能有效地进行稀疏信号重构,具有较小的重构误差,且与其它方法相比,具有收敛速度快和重构效果好的优点。  相似文献   

9.
应用便携式近红外光谱分析仪对112个柑桔进行无损检测,运用主成分正交信号校正、加强正交信号校正结合广义回归神经网络的方法分别建立柑桔酸度定量分析模型。结果表明:采用EOSC方法能够使模型具有良好的预测能力并能够防止对数据造成过度校正。EOSC柑桔酸度模型校正集相关系数Rc=0.888 0,预测集相关系数Rp=0.885 6,RMSEP=0.081 65。研究结果表明EOSC预处理方法结合广义回归神经网络可以用于柑桔样本的酸度测定。  相似文献   

10.
近红外光谱分析以其简便、快速、高效、低成本、绿色环保等优点,已广泛应用于诸多领域。然而,近红外光谱同时存在变量维度高、多重共线性、包含冗余信息和高频噪声等问题,直接构建预测模型不但增加建模复杂度,同时也会影响模型的预测性能和泛化能力,因此提出一种基于改进和声搜索算法(HS)的光谱特征变量选择方法。HS常用于解决特征变量优化选择问题。在应用和声搜索算法进行最优光谱变量选择时,首先通过偏最小二乘(PLS)载荷系数计算各光谱点的特征贡献度,作为和声搜索算法改进的扰动权重。算法优选光谱特征变量过程中,引入变量特征贡献度作为激励因子,采用随机遍历和激励因子共同作用的方式生成初始解向量。产生新和声向量时,应用变量特征贡献度作为惩罚项,通过加入平衡因子使选择参数随迭代次数而动态调整,从而适应光谱变量的搜索,增强搜索过程的遍历性和种群的多样性。为验证本算法的有效性,以烟叶样品烟碱、总糖、总氮三个指标的近红外光谱PLS建模应用为例,对采集的原始光谱进行预处理后,应用该方法对光谱变量进行优选,根据变量被选择的累积频次分别计算不同变量个数的模型预测性能,通过校正均方根误差(RMSEC)随变量增加的变化趋势确定最终选择的光谱特征变量。在训练集上分别建立各指标的PLS模型,应用测试集测试模型性能,并与全光谱、无信息变量消除法(UVE)和粒子群算法(PSO)进行比较。实验结果显示,应用该算法所选变量建立的烟碱、总糖和总氮三个模型的决定系数(R~2)分别为0.921 1, 0.925 7和0.941 2,预测均方根误差(RMSEP)分别为0.102 3, 1.034 6和0.053 1,与其他方法相比,光谱特征变量更少,同时R~2和RMSEP值更优。由此表明,改进的和声搜索算法能有效筛选特征光谱,降低建模复杂度,提升模型预测性能和泛化能力。  相似文献   

11.
采用近红外(NIR)漫反射光谱法对新疆特色梨果库尔勒香梨的五种不同果(包括青头、粗皮、脱萼、宿萼、突顶果)的硬度进行测定。由于近红外光谱数据量大且原始光谱噪声明显、测定水果时散射严重等导致光谱建模时关键波长变量提取困难。以新疆库尔勒香梨为研究对象,为了有效地消除固体表面散射以及光程变化对NIR漫反射光谱的影响,首先采用标准正态变量变换(SNV)和多元散射校正(MSC)对库尔勒香梨的原始光谱进行预处理。为寻找适合近红外光谱检测库尔勒香梨硬度的最佳特征波长筛选方法,进行香梨近红外光谱的特征波长变量选择方法的比较与研究。研究比较了两种特征波长筛选方法对库尔勒香梨硬度偏最小二乘法(PLS)建模精度的影响。同时使用反向偏最小二乘(BiPLS)和遗传算法结合反向偏最小二乘(BiPLS-GA)在全光谱范围内筛选香梨硬度的特征波长变量,将校正均方根误差(RESMC)、预测均方根误差(RESMP)以及决定系数(R2)作为模型的评价标准,并最终确定最优波段选择方法及最佳预测模型。基于选择的特征波长变量建立的PLS模型(BiPLS-GA)与全光谱变量建立的PLS模型进行比较发现BiPLS-GA模型仅仅使用原始变量中6.6%的信息就获得了比全变量PLS模型更好的库尔勒香梨硬度的预测结果,其中R2,RMSEC和RMSEP分别为0.91,1.03和1.01。进一步与基于反向偏最小二乘算法(BiPLS)获得的特征变量建立的PLS模型比较发现,BiPLS-GA不仅可以去除原始光谱数据中的无信息变量,同时也能够对共线性的变量进行压缩去除,使得建模变量从301个减少到20个。极大地简化模型的同时有效地提高了模型的预测精准度和稳定性。因此该方法能够有效地用于近红外光谱数据变量的选择。证明了近红外光谱分析技术结合BiPLS-GA模型能够高效地选择出建模变量,去除与库尔勒香梨硬度无关的近红外光谱信息,显著地提高库尔勒香梨硬度定量模型的预测精度。这不仅为新疆地区特色梨果库尔勒香梨的快速、精确、无损优选分级提供一定的技术支持,同时也为基于近红外光谱分析技术预测水果内部品质的研究提供了参考。  相似文献   

12.
为了实现库尔勒香梨依据可溶性固体含量(SSC)分级定等和按质论价,推动采后处理向标准化、产业化方向健康发展,利用高光谱成像技术研究出了一种快速、有效、无损检测库尔勒香梨SSC的方法。以表面无损伤的157个库尔勒香梨作为研究样本,应用高光谱成像采集系统获取400~1 000 nm波长范围内高光谱图像并用ENVI5.3软件提取感兴趣区域(ROI),获得高光谱数据。采用Kennard-Stone(KS)样本集划分方法将全部样本按照2∶1的比例划分为校正集(105)和预测集(52)。对比标准变量变换(SNV)、多元散射校正(MSC)、一阶导数(FD)和二阶导数(SD)等数据预处理方法对建模精度的影响,最终选用SNV方法对光谱曲线进行平滑去噪。该研究提出竞争性自适应重加权算法与平均影响值算法的组合算法(CARS-MIV)选择特征波长。在竞争性自适应重加权算法(CARS)方法中,建模样本由蒙特卡罗算法随机选择生成,变量回归系数会随之发生变化,因而回归系数的绝对值不能全面反映变量重要性,从而影响模型检测精度。为降低这种影响,应用平均影响值(MIV)算法对选出的自变量进行二次筛选,筛选出相关性较大的变量用以建模分析,并与CARS、连续投影算法(SPA)、蒙特卡罗无信息变量消除算法(MCUVE)等经典特征波长选择算法进行比较。最后分别以全波长(FS)光谱信息和四种特征波长选择方法得出的光谱信息作为输入矢量,应用支持向量回归(SVR)建立库尔勒香梨可溶性固体含量定量预测数学模型,以校正集相关系数(Rc)、校正集均方根误差(RMSEC)、预测集相关系数(Rp)和预测集均方根误差(RMSEP)四个参数来评估模型的预测精度。比较分析发现,CARS-MIV-SVR模型效果最佳,校正集相关系数(Rc)为0.985 94,预测集相关系数(Rp)达到0.946 31,校正集和预测集均方根误差分别为0.185 85和0.403 33。结果证明:CARS-MIV特征波长选择方法能够有效增强库尔勒香梨光谱数据特征波长选择的稳定性和精确性,提高模型的预测精度。利用高光谱技术结合CARS-MIV-SVR模型能够满足库尔勒香梨可溶性固体含量测定需求,实现库尔勒香梨的分级定等和按质论价。  相似文献   

13.
食药植物玛咖富含多种营养成分,极具药用价值。采用近红外漫反射光谱,对采自秘鲁及云南共139份玛咖样品进行产地鉴别。采用多元信号校正结合二阶导数和Norris平滑预处理光谱,利用光谱标准偏差初步选择光谱波段(7 500~4 061 cm-1),结合主成分-马氏距离(principal component analysis-mahalanobis distance,PCA-MD)筛选出适宜的主成分数为5。基于所筛选的光谱波段及主成分数,利用“模群迭代奇异样本诊断”方法剔除2个异常样品后,分别采用竞争自适应重加权法(competitive adaptive reweighted sampling,CARS)、蒙特卡洛-无信息变量消除法(monte carlo-uninformative variable elimination,MC-UVE)、遗传算法(genetic algorithm,GA)和子窗口重排(subwindow permutation analysis,SPA)四种方法筛选光谱变量信息,利用模型集群分析(model population analysis,MPA)思想对所筛选的光谱变量信息进行评价。结果显示,RMSECV(SPA)>RMSECV(CARS)>RMSECV(MC-UVE)>RMSECV(GA),分别为2.14,2.05,2.02,1.98,光谱变量数分别为250,240,250和70。采用偏最小二乘判别分析法(partial least squares discriminant analysis,PLS-DA)对四种方法筛选的光谱变量建立判别模型,随机选择97份样品作为建模集,其余40份样品作为验证集。通过R2,RMSEC和RMSEP分析可知,R2: GA>MC-UVE>CARS>SPA,RMSEC和RMSEP: GA相似文献   

14.
高光谱成像技术是一种将成像与光谱相结合的新型无损检测技术,属于间接分析方法;光谱模型的建立非常关键,需综合考察各建模因素间的交互作用。应用Box-Behnken法设计响应面试验优化冷鲜滩羊肉蛋白质含量的可见/近红外高光谱定量检测模型。使用可见/近红外高光谱成像系统采集冷鲜滩羊肉样本的高光谱图像,分析肉样反射光谱特性。采用二维相关光谱技术(2DCOS),以冷鲜滩羊肉中蛋白质含量为“外界扰动”,研究扰动条件下光谱信号的动态变化,解析二维相关光谱谱图特征,寻找与微扰相关的敏感变量。分别采用多元散射校正(multiplicative scatter correction,MSC)和标准正态变量变换(standard normalized variate,SNV)提取有用信号,优化所选特征波段光谱质量。为实现数据快速降维,减少大量光谱数据处理负担,采用变量组合集群分析法(variable combination population analysis,VCPA)和应用竞争性自适应加权算法(competitive adaptive reweighted sampling,CARS)对2DCOS范围内特征波段进行二次优选。根据Design-Expert软件中Box-Behnken法设计响应面试验,以特征优选、光谱预处理及多元校正方法为考察因素,各因素中3种不同方法为水平,建立冷鲜滩羊肉蛋白质含量分析的优化检测体系。结果表明,波长473,679,734和814 nm处存在较强的自相关峰,473~814 nm范围内的特征波段为冷鲜滩羊肉蛋白质检测的敏感区域;MSC和SNV能够消除肉样自身散射作用的干扰,CARS和VCPA对特征波段进行二次优选,分别优选出了16和9个特征波长;各因素对蛋白质可见/近红外光谱模型预测性能的影响顺序为特征优选方法>预处理方法>多元校正方法,优选出2DCOS-SNV-LSSVM模型具有较高的运行速率和预测能力,其Rc=0.858 8,RMSEC=0.005 8;Rp=0.860 4,RMSEP=0.005 7。研究表明,Box-Behnken法在可见/近红外高光谱(400~1 000 nm)建模参数优化选择中的应用,可以有效地实现滩羊肉品质智能监控与质量安全快速无损分析,为分析对象光谱模型的优化及提高预测结果的准确性提供理论参考。  相似文献   

15.
近红外光谱检测技术已经成功应用于水泥生料成分的快速检测,但我国水泥企业在生产水泥生料时所用原材料品种不一,使用不同的原材料进行生产时对近红外光谱建模带来一定影响。为了研究不同原料生产的水泥生料近红外光谱建模差异,对不同地区水泥生产线所生产的水泥生料进行建模研究。选取两个不同地区水泥生产线的水泥生料样本各95份和82份,各自选取80份和67份作为校正集,15份作为验证集。首先将两条水泥生产线的样本每份重复装样测3次光谱,取平均光谱做为样本的近红外光谱。然后通过采用S-G平滑法对两个不同地区所生产的水泥生料近红外光谱进行预处理。对比发现两个地区水泥生料近红外光谱存在一定差异,采用偏最小二乘回归算法建立检测模型,所建立的模型精度差异较大。采用CARS波段挑选法,分别对两种水泥生料近红外光谱进行挑选,生产线一的水泥生料样本SiO2,Al2O3,Fe2O3和CaO近红外光谱波段由3 113个变量分别保留了85,89,55和67个变量,生产线二的水泥生料近红外光谱则分别保留了51,55,55和55个变量,且保留的波段明显存在一定区别。最后分别建立了两个地区的水泥生料SiO2,Al2O3,Fe2O3和CaO近红外光谱检测模型。通过对比发现原材料不同时所挑选的波段不同,且检测模型预测效果良好。生产线一的SiO2,Al2O3,Fe2O3和CaO检测模型的RMSEP(预测均方根误差)分别为0.109,0.053,0.034和0.185,生产线二 的SiO2,Al2O3,Fe2O3和CaO检测模型的RMSEP分别为0.084,0.024,0.023和0.184。结果表明当水泥生料的原材料发生变化或者产地不一时,不能仅靠修正模型对水泥生料进行检测,而是需要重新进行近红外光谱建模,且光谱波段选择也会发生变化。采用波段挑选法对水泥生料近红外光谱进行波段挑选能够提高检测模型的模型精度。  相似文献   

16.
利用近红外光谱对核桃露中的重要指标脂肪含量进行定量分析,同时进行建模变量优化、建模方法比较以优选最佳模型。为消除散射对光谱造成的影响,采用标准正态变换(SNV)方法对数据进行预处理,采用遗传算法(GA)结合向后间隔偏最小二乘法(BiPLS)优选的特征波长分别作为偏最小二乘法(PLS)及最小二乘支持向量机(LS-SVM)的输入变量,建立核桃露中脂肪含量的近红外定量模型,采用决定系数(R2)、预测标准偏差(RMSEP)以及性能偏差比(RPD)对各模型进行评价,探究光谱波段选择方法对于核桃露中脂肪指标模型构建的影响,同时确定最佳建模方法。结果表明:进行变量筛选能够对模型起到优化作用,BiPLS及GA-BiPLS方法分别选择了150及30个变量点,占全光谱的10%及2%,对应了核桃露样品中脂肪成分的特征吸收峰,使得PLS模型的RMSEP值从0.049分别下降到0.043和0.040,同时模型的相关系数R2从0.964提高到0.973及0.974,性能偏差比RPD从4.88增长到5.62及6.00,主成分数也有不同程度的减少,降低模型复杂程度的同时提高了模型准确性。相比于PLS模型,核桃露脂肪指标的LS-SVM模型的R2,RMSEP及RPD值均表现出了更好的效果,分别达到0.986,0.036及6.52。说明基于最小二乘支持向量机建立的分析模型有较高的准确度及稳定性,可能是由于PLS作为一种经典的线性建模方法,在建立模型的过程中忽略了样品数据集中的非线性因素,而核桃露样品光谱测量过程中噪声、背景等因素的干扰,以及各指标成分间的相互影响,使得脂肪含量与近红外光谱信息间存在复杂非线性的变化关系,LS-SVM方法能够更为有效地对其进行描述,增强了光谱变量与指标浓度间的相关性,使得建立的模型有着更好的准确度以及普适性,说明了在实际生产中,LS-SVM方法具备优良的可行性,体现了其在核桃露饮品品质分析方面的巨大潜力。基于最小二乘支持向量机方法所建立的核桃露脂肪含量的定量分析模型,具有准确、稳定的特点,能够为核桃露生产的质量监控提供技术借鉴,同时为饮品品质的分析方法研究提供了新的思路。  相似文献   

17.
以96批栀子不同炮制品为研究对象,高效液相色谱测定栀子苷含量为参考值,利用近红外光谱仪积分球漫反射测定其光谱图,建模波段取8 660~7 500,6 650~5 600和4 900~4 000 cm-1,以标准正态变换(SNV)和二阶导数法(2nd derivative)为预处理方法,主成分数为8,采用偏最小二乘法(PLS)对83批栀子样品建立栀子苷的定量校正模型,最终以13批栀子不同炮制品对模型进行验证。结果,定量模型的内部交叉验证决定系数(R2)为0.992 85,校正均方差(RMSEC)为0.240,预测均方差(RMSEP)为0.254,内部交叉验证均方差(RMSECV)为0.386 91,RMSEP/RMSEC=1.06。模型验证得到的相对分析误差(RPD)为8.81,绝对偏差范围-0.39%~0.23%,说明模型预测性较好。通过相关系数法,优选样品装样量、扫描次数、重复次数、分辨率实验条件;并由近红外一阶导和二阶导图,除去温湿度和样品水分影响波段,结合栀子苷对照品近红外光谱图,确定建模波段。首次利用NIRS法建立栀子不同炮制品栀子苷定量校正模型,方法简单快速,模型稳定可靠、准确性高,可同时应用于不同炮制品栀子中栀子苷含量的预测。  相似文献   

18.
血红蛋白是人体的一项重要生理指标,浓度异常会导致人体产生各种疾病。红外光谱技术具有简单、无损、快速等优点,非常适合用于生理参数的定量分析。由于光谱背景复杂、有效信息弱,如何提取有效特征变量,构建精准定量模型是个难题。针对此问题,以血液样本和血红蛋白仿体溶液样本光谱数据为研究对象,采用SPXY法、 K_S法、 duplex法、等间隔划分法四种数据集划分方法划分数据并通过建模对比,优选出最佳数据集划分方法为SPXY法。遍历了SavitzkyGolay一阶求导滤波(S_G1)+小波变换、小波变换+S_G1、标准正态变量变换(SNV)+S_G1三种预处理方法,优选出SNV+S_G1预处理方法。结合串联思想,提出组合区间偏最小二乘法(SiPLS)与连续投影算法(SPA)串联的特征波长优选方法,构建SiPLS-SPA-PLS预测模型,用两组数据对模型进行验证,依据评价指标判断模型的优劣,并与全谱PLS, SPA-PLS和SiPLS三种定量模型相比较。实验结果表明:(1)使用SiPLS-SPA-PLS模型进行定量分析,血液样本的Rc,Rp, RMSEC和R...  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号