首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 421 毫秒
1.
采集不同微水含量的变压器油的近红外光谱,利用集合经验模分解(EEMD)与连续投影算法(SPA),建立变压器油中微量水分的最小二乘支持向量机(LS-SVM)回归模型。结果表明,原始求导光谱经EEMD分解后得到8个本征模态函数(IMF),在去掉第一个IMF后重构数据比原始求导光谱数据直接建模具有较好的效果,而利用去掉第一个IMF后重构数据经SPA筛选出的4个特征光谱(只占全谱的0.78%)来建模则具有更好的预测效果,预测均方根误差为1.04776×10-3,预测相关系数为0.9840,说明EEMD与SPA联用具有比EEMD及SPA单独运用更好的效果,且最优模型应用于实际油品的检测同样具有很好的效果,对实现油中水分的高精度检测以及低维度变量建模具有实际意义。  相似文献   

2.
测量环境及光谱仪台间差异导致近红外光谱(NIRS)模型传递到从机后,常产生较大误差。该文使用标准正态变量变换(SNV)+微分处理光谱消除光谱散射和基线漂移的影响,提出通过仪器间光谱信号比值分析筛选波长的方法(Screening wavelengths based on spectrum ratio analysis,SWSRA),选出仪器间一致性较好且样本间差异大的光谱特征波长,采用筛选出的波长信号建立待测性质的偏最小二乘近红外光谱定标模型。以80个玉米样品中水分、油、蛋白质含量及72个黄芩样品中黄芩苷含量的NIRS预测对该方法进行了检验。结果表明,SWSRA主机模型预测从机样品的各成分含量的平均相对误差均小于4.3%,明显优于全波长模型直接传递的结果,且其预测均方根残差RMSEP与文献报道的其他模型传递方法的结果相当或更优。SWSRA方法具有模型参数少、稳健、简便易行等优点,可以在同类型近红外光谱仪器之间实现模型的无标样传递。  相似文献   

3.
将竞争自适应重加权采样(CARS)与区间偏最小二乘回归(iPLS)相结合的变量筛选建模方法 CARSiPLS,用于烟煤中水分与挥发分的近红外光谱测定。以CARS逐步筛选出每个区间与待测量相关的变量,建立烟煤中水分与挥发分近红外光谱测定的偏最小二乘回归模型。结果表明:与PLS、iPLS相比,CARSiPLS可以显著减少变量数,同时提高模型预测性能;挥发分建模变量从1557个减少至15个,水分建模变量从1557个减少至317个;挥发分、水分的预测平均绝对百分误差分别从0.031 5降至0.018 4、从0.188 4降至0.094 6;挥发分、水分的预测均方差分别从0.010 8降至0.006 7、从0.005 0降至0.002 8。  相似文献   

4.
将竞争自适应重加权采样(CARS)与区间偏最小二乘回归(iPLS)相结合的变量筛选建模方法 CARSiPLS,用于烟煤中水分与挥发分的近红外光谱测定。以CARS逐步筛选出每个区间与待测量相关的变量,建立烟煤中水分与挥发分近红外光谱测定的偏最小二乘回归模型。结果表明:与PLS、iPLS相比,CARSiPLS可以显著减少变量数,同时提高模型预测性能;挥发分建模变量从1557个减少至15个,水分建模变量从1557个减少至317个;挥发分、水分的预测平均绝对百分误差分别从0.031 5降至0.018 4、从0.188 4降至0.094 6;挥发分、水分的预测均方差分别从0.010 8降至0.006 7、从0.005 0降至0.002 8。  相似文献   

5.
构建147个有机物分子结构与其热导率值之间的定量结构-性质关系(QSPR)模型, 探讨影响有机物热导率的结构因素. 以147个化合物作为样本集, 随机选择118个作为训练集, 29个作为测试集. 应用CODESSA软件计算了组成、拓扑、几何、静电和量子化学等描述符, 通过启发式方法(HM)筛选得到5个结构参数并建立线性回归模型; 用所选5个结构参数作为支持向量机(SVM)的输入, 建立非线性的支持向量机回归模型. 预测结果表明: 支持向量机回归模型的性能(复相关系数R2=0.9240)虽略低于启发式回归模型的性能(R2=0.9267), 但是支持向量机方法预测性能(R2=0.9682)高于启发式方法的预测性能(R2=0.9574), 对于QSPR模型来说, 预测性能更重要. 因此, 总体来说支持向量机方法优于启发式方法. 支持向量机方法和启发式方法的提出为工程上提供了一种根据分子结构预测有机物热导率的新方法.  相似文献   

6.
研究了近红外光谱技术快速检测红曲菌固态发酵过程参数水分含量和pH值的可行性。针对传统基于间隔策略波长选择方法忽略非线性因素的缺点,采用一种基于最小二乘支持向量机(Least squares support vector machines,LS-SVM)非线性模型的波长筛选算法:联合区间最小二乘支持向量机(Synergy interval least squares support vector machines,siLS-SVM),并将新算法与相关系数法、iPLS算法、siPLS算法对比。实验结果显示,联合siLS-SVM算法和LS-SVM模型取得了最好的预测效果,水分含量、pH值的预测集相关系数(Rp)分别为0.962 1、0.976 1,预测均方根误差(RMSEP)分别为0.012 9、0.145 2,表明模型具有较好的拟合度和预测性能。应用近红外光谱法进行红曲菌固态发酵过程的水分含量和pH值的快速检测可行,该方法为进一步实现其过程参数的在线检测及发酵条件优化提供了技术基础。  相似文献   

7.
研究了近红外光谱技术快速检测红曲菌固态发酵过程参数水分含量和pH值的可行性。针对传统基于间隔策略波长选择方法忽略非线性因素的缺点,采用一种基于最小二乘支持向量机(Least squares support vector machines,LS-SVM)非线性模型的波长筛选算法:联合区间最小二乘支持向量机(Synergy interval least squares support vector machines,siLS-SVM),并将新算法与相关系数法、iPLS算法、siPLS算法对比。实验结果显示,联合siLS-SVM算法和LS-SVM模型取得了最好的预测效果,水分含量、pH值的预测集相关系数(R p)分别为0.962 1、0.976 1,预测均方根误差(RMSEP)分别为0.012 9、0.145 2,表明模型具有较好的拟合度和预测性能。应用近红外光谱法进行红曲菌固态发酵过程的水分含量和pH值的快速检测可行,该方法为进一步实现其过程参数的在线检测及发酵条件优化提供了技术基础。  相似文献   

8.
主成分分析-支持向量回归建模方法及应用研究   总被引:14,自引:5,他引:14  
将主成分分析(PCA)用于近红外光谱的特征提取,并与支持向量回归(SVR)相结合,实现了主成分分析-支持向量回归(PCA-SVR)用于近红外光谱定量分析的建模方法。与单纯的SVR方法相比,不仅提高了运算速度,而且提高了模型的预测准确度。将PCA-SVR方法用于烟草样品中总糖和总挥发碱含量的测定,所得结果的预测均方根误差分别为1.323和0.0477;回收率分别为91.8%~112.6%和88.9%~120.2%。  相似文献   

9.
计算了44个烷基苯酚类化合物的组成、拓扑、几何、静电和量子化学等结构参数,运用启发式方法对这些结构参数进行筛选,得到了含3个变量的化合物的定量结构与色谱保留值的线性关系模型,同时以这3个变量作为支持向量机模型的输入变量建立非线性回归模型。两种方法的相关系数(R2 )分别为0.98和0.92,相应的均方根误差分别是0.99和2.77。通过对两种模型的稳定性和预测能力的比较,发现线性模型能够更好地反映烷基苯酚的气相色谱保留值与其结构参数之间的定量关系。在已知烷基苯酚类化合物结构参数的情况下,线性回归模型更有助于它们的色谱分析。  相似文献   

10.
利用近红外光谱(NIRS)结合支持向量机(SVM)模式识别原理建立了微卫星(短串联重复序列,STR)的分型方法。以D16S539基因座的10-10、10-11和11-11 3种不同基因型为例,研究了包含该多态性位点的脱氧核糖核酸(DNA)片段的聚合酶链反应(PCR)扩增条件和NIRS检测条件,建立了标准化扩增条件和检测条件,以此条件获得了基因分型的标准物及其标准NIRS。以标准光谱为识别变量,建立该3类基因型的SVM判别模型,有效地克服了光谱共线性,并对少样本数表现出良好的稳定性,模型预测率100%。该方法不需任何检测前处理,而只需一步PCR扩增和NIRS检测即可实现STR分型,具有简单、快速、低成本等优点。  相似文献   

11.
在色谱图基线校正和色谱峰匹配基础上,提出以40个银杏叶提取物HPLC指纹图谱的色谱图轮廓作为输入,相应的提取物总抗氧化活性作为输出,建立最小二乘支持向量机回归模型,并对包含10个样本的测试集进行了预测.最小二乘支持向量机的测试集预测误差均方根(RMSEP)为0.0230,预测结果优于目前普遍使用的误差反向传播神经网络和偏最小二乘回归.与采用色谱峰面积为分析变量的模型预测结果比较表明:采用消除干扰后的色谱图全谱轮廓保留了样本的全部信息,预测结果更好  相似文献   

12.
将稳定度自适应重加权采样特征变量选择算法用于支持向量机定性分析(Support vector machine-stability competitive adaptive reweighted sampling,SVM-SCARS)。该算法通过对数据多次采样建模计算各变量的稳定度值,稳定度值能更加客观准确地评估变量在建模中的作用,因此可作为变量重要性的评价依据。通过循环迭代方式,采用自适应重加权采样技术逐步筛选变量,然后以每次循环所得变量子集建立SVM模型,并以模型交叉验证分类正确率(Correct classification rate of cross validation,CCRCV)评估子集优劣,确定最优特征变量子集。将该算法结合漫反射近红外光谱技术建立了制浆造纸常用木材的树种识别模型,实现了对4种桉木和2种相思木的快速识别分类。最终共筛选出15个特征变量建立分类模型,模型对各树种分类的正确率达97.9%,具有较好的分类效果。与全光谱模型和递归特征消除支持向量机模型相比,SVM-SCARS能够筛选出更少的特征变量,且模型具有更好的预测性能和稳定性。研究结果表明,SVM-SCARS算法能够有效优化光谱特征变量,提高近红外在线分析模型在木材材性分析中的稳健性和适用性。  相似文献   

13.
取原油样品120个,分别按照GB/T 11133-2015和GB/T 17040-2008中所述方法测定了上述原油样品中的水分和硫的含量。通过优化的近红外光谱(NIRS)条件采集了上述原油样品的NIR光谱图。采用杠杆值算法剔除4个异常样品。在建立水分含量分析模型时,采用的条件为:用Savitzky-Golay法对光谱进行滤波预处理,建模光谱区间为6 200~8 200cm-1,主成分数为6,用偏最小二乘回归法(PLS)交叉验证建立分析模型。硫含量分析模型的建立条件为:采用二阶导数-Norris Derivative对光谱进行预处理,建模光谱区间为4 400~4 700cm-1,主成分数为6,用PLS交叉验证建立分析模型。水分和硫含量模型的预测值与测定值的相关性较好。水分模型的决定系数(R2c)为0.989 9,校正标准偏差(RMSEC)为0.084 2,说明其预测效果较好,可用于原油中水分含量的预测。硫含量模型的R2c为0.996 3,RESEC为0.069 6,说明此模型的预测效果也较好,可用原油中硫含量的预测。应用所建立的两个模型对10个未知原油样品中水分和硫含量进行了预测,并与其测定值比较,结果表明两者之间的相对偏差均小于10%。  相似文献   

14.
应用近红外光谱(NIRS)技术结合偏最小二乘(PLS)和最小二乘支持向量机(LS-SVM)建立了附子中多指标成分的快速无损检测方法。选取38批样品建立了同时测定附子样品中6种成分含量的高效液相色谱(HPLC)方法;通过采集附子样品的NIRS图,分别采用PLS和LS-SVM建立了各个成分HPLC测定值与NIRS图的定量校正模型。所建立的苯甲酰新乌头原碱、苯甲酰乌头原碱、苯甲酰次乌头原碱、新乌头碱、次乌头碱、乌头碱、单酯型生物碱总量和双酯型生物碱总量LS-SVM模型的相对预测偏差(RPD)分别为3.3、3.2、4.1、7.7、8.8、7.6、4.0和8.6;验证集相关系数(rpre)分别为0.9486、0.9475、0.9668、0.9909、0.9946、0.9969、0.9669和0.9927,且LS-SVM模型优于PLS模型,说明NIRS模型验证集与HPLC测定值具有良好的非线性关系,模型预测效果良好。采用NIRS技术结合LS-SVM模型可以快速对附子中的上述6个生物碱含量以及单酯型生物碱总量和双酯型生物碱总量进行检测,方法操作简便,对控制附子中的生物碱含量具有一定的指导作用。  相似文献   

15.
结合采样误差分布分析(SEPA)框架和最小角回归(LAR)算法,提出了一种SEPA-LAR变量逐步筛选方法用于波长选择,并建立了稳健的近红外光谱分析模型。利用蒙特卡洛采样(MCS)获得多个数据集划分建立多个模型,对光谱各变量(波长)在所有模型的LAR系数进行统计分析,按其回归系数绝对值总和由大到小排序,选择排序靠前的波长建立偏最小二乘(PLS)模型,以未参与SEPA-LAR和建模的独立验证集对该模型进行评价。将玉米湿度、柴油密度以及奶酪脂肪的近红外光谱数据用于SEPA-LAR的性能检验,独立验证集的预测均方根误差(RMSEP)分别为0.001 44%(湿度指标)、0.001 58 g/mL(密度指标)以及1.13 g/100 g(脂肪含量指标)。结果表明,相较于竞争自适应重加权采样法(CARS),该方法具有更优异的稳定性;相较于移动窗口偏最小二乘(MWPLS)以及蒙特卡洛无信息变量消除(MCUVE)方法,该方法选择的变量更少,预测误差更低,预测性、可解释性和稳定性更优异。  相似文献   

16.
在分析了改性双基推进剂不同成分含量对其燃速性能影响的基础上,使用机器学习方法建立了以推进剂成分含量及压强为输入变量,推进剂燃速值为输出的预测模型。通过以相关系数(R~2)、均方根误差(RMSE)以及平均绝对误差(MAE)作为模型的性能评价指标,比较了不同机器学习方法的预测性能,包括随机森林、支持向量回归、极限梯度提升、人工神经网络、多元线性回归、偏最小二乘回归和K最近邻回归。结果表明,以多项式内积(Poly)为核函数的支持向量回归(Support Vector Regression, SVR)模型的预测效果最优,其模型的留一法交叉验证结果令人满意,R~2、RMSE、MAE分别为0.9927、0.5553、0.4033。最后,为进一步验证模型的准确性、稳定性,我们分别采用5折、10折交叉验证与留一法进行结果比较,并绘制模型的学习曲线。结果证实模型稳定可靠,过拟合程度低,可实现对改性双基推进剂燃速的准确预测,可为具有优越性能的推进剂配方设计与优化提供理论指导。  相似文献   

17.
利用近红外光谱技术对食用植物油中反式脂肪酸(Trans fatty acids,TFA)含量进行快速定量检测,并通过波段选择、预处理方法、变量筛选及建模方法对TFA含量预测模型进行优化.采用AntarisⅡ傅里叶变换近红外光谱仪在4000~10000 cm-1光谱范围采集98个食用植物油样本的近红外透射光谱,然后采用气相色谱法测定TFA的真实含量.首先,对样本原始光谱进行波段、预处理方法优选;在此基础上,采用竞争自适应重加权法(Competitive adaptive reweighted sampling,CARS)筛选TFA相关的重要变量,最后应用主成分回归、偏最小二乘和最小二乘支持向量机方法分别建立食用植物油中TFA含量的预测模型.研究结果表明,近红外光谱技术检测食用植物油中的TFA含量是可行的,优化后的最佳预测模型的校正集和预测集R2分别为0.992和0.989,RMSEC和RMSEP分别为0.071%和0.075%.最佳预测模型所用的变量仅26个,占全波段变量的0.854%.此外,与全波段偏最小二乘预测模型相比,其预测集R2由0.904上升为0.989,RMSEP由0.230%下降为0.075%.由此表明,模型优化非常必要,CARS能有效筛选TFA相关的重要变量,极大减少建模变量数,从而简化预测模型,并较大提高预测模型的精度和稳定性.  相似文献   

18.
该研究基于近红外光谱技术建立了何首乌在蒸制过程中多糖含量变化的快速定量模型。采用蒽酮-浓硫酸法测定了不同蒸制时间何首乌的多糖含量并结合采集的近红外光谱数据建立模型,以校正集相关系数(R2c)、预测集相关系数(R2p)、交叉验证集均方根误差(RMSECV)和预测集均方根误差(RMSEP)作为评价指标,考察了不同预处理方法和变量筛选方法的效果。结果显示,随着蒸制时间的延长,何首乌多糖含量先上升后下降并趋于平稳,采用平滑+变量标准化+随机蛙跳变量筛选建立的偏最小二乘法回归模型的R2c=0.96,RMSECV=0.74,R2p=0.96,RMSEP=0.28;外部预测相对偏差小于3.0%。所建立的多糖含量定量模型质量较高,预测能力较强,可为探索何首乌炮制工艺标准化及质量评价提供参考。  相似文献   

19.
该文将蒙特卡洛-无变量信息消除(MC-UVE)算法和变量重要性投影(VIP)算法结合,挑选出重要、有信息的波长变量,建立了MC-UVE-VIP两步波长筛选方法。该法首先采用MC-UVE筛选出稳定性参数大于某一阈值(Mthreshold)的有信息波长集合UUVE,然后采用VIP算法从UUVE中筛选出VIP参数大于UUVE中所有波长VIP均值的波长,作为重要、有信息的波长集合UUVE-VIP。基于UUVE-VIP建立玉米中蛋白质含量的偏最小二乘回归(PLSR)近红外光谱预测模型,模型的潜变量个数根据累计贡献率大于99.9%确定。该模型变量少、稳健、可解释性强、运算速度快,其预测两台从机样品蛋白质的平均相对误差(MARE)分别为1.64%与1.88%,均小于MC-UVE模型的从机MARE(5.40%与5.19%)和VIP模型的从机MARE(6.23%与7.16%)。因此,基于MC-UVE-VIP两步波长筛选法所建立的玉米蛋白质含量近红外光谱模型可直接传递到从机,...  相似文献   

20.
支持向量回归-同步荧光光谱法预测鸭肉中克百威残留   总被引:1,自引:0,他引:1  
为了满足鸭肉中克百威残留分析及快速检测的要求,基于克百威水解物在巯基乙醇存在的条件下能与邻苯二甲醛反应产生具有强荧光性衍生物的方法,建立了应用同步荧光光谱法测定鸭肉中克百威残留量的预测模型。对含有克百威鸭肉样品的三维同步荧光光谱进行分析,确定其最佳波长差Δλ为120 nm;利用遗传算法(GA)结合交互验证均方根误差(RMSECV)从240~450 nm光谱中筛选出19个波长作为定量分析模型的输入特征变量;对SVR、PCR、PLS 3种回归模型的性能进行比较,实验发现SVR模型的预测结果最好,其预测集的决定系数(r2)和预测均方根误差(RMSEP)分别为0.999 4和0.878 7。研究结果表明,采用同步荧光光谱法结合支持向量回归算法测定鸭肉中克百威的残留量,具有快速、预测精度高等特点,可为检测鸭肉中的克百威残留量提供一种可行的方法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号