首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 968 毫秒
1.
近红外光谱技术因快速、无损等特点,已广泛应用于烟草行业质量快速分析。然而,由于采收时间、环境差异等因素的影响,建立的近红外定量模型在新批次样本中的预测性能通常变差,因此必须对原有模型进行维护和更新。该研究采用半监督无参数校正增强(SS-PFCE)方法,通过约束优化,对主模型的回归系数进行修正。首先建立了2016年烟叶样本总糖含量的原始定量模型,其预测相关系数(Rp)为0.997 8、预测均方根误差(RMSEP)为0.310 8。采用SS-PFCE方法对模型更新后,分别预测2017年、2018年和2020年样本的总糖含量,3个测试集的Rp值比未更新模型提高了0.13%、1.32%和4.29%,RMSEP分别下降了15.26%、58.69%和36.53%。与重新建立的定量分析模型相比,更新后的模型具有更优的预测性能,同时大大降低了建模成本。研究表明,SS-PFCE方法可高效地实现不同年份烟叶样本的模型维护,在实际生产中具有重要的应用价值。  相似文献   

2.
烃基酚类化合物对四膜虫毒性的定量结构-活性相关研究   总被引:2,自引:0,他引:2  
在B3LYP/6-311G*水平上全优化计算了41个烃基苯酚的量子化学参数,连同取代烃基位置编码参数共同表征有机物的分子结构,应用基于预测的模型变量选择方法(VSMP)选择描述子最佳子集,建立了偶极距(μ)和分子平均极化率(α)与烃基苯酚对梨形四膜虫水生毒性pIGC50 两变量线性QSAR模型,模型的相关系数r为0.9434,均方根误差RMSE为0.2548,LOO交叉验证相关系数Q为0.9170,均方根误差RMSV为0.3066;为检验模型的稳定性和预测能力,将41个样本分作了奇数集和偶数集,分别建立了模型,并用y-Randomization方法对全部样本、奇数集和偶数集所建立的模型进行了检验;建立的奇数集和偶数集模型均满足Tropsha研究小组建议的预测能力标准.  相似文献   

3.
在B3LYP/6—311G*水平上全优化计算了41个烃基苯酚的量子化学参数,连同取代烃基位置编码参数共同表征有机物的分子结构,应用基于预测的模型变量选择方法(VSMP)选择描述子最佳子集,建立了偶极距(μ)和分子平均极化率(α)与烃基苯酚对梨形四膜虫水生毒性pIGC50两变量线性QSAR模型,模型的相关系数r为0.9434,均方根误差RMSE为0.2548,LOO交叉验证相关系数Q为0.9170,均方根误差RMSV为0.3066;为检验模型的稳定性和预测能力,将41个样本分作了奇数集和偶数集,分别建立了模型,并用Y—Randomization方法对全部样本、奇数集和偶数集所建立的模型进行了检验;建立的奇数集和偶数集模型均满足Tropsha研究小组建议的预测能力标准。  相似文献   

4.
为了实现扫描仪在不同光源、不同观察者条件下准确获取颜色信息,最大程度的避免同色异谱现象,本文采用光谱的方法对扫描仪进行特性化处理,通过多项式回归和BP神经网络分别与主成分分析法结合,首先对检测样本的光谱反射率进行主成分分析,提取主成分与主成分系数,通过实验得到主成分系数与多项式回归、BP神经网络结构之间的转换模型,实现了扫描仪低维RGB信号对原始光谱反射率信息的重构,进而实现扫描仪的光谱特性化.实验结果表明,多项式项数为19项时,达到训练样本的均方根误差为1.7%,检测样本的均方根误差为1.9%.而包含15个隐层节点的单隐层BP神经网络结构为比较合理的网络结构,达到训练样本的均方根误差为1.3%,检测样本的均方根误差为1.5%.对彩色扫描仪的特征化处理,采用多项式回归法得到光谱特性化精度较低,采用BP神经网络模型能够实现更高的光谱特性化精度.  相似文献   

5.
基于小波系数的近红外光谱局部建模方法与应用研究   总被引:2,自引:0,他引:2  
局部建模方法使用与预测样本相似的样本建立模型,可解决光谱响应与浓度之间的非线性问题,扩大模型的适用范围,提高预测准确度。采用小波变换进行数据压缩并利用小波系数之间的欧氏距离作为光谱相似性的判据,实现了近红外光谱定量分析的局部建模方法,避免了样本之间的依赖性。将所建立的方法用于烟草样品中氯含量的测定,100次重复计算得到的预测集均方根误差(RMSEP)平均值为0.0665,标准偏差(σ)为0.0045,优于全局建模和基于主成分的局部建模方法。  相似文献   

6.
可见-近红外光谱技术是对土壤速效磷含量定量估测的有效手段,但某一地区土壤采集的光谱数据建立的模型在给其它地区使用时会出现预测精度低、模型失效等问题。该文以皖南土壤样本为源域,皖北土壤样本为目标域,通过迁移学习方法建立了预测模型,以提高土壤速效磷预测模型的准确性,并比较了迁移前后预测模型的精度。结果显示,皖南地区模型不能直接用于皖北地区,会出现模型失效问题,该模型的决定系数(R~2)和相对分析误差(RPD)分别为-0.19和0.92,预测均方根误差(RMSEP)为1.04;样本量不大的皖北地区建立模型的预测精度不高,R~2和RPD分别为0.61和1.60,RMSEP为0.60;而基于迁移成分分析(TCA)并加入部分皖北样本建立模型,可显著提高对皖北样本的预测精度,模型的R~2和RPD分别提升至0.79和2.18,RMSEP降低至0.44。表明基于TCA的方法能将皖南土壤速效磷预测模型应用于皖北,可提高皖北土壤速效磷预测模型准确性并降低成本,为土壤速效磷预测模型的广泛应用提供了新思路。  相似文献   

7.
应用异烟肼片粉末的近红外漫反射光谱数据分别结合偏最小二乘法(PLS)和径向基神经网络(RBFNN)建立定量分析模型,并用所建模型对预测集样品进行了预测,结果表明:应用RBFNN所建立的定量分析模型优于PLS模型,相关系数(r)值由0.99593提高到0.99734,交互验证均方根误差(RMSECV)值由0.00523下降到0.00423,预测均方根误差(RMSEP)值由0.00614下降到0.00501。  相似文献   

8.
为了提高近红外光谱定量分析的预测精度和建模效率,提出了一种基于交互式自模型的混合物分析的波长优选方法,根据光谱各波长变量的纯度值和标准差值,选择含有用信息的波长变量,并引入相关权函数解决变量间共线性问题.通过依次迭代选择的变量建立定量校正模型,由交互验证均方根预测误差(RMSECV)确定最佳波长变量个数.应用该波长变量优选方法对具有不同葡萄糖含量的两组(四成分葡萄糖水溶液实验和人体血浆实验)近红外光谱数据进行分析,两组数据中分别只选择了全部变量的0.3%建立定量校正模型,其验证集葡萄糖浓度的均方根预测误差(RMSEP)分别减少为669和15 mg/L.与全谱范围及优选波段建立的定量校正模型比较,本方法能够通过波长变量优选最小化冗余信息、提高预测精度及建模效率.  相似文献   

9.
以不同厂家阿莫西林胶囊及其内容物近红外(Near infrared,NIR)光谱为例,寻找评价分段直接标准化算法(Piecewise direct standardization,PDS)进行光谱校正是否成功的量化指标。本研究共涉及76批阿莫西林胶囊样品,其中54批用于建立胶囊剂的定量模型。通过聚类分析,所有胶囊的NIR光谱分成5类,每类视为一个均质样本;分别计算每个均质样本的平均光谱,从该样本中选择10~15张光谱作为PDS校正的目标光谱,对76批阿莫西林胶囊内容物粉末光谱进行校正,利用阿莫西林胶囊定量模型对校正后的光谱进行含量预测;计算校正后的光谱与PDS校正中目标光谱所属均质样本的平均光谱的相似系数,分析其与预测误差的关系。结果表明,校正结果与所选择的目标光谱关系密切。PDS校正光谱与模型中不同均质样本平均光谱的相似系数(r)越大,通常校正效果越好;当r<99%时,一般可判断PDS校正失败(预测误差>5%)。因此,可以用PDS校正后光谱与校正时使用的目标光谱所属的均质样本的平均光谱的相似系数作为判断PDS校正是否成功的标志。  相似文献   

10.
当采用近红外光谱技术对糖香料的生产过程进行在线质量监控时,糖香料的温度变化严重影响近红外光谱校正模型的预测性能,使其对糖浆样本中主要成分预测结果的平均均方根误差从2.4%增大到29.2%。本研究将近红外光谱技术与载荷空间标准化新型模型传递方法相结合,有效消除了温度变化对近红外光谱校正模型定量分析结果的影响,使其对糖浆样本中主要成分预测结果的平均均方根误差维持在3.8%的水平,实现了利用近红外光谱技术对糖香料的质量进行快速准确的监测和控制。本研究的研究结果为糖料的配制和使用提供了技术保障。  相似文献   

11.
该文提出了一种基于可扩展的自表示学习(SOP-SRL)波段选择与偏最小二乘(PLS)建模的定量模型分析方法,以安胎丸指标含量阿魏酸、黄芩苷和汉黄芩苷为研究对象,通过SOP-SRL选取代表性波段,采用PLS建立近红外光谱回归模型,并与相关系数法(CC)、正则化自表示学习算法(RSR)和稀疏子空间聚类法(SSC)3种波段选择算法的建模结果进行对比,以校正决定系数(R2c)、校正均方根误差(RMSECV)、预测决定系数(R2p)和预测均方根误差(RMSEP)为评价标准,对回归模型的预测性能进行评估。结果显示,SOP-SRL在3种数据集上均取得了较好的结果,建模波段从全波长的800分别减少到70、67、87;RMSEP分别从0.080 1、6.349 5、0.742 5下降到0.065 3、3.620 8、0.407 3,分别下降了18%、43%、45%;相应的R2p分别从0.911 9、0.879 4、0.915 8提高到0.938 8、0.952 6、0.970 1,分别提高了3%、8%、6%。结果表明,经SOP-SRL波长选择后模型的预测能力相比于其他几种算法得到显著提升,基于SOP-SRL的PLS模型可以实现安胎丸指标含量的快速检测。  相似文献   

12.
运用近红外光谱法对14个厂家22个批次的琥乙红霉素片进行定量分析,包括琥乙红霉素片含量及溶出度的测定。通过偏最小二乘回归方法建立的含量均匀度和溶出度模型相关系数分别达0.99601和0.98189,校正均方根误差分别为0.670和0.575,预测均方根误差为0.646和0.514,与交叉验证均方根误差相近(分别为0.822和0.683)。基于准确性轮廓外部验证的95%的公差区间,样品相对误差低于5%,含量均匀度和溶出度模型的可预测性得到进一步的验证。本研究表明,近红外光谱法能用于琥乙红霉素片含量的测定,同时也能实现对不同厂家琥乙红霉素片溶出度的预测。  相似文献   

13.
刘辉军  吕进  林敏  余良子 《分析测试学报》2007,26(5):679-681,685
利用遗传算法(GA)提取茶叶的近红外吸收特征波长的方法,研究建立了绿茶水分和氨基酸的近红外分析模型,并对波长选择前后两种成分的模型进行了比较分析。结果表明,经遗传算法波长选择后,简化了分析模型,同时模型的稳健性增强。氨基酸预测集的均方根误差(SEP)减小82.1%,水分预测集的均方根误差减小(SEP)76.6%,它们在波长选择前后对应的分析波长数之比分别为995∶7和1990∶33。  相似文献   

14.
由于校正集样本的质量决定校正模型的质量,校正集中奇异样本的检测在多元校正建模中具有非常重要的意义.本研究建立了一种用于近红外光谱多元校正建模时校正集中奇异样本的检测方法.本方法基于奇异样本的定义和偏最小二乘方法的原理,通过考察每个校正集样本在模型的每个因子(或主成分)中对模型的贡献,将与多数样本表现不同的样本识别为奇异样本.采用218个橘汁样本构成的近红外光谱数据进行了分析,结果表明,校正集中存在6个奇异样本,扣除奇异样本后,校正集的交叉验证均方根误差由16.870减小为4.809,预测集的均方根误差从3.688减小为3.332.  相似文献   

15.
在色谱图基线校正和色谱峰匹配基础上,提出以40个银杏叶提取物HPLC指纹图谱的色谱图轮廓作为输入,相应的提取物总抗氧化活性作为输出,建立最小二乘支持向量机回归模型,并对包含10个样本的测试集进行了预测.最小二乘支持向量机的测试集预测误差均方根(RMSEP)为0.0230,预测结果优于目前普遍使用的误差反向传播神经网络和偏最小二乘回归.与采用色谱峰面积为分析变量的模型预测结果比较表明:采用消除干扰后的色谱图全谱轮廓保留了样本的全部信息,预测结果更好  相似文献   

16.
前期研究工作提出了以预测均方根相对误差最小为回归目标的方法(Minimization of prediction relative error,MPRE),它能使得预测结果的均方根相对误差更小.偏最小二乘法(Partial least squares,PLS)是以预测均方根误差为回归目标,能使得预测结果的均方根误差更小.基于多模型结合的思想,提出将MPRE与PLS相结合的双模型结合多元校正方法.本方法步骤为:(1)分别采用MPRE与PLS法对校正集建模;(2)计算阈值;(3)分别采用已建立好的MPRE与PLS模型进行预测;(4)将预测结果与阈值进行比较,得到预测结果.通过对酒精的近红外光谱与汽油紫外光谱进行定量分析结果表明,本方法可进一步减小预测均方根误差与相对误差.  相似文献   

17.
针对小试制剂过程建立的近红外定量模型难以直接应用于中试或大生产过程中的问题,该文以小试和中试条件下多批次药用糊精流化床制粒过程为载体,在线采集其近红外光谱数据并测定水分含量,建立小试过程水分近红外定量模型,提出并应用有指导的正交投影技术结合斜率/截距校正的模型传递方法跨尺度预测中试样本,使中试两个测试集A和B的水分相对预测误差分别由51.04%和26.64%降至4.90%和3.99%,显著提高了模型预测的准确度。将该结果与无指导的正交投影技术结合斜率/截距校正法以及模型更新相比较,该方法能更加有效地去除待测样本光谱中的干扰信息,适用范围广,为小试建立的模型放大应用到中试甚至大生产过程提供了新方案。  相似文献   

18.
基于群体智能的灰狼优化(GWO)算法具有参数少、结构简单、易于实现的优点,但在光谱领域的应用较少。该研究将GWO算法引入近红外光谱的变量筛选中,以玉米数据为例,考察了GWO算法中狼群性能、迭代次数、狼群数量及运算效率,并建立了偏最小二乘(PLS)模型对玉米样品中蛋白质、脂肪、水分以及淀粉含量的测定。结果显示,GWO算法运算效率很高,经过参数调优后建立PLS模型,其蛋白质、脂肪、水分及淀粉的保留变量数分别为19、19、14、34,预测均方根误差(RMSEP)从全波长PLS建模的0.245 8、0.122 4、0.339 8、1.105 8分别下降到0.147 7、0.080 1、0.176 2、0.739 8,分别下降了40%、35%、48%、33%,相关系数也相应地提高。因此,GWO算法不仅优化速度快,选择变量数少,还可以显著提高PLS模型的预测精度,是一种近红外光谱变量选择的有效方法。  相似文献   

19.
将同步荧光法结合人工神经网络(ANN)和支持向量回归(SVR)用于混合体系中荧光光谱重叠的菲(Phe)和2-乙基菲(2-EP)两组分的同时测定。通过三维同步荧光法结合平行因子(PARAFAC)分析寻得Phe和2-EP的特征波长差Δλ为118 nm。在220~280 nm范围内,以31个波长处荧光强度值作为模型的输入变量用于建立ANN和SVR模型。结果显示,ANN模型分析Phe和2-EP预测样本的回收率分别为92.5%~104.9%和96.1%~104.3%,预测均方根误差(RMSEP)分别为2.08和2.95;SVR模型分析预测样本的回收率分别为98.2%~101.3%和94.9%~104.2%,RMSEP分别为0.74和2.42。实际水样的加标回收实验显示,基体简单的矿泉水中两种模型均取得满意结果;而基体复杂的湖水中样品预测值较实际值低,且SVR模型比ANN的预测性能更加稳健,泛化能力更强。将同步荧光法结合SVR模型应用于Phe和2-EP单独及混合状态下与腐植酸(HA)相互作用的研究,结果显示混合体系中Phe和2-EP与HA的结合系数均小于各自单组分体系,表明Phe和2-EP之间存在竞争吸附。  相似文献   

20.
基于近红外光纤漫反射技术,利用偏最小二乘法分别建立了复方氯丙那林胶囊的三种药效成分盐酸氯丙那林、盐酸溴己新和盐酸去氯羟嗪的快速同时测定方法。所建立的盐酸氯丙那林、盐酸溴己新和盐酸去氯羟嗪的定量分析多元校正模型的相关系数分别为99.7%、99.4%和99.0%,校正集的均方根残差分别为0.028、0.145和0.250,预测均方根误差分别为0.055、0.120和0.210。由于该方法是在不经任何预处理的情况下的光纤快速同时分析,因此可用于复方氯丙那林的过程质量控制。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号