共查询到19条相似文献,搜索用时 78 毫秒
1.
SVM回归法在近红外光谱定量分析中的应用研究 总被引:6,自引:9,他引:6
研究了基于统计学习理论的支持向量机(SVM)回归法在近红外光谱定量分析中的应用。以66个小麦样品为实验材料,由33个小麦样品作为校正样品,采用4种不同核函数方法对小麦样品蛋白质含量与小麦样品近红外光谱进行SVM回归建模。以所建4种不同SVM回归模型对33个小麦预测样品的蛋白质含量进行了预测;不同回归模型的预测结果与凯氏定氮法确定的蛋白质含量的标准化学值间的相关系数均在0.97以上,平均绝对误差小于0.32。为了考察SVM回归校正模型的预测效果,同所建PLS回归模型的预测结果进行了比较,表明所建预测小麦样品蛋白质含量的SVM回归模型亦可通过近红外光谱进行实际样品的定量分析,且有较好的分析效果。 相似文献
2.
近红外光谱温度修正定量分析模型的研究 总被引:6,自引:3,他引:6
以小麦粉末样品为实验材料,研究了环境温度对近红外光谱定量分析结果的影响。将环境温度作为外部变量,使用不同温度下的45个样品建立了测定小麦蛋白质含量的温度修正模型,预测不同温度下的小麦样品的蛋白质含量,结果同以22 ℃恒温下45个样品建立的模型进行了比较。分析结果表明:温度修正模型的预测标准差(SEP)平均为0.333,而恒温模型(22 ℃)的预测标准差随着环境温度与建模时温度差的增大而增大,当环境温度4 ℃时,SEP=0.601 6。温度修正模型可以有效的提高近红外光谱定量分析精度。 相似文献
3.
有监督主成分回归法在近红外光谱定量分析中的应用研究 总被引:5,自引:0,他引:5
介绍了运用有监督主成分回归法建立近红外光谱定量分析模型的原理和方法.利用该方法先进行近红外光谱定量分析建模的波长信息选择,达到降低光谱数据维数的目的,然后建立数学模型,并用其分析预测集样品.文中以66个小麦样品为实验材料,随机选择其中40个样品建立小麦样品中蛋白质含量的近红外光谱定量分析模型,首先优选出4个波长点:4 632,4 636,5 994,5 997 cm-1,利用这4个波长点处光谱信息建立主成分回归模型预测26个样品的蛋白质含量,其结果与凯氏定氮法分析结果的相关系数为0.991,平均相对误差为1.5%.该方法从大量光谱数据中筛选出最重要的部分波长信息,实现了"少而精"的波长点选择,对建立抗共线性信息干扰的光谱定量分析模型,同时对指导专用近红外分析仪器设计中波长点的选择等方面都有一定的意义. 相似文献
4.
PLS-BP法近红外光谱定量分析研究 总被引:19,自引:7,他引:19
建立BP模型用于近红外光谱定量分析时,为克服所建模型与训练样本集产生“过拟合”,先用线性算法为其压缩训练数据是必要的。目前多采用主成分法(PCA)和逐步回归法(SRA)。主成分法具有极强的压缩数据能力,用它压缩成的主成分输入BP网所建模型的预测精度一般能满足要求,但它处理数据时未考虑输出变量的影响。逐步回归法根据系统输出选择变量,但所选变量具有自相关性,而且与训练集样品的排列顺序有关,很难选出最好的变量,往往难满足预测精度要求。本研究用偏最小二乘法(PLS),根据输出变量将原始数据压缩为主成分,输入BP网并用所建模型预测30个小麦样品的蛋白质含量。结果表明,与PCA-BP模型的预测决定系数(R2)从92.50提高到97.10,训练迭代次数从12 000减少到4 500。 相似文献
5.
根据废旧纺织品所含成分对它们做分类回收和处理可节省大量纺织原材料。目前,在废旧纺织品的回收过程中往往使用人工分拣方法。这种方法成本高且效率低。近红外光谱分析是21世纪发展最迅速的技术之一,可以在不破坏样本的情况下快速测定样本的成分及每种成分的含量。利用该技术对废旧纺织品进行分析,预先判断废旧纺织品所含的成分及各种成分的含量,可为废旧纺织品的大规模精细分类回收提供帮助。多模型方法通过将各子模型的预测值做加权平均得到最终的预测值,用该方法建立的近红外光谱分析模型一般具有较好的稳定性。以废旧纺织品样本的锦纶含量为例,先用多模型方法建立了锦纶含量的近红外光谱分析模型。方法如下:将反射率向量按照波长划分为15组。用每组数据建立一个近红外光谱分析子模型。对子模型的预测值做加权平均得出锦纶含量的最终预测值。然后在多模型方法基础上,根据锦纶含量预测值与实验值之间的近似线性关系,通过用变量代替常量并对变量做标准化处理,给出了一种便于优化的预测锦纶含量的近红外光谱分析新模型。优化后的每个子模型中的参数比优化前减少了6个,这样可防止模型过拟合。将上述两个模型与常见的用偏最小二乘法建立的模型进行了对比。交叉验证的结果表明:(优化后的)新模型的拟合优度的平均值为0.820 7,单纯使用多模型方法所建模型的拟合优度的平均值为0.769 1,用偏最小二乘法建立的模型的拟合优度的平均值为0.746 7。因此, 使用多模型方法建立的模型的预测效果好于用偏最小二乘法建立的模型的预测效果。新模型的预测效果明显好于其他两个模型的预测效果。该研究主要创新之处是新模型的建立和优化。文中建模方法有望用于废旧纺织品样本其他成分的含量预测。 相似文献
6.
利用近红外光谱分析技术结合定量偏最小二乘法对农大108玉米的纯度进行了定量测定,首先通过在农大108杂交种子加入不同量的母本178种子,获得纯度60%~100%范围内的样本123份,然后测定粉碎后样本的光谱,根据2:1的比例划分建模集和检验集。结果表明:6 000~10 000 cm-1为适宜的建模光谱范围,主成分为8时,建模集内部交叉验证的决定系数达96.61%、校正标准差(SEC)2.15%,平均相对误差(RSD)2.04%;检验集的决定系数达到97.67%,校正标准差(SEP)1.78%,平均相对误差(RSD)1.94%。采用该方法建模时,采用不同比例的建模样品和检验样品,建模集平均决定系数为96.21%,校正标准差2.29%,平均相对误差为2.81%。检验集的平均决定系数为95.75%,预测标准差2.23%,平均相对误差为2.73%,进一步证明模型的稳定性。 相似文献
7.
近红外光谱技术在中草药分析中的应用 总被引:8,自引:0,他引:8
中草药分析与鉴定对中草药质量控制意义重大,传统分析方法由于过程复杂、需要丰富的经验等不利因素,无法满足快速分析和在线分析的要求。近红外光谱技术具有预处理简单、分析速度快、适用于固体漫反射技术和光纤技术等特点,已经在中草药有效组分的快速测定、在线质量控制、药材真伪鉴别、产地及质量鉴定等方面得到广泛应用。文章介绍了近红外光谱技术的基本原理和分析方法,综述了近红外光谱技术在中草药定量及定性分析方面的具体应用。 相似文献
8.
极限学习机理论(extreme learning machine, ELM)作为一种新的化学计量学方法,在近红外光谱定量分析中的应用研究,已引起学术界的高度重视。然而,由于光谱数据维数较高,建立ELM模型时需要大量的隐节点,导致隐含层输出矩阵维数高且存在高度共线性,用现有的Moore-Penrose广义逆算法求取隐含层输出矩阵与待测性质间的回归模型往往会存在病态问题。基于ELM建立光谱波长变量与性质之间的回归模型,提出以ELM模型隐含层输出矩阵作为新的变量,采用作者最新提出的基于变量投影重要性的改进叠加PLS算法(stacked partial least squares regression algorithm based on variable importance in the projection,VIP-SPLS),建立新变量与待测性质间的回归模型。VIP-SPLS算法充分利用了每个隐节点的输出信息,能有效解决高维共线性问题,同时具有模型集成的优点,从而改进了ELM模型的性能。将提出的改进ELM算法(improved ELM,iELM)应用于标准近红外光谱数据集,结果表明iELM模型的精度相对于现有的PLS模型和ELM模型分别显著提升了29.06%和27.47%。 相似文献
9.
芦丁和维生素C的近红外漫反射光谱技术定量分析研究 总被引:17,自引:1,他引:17
首次利用近红外漫反射技术和偏最小二乘法定量分析了复方芦丁片的主组分芦丁和维生素C混合样品的含量,所建立的预测方程对样品的预测值和真实值之间的相关系数为99.75%,芦丁和维生素C定标标准差分别为0.363%和1.078%。该方法快速、准确、不破坏样品。 相似文献
10.
绝缘纸的老化状态决定了油浸式变压器的剩余寿命,对绝缘纸的老化状态进行快速有效的评估具有重要意义。聚合度是表征纤维素绝缘纸老化程度最直接可靠的参量,在实验室中通过粘度法检测获得,但该方法需要获得设备纸样,不但检测耗时长,还会对变压器类设备的绝缘造成破坏。近红外光谱分析技术可以快速有效测定物质中的组分含量,检测过程非侵入、对绝缘无损,目前已成功应用于多个领域,有望成为替代传统聚合度检测的新方法。然而,现有的近红外光谱定量分析方法尚不能满足绝缘纸聚合度的预测精度需求,建立了基于高斯过程回归(GPR)的绝缘纸老化状态定量评估方法。构建了不同老化程度绝缘纸样本—近红外光谱数据库,使用Savitzky-Golay卷积平滑算法对光谱数据进行平滑处理以提高信噪比;研究了不同核函数GPR模型并开展了模型预测精度分析与参数敏感性检验。结果显示,Exp核模型泛化性能较差,Matern32核、 Matern52核以及RQ核模型对参数敏感性较高、模型稳定性较差,最终选择了SE核GPR模型作为最优模型。将SE核GPR模型与近红外分析领域常用的PLS, SVR与BPNN模型进行性能对比,结果表明,GPR模型对校正集... 相似文献
11.
茶叶定性和定量近红外光谱分析方法研究 总被引:5,自引:0,他引:5
分别采集了茉莉花茶、苦丁茶、龙井和铁观音4个种类茶叶共120个样本,利用NIRSystems6500型近红外光谱分析仪对样本进行光谱测量,应用近红外光谱分析技术对茶叶进行定性和定量分析。采用主成分分析法,结合聚类分析法,对4种类别的茶叶进行定性鉴别,通过对不同光谱数据预处理方式和不确定因子系数进行比较,确立了最优定性判别定标模型。同时,采用修正的偏最小二乘法,比较不同光谱预处理方法对定标模型的影响,建立了茶叶中水分、茶多酚和咖啡碱含量的定量分析模型,并对未知样本进行预测。定性分析模型的种类识别准确率达到100%,定量分析模型的决定系数均大于0.91,相对分析误差RPD均大于3。结果表明,利用NIRS分析技术可以快速定性和定量分析鉴别茶叶的类别和成分含量。 相似文献
12.
基于近红外光谱技术的石油组分定量分析新方法 总被引:12,自引:1,他引:12
针对石油化工产品生产控制和质量检查的需要,为提高测定产品组成的效率,将近红外光谱法作为基础测定方法,以直馏柴油、加氢精制柴油和催化裂化柴油为校正模型的训练样本,测定其中饱和烃、胶质、单环芳烃、双环芳烃、三环芳烃和环烷烃的组成,论述了采用模糊神经网络建立校正模型测定石油化工产品组成的可行性。基于dSPACE硬件平台,用验证样本对模糊神经网络校正模型进行了检验,实验结果表明,该方法响应快、误差小、鲁棒性强,在近红外长波区内,校正样品和验证样品的均方误差小于10-6。该方法可用于石油化工产品的生产工艺研究中。 相似文献
13.
近红外光谱法对甲醇柴油中甲醇含量测定 总被引:1,自引:0,他引:1
应用近红外光谱结合化学计量学方法实现了对甲醇柴油中的甲醇含量的定量分析。以实验室配制的32种不同浓度[浓度范围为2%~25.8%(φ)]的甲醇柴油溶液为研究对象,在4 500~7 000 cm-1光谱范围内,建立偏最小二乘(PLS)、支持向量机(SVM)和最小二乘支持向量机(LS-SVM)三种定量分析模型。在建立SVM模型时,经过比较分析,径向基函数(radial basis function,RBF)作为SVM模型的核函数时可以获得更高的预测精度。最终获得甲醇含量的PLS, SVM和LS-SVM三种模型的预测相关系数RP分别为0.985 9, 0.990 3, 0.998 9,预测均方根误差RMSEP分别为0.405 2, 0.356 3, 0.062 4,可以看出,三种预测模型都可以达到很好的效果,最优的预测模型是使用LS-SVM建模。研究结果表明,利用近红外光谱法结合化学计量学方法对甲醇柴油中甲醇含量的检测具有可行性,并可以达到很好的效果。采用近红外光谱技术结合化学计量方法对甲醇柴油中甲醇含量进行定量分析,也为近红外光谱技术快速无损检测甲醇柴油甲醇含量提供参考和应用价值。 相似文献
14.
提出了一种基于偏最小二乘增量式神经网络的近红外光谱定量分析模型。该模型采用典型三层反向传播神经网络(BPNN),不同波长吸光度和成分浓度是模型的输入和输出。在使用历史样本训练之前先进行偏最小二乘(PLS)回归,所得自变量和因变量的历史负荷矩阵分别用于确定模型输入层和输出层的初始权值,且自变量的主成分个数作为隐层的节点数。当获得新的样本时,对新数据与历史负荷矩阵组合后进行PLS回归,将所得新的负荷矩阵与历史负荷矩阵融合后作为模型输入层和输出层新的初始权值,接着使用新样本对模型进行训练来实现增量式更新。将所提模型与PLS、BPNN、基于PLS的BPNN、递归PLS在天然气燃烧烟气近红外光谱数据上测定后比较。对于烟气中二氧化碳浓度的预测,所提模型的预测均方根误差(RMSEP)分别降低了27.27%,58.12%,19.24%和14.26%;对于烟气中一氧化碳浓度的预测,所提模型的RMSEP分别降低了20.65%,24.69%,18.54%和19.42%;对于烟气中甲烷浓度的预测,此模型的RMSEP分别降低了27.56%,37.76%,8.63%和3.20%。实验结果表明,所提模型不仅通过PLS对BPNN结构和初始权重的优化,使模型具有较强的预测能力,而且能在已建模型信息的基础上,不访问旧数据而用新增样本即可完成自身的增量式更新,从而使模型具有较好的稳健性和泛化性。 相似文献
15.
提出了一种以样品光谱类间相关系数之和最小为准则进行光谱波长逐步筛选的方法(stepwise selection basing on minimum sum of correlation coefficients, SMCC),以类间距离与类内距离和的比值最大化(符合分析者主观预期目标)作为定性分析中特征波长筛选效果的评价依据,并使用红塔集团提供的2012年17种不同类型工业分级烟叶作为试验样品,以验证筛选方法的有效性。研究表明,采用CO1分级烟叶光谱作为参照类别,筛选出10个特征波长点:采用特征波长计算得到的类内欧氏距离的平均值为采用全部波长计算得到的平均值的1.69倍,采用特征波长计算得到的类间欧氏距离的平均值为采用全部波长计算得到的平均值的3.70倍,采用特征波长计算得到的类间欧氏距离与类内欧氏距离和的比值的平均值为采用全部波长计算得到的平均值的2.21倍。特征波长的类间与类内欧氏距离和的比值增大,说明筛选出来的特征波长能更加有效的表达不同类间的远近关系以及同一类内的离散度,SMCC算法是一种有效的、可应用于近红外光谱定性分析中的特征波长筛选方法。 相似文献
16.
研究了偏最小二乘(partial least squares ,PLS)与广义回归神经网络(generalized regression neural networks, GRNN)联用在近红外光谱多组分定量分析中的应用。以饲料样品为实验材料,采用PLS-GRNN法建立了饲料中水溶性氯化物、粗纤维、脂肪三项组分含量近红外光谱定量分析模型。马氏距离法剔除强影响点和奇异点,用PLS法将原始数据压缩为主成分,取8个主成分吸收峰与4个原始图谱特征峰值输入GRNN网络,网络光滑因子σi为0.1。PLS-GRNN模型对样品3个组分含量的预测决定系数(r2)分别为:0.984 0,0.987 0,0.983 0;样品平行扫描光谱预测值的标准偏差分别为:0.003 26,0.065 5,0.031 4。结果表明所建PLS-GRNN模型通过近红外光谱能够准确预测饲料中水溶性氯化物、粗纤维、脂肪三项组分含量,为近红外光谱进行多组分定量分析提供了新思路,同时为解决近红外快速检测技术在预测组分含量较低的样品时误差相对较大的问题提供了可靠的方法。 相似文献
17.
基于遗传算法的近红外光谱定性分析特征波长提取方法研究 总被引:1,自引:0,他引:1
近红外光谱分析技术虽在多领域获得广泛应用,但应用时仍以实验室仪器为主,目前光谱仪存在体积大、功耗高、价格贵等问题,有能力购买与使用此类仪器的主要是高校、科研院所、大型企业等,常用的基于傅里叶变换或光栅原理的光谱仪价格通常高达几十万元,超出中小企业、普通百姓的经济承受能力,因此近红外光谱仪的进一步推广应用仍有难度.降低仪... 相似文献
18.
压缩感知(CS)是一种新兴的信号压缩和采样技术,正交匹配追踪(OMP)是一种贪婪追踪算法,广泛用于压缩感知领域中的稀疏信号重构.针对近红外光谱信号高维小样本以及信号稀疏先验的特点,为进一步提高小样本近红外光谱变量选择的灵活性和可靠性,基于压缩感知理论,提出了一种新颖的光谱变量选择方法正交匹配追踪变量选择(OM PBVS... 相似文献
19.
研究了Elman神经网络(反馈神经网络,Recurrent Network)在近红外光谱定量分析中的应用。以饲料样品为实验材料,采用Elman网络建立了饲料中苯丙氨酸(Phe)、赖氨酸(Lys)、酪氨酸(Tyr)和胱氨酸(Cys)四种氨基酸含量的近红外光谱定量分析模型。用偏最小二乘法(partial least squares ,PLS)将原始数据压缩为主成分,取前3个主成分的12个吸收峰值输入Elman网络,网络中间层神经元个数为47。Elman网络模型对样品4个氨基酸含量的预测决定系数(r2)分别为0.960,0.981,0.979,0.952。表明所建Elman网络预测模型通过近红外光谱能够较准确预测饲料中苯丙氨酸、赖氨酸、酪氨酸和胱氨酸四种氨基酸的含量,为通过近红外光谱技术进行多组分定量分析提供了新思路。 相似文献