共查询到20条相似文献,搜索用时 78 毫秒
1.
极限学习机理论(extreme learning machine, ELM)作为一种新的化学计量学方法,在近红外光谱定量分析中的应用研究,已引起学术界的高度重视。然而,由于光谱数据维数较高,建立ELM模型时需要大量的隐节点,导致隐含层输出矩阵维数高且存在高度共线性,用现有的Moore-Penrose广义逆算法求取隐含层输出矩阵与待测性质间的回归模型往往会存在病态问题。基于ELM建立光谱波长变量与性质之间的回归模型,提出以ELM模型隐含层输出矩阵作为新的变量,采用作者最新提出的基于变量投影重要性的改进叠加PLS算法(stacked partial least squares regression algorithm based on variable importance in the projection,VIP-SPLS),建立新变量与待测性质间的回归模型。VIP-SPLS算法充分利用了每个隐节点的输出信息,能有效解决高维共线性问题,同时具有模型集成的优点,从而改进了ELM模型的性能。将提出的改进ELM算法(improved ELM,iELM)应用于标准近红外光谱数据集,结果表明iELM模型的精度相对于现有的PLS模型和ELM模型分别显著提升了29.06%和27.47%。 相似文献
2.
PLS-BP法近红外光谱定量分析研究 总被引:19,自引:7,他引:19
建立BP模型用于近红外光谱定量分析时,为克服所建模型与训练样本集产生“过拟合”,先用线性算法为其压缩训练数据是必要的。目前多采用主成分法(PCA)和逐步回归法(SRA)。主成分法具有极强的压缩数据能力,用它压缩成的主成分输入BP网所建模型的预测精度一般能满足要求,但它处理数据时未考虑输出变量的影响。逐步回归法根据系统输出选择变量,但所选变量具有自相关性,而且与训练集样品的排列顺序有关,很难选出最好的变量,往往难满足预测精度要求。本研究用偏最小二乘法(PLS),根据输出变量将原始数据压缩为主成分,输入BP网并用所建模型预测30个小麦样品的蛋白质含量。结果表明,与PCA-BP模型的预测决定系数(R2)从92.50提高到97.10,训练迭代次数从12 000减少到4 500。 相似文献
3.
红外光谱结合偏最小二乘法定量分析毛竹/聚丙烯复合材料的主成分 总被引:1,自引:0,他引:1
木塑复合材料(wood plastic composites, WPC)中生物质和塑料的比例影响其物理力学性能和价格。建立一种快速、准确的方法预测WPC中生物质和塑料的含量对于WPC市场的进一步发展具有重要作用。现有的检测方法主要为热分析法,然而,热分析法固有的缺陷(包括检检测时间长、测精度低、操作复杂等)严重限制了其应用范围。为此,本研究采用红外光谱(FTIR)结合偏最小二乘法(PLS)对毛竹/聚丙烯(PP)复合材料样品中毛竹及PP的含量进行了快速测定。以毛竹为生物质填料、PP为基体材料,同时加入一定量的添加剂,采用挤出成型法制备了42个不同毛竹/PP比例的WPC样品。采用KBr压片法收集42个WPC样品的红外光谱数据,利用PLS-2和完全交互验证方式建立样品中毛竹及PP含量和光谱数据间的相关性模型。内部交互验证结果表明,对原始光谱进行一阶导数和SNV预处理后,选择1 800~800 cm-1 波段建立的模型性能最佳。毛竹和PP含量的校正模型决定系数R2均为0.955,校正标准偏差SEC分别为1.827和1.848。毛竹和PP含量的预测模型决定系数R2均为0.950,交互验证标准偏差SECV分别为1.927和1.950,RPD值均为4.45。外部验证结果表明,毛竹和PP含量相对预测偏差均低于6%,FTIR结合PLS法可以同时快速、准确地预测毛竹/PP复合材料中毛竹及PP含量。 相似文献
4.
研究了偏最小二乘(partial least squares ,PLS)与广义回归神经网络(generalized regression neural networks, GRNN)联用在近红外光谱多组分定量分析中的应用。以饲料样品为实验材料,采用PLS-GRNN法建立了饲料中水溶性氯化物、粗纤维、脂肪三项组分含量近红外光谱定量分析模型。马氏距离法剔除强影响点和奇异点,用PLS法将原始数据压缩为主成分,取8个主成分吸收峰与4个原始图谱特征峰值输入GRNN网络,网络光滑因子σi为0.1。PLS-GRNN模型对样品3个组分含量的预测决定系数(r2)分别为:0.984 0,0.987 0,0.983 0;样品平行扫描光谱预测值的标准偏差分别为:0.003 26,0.065 5,0.031 4。结果表明所建PLS-GRNN模型通过近红外光谱能够准确预测饲料中水溶性氯化物、粗纤维、脂肪三项组分含量,为近红外光谱进行多组分定量分析提供了新思路,同时为解决近红外快速检测技术在预测组分含量较低的样品时误差相对较大的问题提供了可靠的方法。 相似文献
5.
基于火箭煤油的近红外光谱数据和化学计量学方法,成功地对火箭煤油的密度、馏程、粘度、碘值等四种特性指标进行了测定.本文测定了70多个火箭煤油样品的近红外光谱,在适当的光谱区间内用偏最小二乘法(PLS)法建立模型,各参数的相关性R2在0.862~0.999之间.用该模型对10个未知样品进行测定,近红外光谱法预测的准确度均符合标准分析方法的要求.研究表明,该方法为火箭煤油分析检测提供了一种简便、快捷、准确的方法. 相似文献
6.
近红外光谱技术快速鉴别地沟油与食用植物油的研究 总被引:1,自引:0,他引:1
地沟油检测是我国食品安全最为关注的话题之一,它给人们的生活健康带来了极大的危害。国内现有的检测手段也仅停留在定性检测水平上,只能确定地沟油的有无,还难以进行定量检测。本实验利用近红外光谱技术与光纤传感技术相结合的新方法对勾兑混合油中地沟油的含量进行了定量分析。将煎炸老油与九三大豆油按照一定的体积比进行勾兑,共计50个样本,采集其近红外透射光谱,分别采用偏最小二乘法(PLS)和BP人工神经网络建立了煎炸老油含量的定量分析模型,校正集决定系数分别为0.908和0.934,验证集决定系数分别为0.961和0.952,均方估计残差(RMSEC)为0.184和0.136,预测均方根误差(RMSEP)都为0.111 6,符合应用要求,同时还结合主成分分析法(PCA)对煎炸老油与食用植物油进行了鉴别,识别准确率为100%。实验研究证明近红外光谱技术不仅可以准确快速的定性分析地沟油, 还能定量的检测地沟油的含量,在油脂的检测方面具有很大的应用前景。 相似文献
7.
近红外光谱技术快速无损测定带鱼糜及其制品中磷酸盐含量 总被引:2,自引:0,他引:2
通过拟合带鱼糜及其鱼糕制品的近红外漫反射光谱与建立近红外的定量模型,用于带鱼糜及其鱼糕制品中磷酸盐含量的快速无损检测。以定标集和验证集的相关系数(rC, rV)及标准误差(SEC, SEP)作为评价模型优劣的根据。结果表明,采用偏最小二乘法(PLS)所建立的模型效果最佳,带鱼糜及其鱼糕制品的定标模型的相关系数分别为0.983和0.960,预测标准误差分别为0.032和0.101;验证集的相关系数分别为0.951和0.954,预测标准误差分别为0.058和0.097。利用近红外光谱技术快速无损测定带鱼糜及其鱼糕制品中的磷酸盐含量是可行的。 相似文献
8.
果酒发酵中的多酚是引起果酒口感、颜色变化的重要因素。为保证果酒品质,有必要开发一种快速监测发酵过程中多酚含量变化的技术。收集不同批次成熟期的蓝莓、桑葚为原料,分别碾压成汁,同时按比例混合二者,于小型发酵罐进行发酵。通过离线收集不同发酵时段的发酵液于离心管,高速离心后取上清液置于棕色瓶保存,共计得到48个果酒发酵样本。将上清液置于三个平行样比色皿,以傅里叶快速变换近红外光谱仪(FT-NIR)采集其透射光谱,取平均值作为该样本的光谱信号。然后将棕色瓶内的发酵液以国标法(即以标准液的吸光度值制定标准曲线)测定各样品的总酚含量,以duplex法计算样本光谱之间的距离且按2∶1的比例划分为训练集和预测集。采用间隔偏最小二乘法(iPLS)将训练集样本的透射光谱与总酚含量之间构建定量模型,间隔数从2依次变化到60个。该研究创新之处是使用共识方法融合多个已构建好的iPLS成员模型,按一定的共识规则分配权系数。通过各成员模型交互验证的残差及其残差之间的相关性来优化各成员模型的线性组合,以拉格朗日乘数法求解各成员模型的权系数,使间隔偏最小二乘-共识模型(consensual iPLS,CiPLS)的交互验证均方根误差最小。相比于全局PLS模型、划分不同间隔数量时的iPLS模型,CiPLS均具有较小的预测误差。当划分39个间隔时由三个iPLS成员模型(即14th,16th,18th)组成的共识模型误差最小为124.2,交互验证相关系数为0.944,对预测集样本的预测均方根误差为163.4,预测相关系数为0.931,预测性能均优于PLS和iPLS模型。另外,作为对比选用连续投影算法与无信息变量剔除法来优化光谱模型,其预测性能均不及本文提出的共识模型。分析各iPLS模型预测残差之间的相关性,发现共识模型主要是融合那些具有较高预测性能且模型间较低相关性的成员模型。结果表明,光谱分析结合共识方法可提高回归模型的预测精度、减少建模所需变量数,能够用于果酒总酚含量的离线快速检测。 相似文献
9.
应用近红外(NIR)光谱技术结合化学计量学法建立测定蛹虫草菌丝体中腺苷、蛋白、多糖和虫草酸4种主要有效成分含量的定量分析模型,可应用于蛹虫草高产突变株的筛选和发酵条件的优化。468株蛹虫草突变株在不同的摇瓶发酵条件下进行发酵,收集菌丝体粉末样品并采集NIR光谱,同时采用常规方法分别测定样品的4种有效成分含量。偏最小二乘法(PLS)用于建立NIR光谱与有效成分含量间相关模型。采用蒙特卡罗偏最小二乘法(MCPLS)识别异常样本和选择合适的校正集样本数;采用移动窗口偏最小二乘法(MWPLS)筛选波长变量;以逼近度(Da)为考察指标,选择最有效的光谱预处理方法和最适的PLS隐变量数,最终得到测定蛹虫草菌丝体中腺苷、蛋白、多糖和虫草酸含量的最优PLS模型,其校正集样本参考值与预测值间相关系数(Rc)分别为0.92943,0.98479,0.90785和0.85131;预测集误差(RMSEP)为0.66714,0.02065,0.01131和0.01159,表明模型具有很好的拟合度和预测性能,应用该方法进行蛹虫草诱变筛选和发酵条件的优化是可行的。 相似文献
10.
研究了Elman神经网络(反馈神经网络,Recurrent Network)在近红外光谱定量分析中的应用。以饲料样品为实验材料,采用Elman网络建立了饲料中苯丙氨酸(Phe)、赖氨酸(Lys)、酪氨酸(Tyr)和胱氨酸(Cys)四种氨基酸含量的近红外光谱定量分析模型。用偏最小二乘法(partial least squares ,PLS)将原始数据压缩为主成分,取前3个主成分的12个吸收峰值输入Elman网络,网络中间层神经元个数为47。Elman网络模型对样品4个氨基酸含量的预测决定系数(r2)分别为0.960,0.981,0.979,0.952。表明所建Elman网络预测模型通过近红外光谱能够较准确预测饲料中苯丙氨酸、赖氨酸、酪氨酸和胱氨酸四种氨基酸的含量,为通过近红外光谱技术进行多组分定量分析提供了新思路。 相似文献
11.
基于近红外光谱的杂交水稻种子发芽率测试研究 总被引:1,自引:0,他引:1
现阶段水稻种子发芽率测试仍然按照传统的农作物种子发芽技术规定进行发芽试验,此方法存在试验周期长、成本高、专业性要求高等缺点,本研究提出一种基于近红外光谱技术的快速、无损测试杂交水稻种子发芽率的新方法。采用人工老化方法在温度45 ℃、湿度100%的条件下分别老化处理2个品种杂交水稻种子0,24,48,72,96,120,144 h;用近红外光谱仪分别采集2个品种不同老化时间段杂交水稻种子光谱数据共280份,随机分成校正集(168份)和检验集(112份);测试不同老化时间段的水稻种子发芽率;以偏最小二乘算法(PLS)建立了回归模型,分析不同光谱波段和比较不同光谱预处理方法对模型精度的影响。2个品种的水稻种子光谱数据采用全波段和标准化+正交信号校正预处理时模型最优,模型校正集决定系数(RC)与验证集相关系数(RP)分别为0.965和0.931,校正标准误差(SEC)与预测标准误差(SEP)分别为1.929和2.899,验证集预测值与真实值之间的相对误差在4.2%以内。研究结果表明利用近红外光谱分析技术进行杂交水稻种子发芽率的快速无损检测是可行的。 相似文献
12.
近红外反射光谱法(NIRS)测定棉仁粉中蛋白质和棉酚含量的研究 总被引:2,自引:0,他引:2
选用49份不同蛋白质和棉酚含量的陆地棉种质资源和188份陆地棉重组近交系为材料,以多年份、多地点种植收获的种子材料组成原始样品集,分别对棉仁粉中蛋白质含量和棉酚含量进行化学测定,采用改进的偏最小二乘法(Modified PLS)和(2,4,4,1)的数学转换方法建立近红外反射光谱(NIRS)定标模型,以寻找棉籽蛋白质含量和棉酚含量的快速测定方法。结果表明,蛋白质含量的定标决定系数(RSQ=0.933)和交叉检验决定系数(1-VR=0.929)较高,定标标准误差(SEC=0.623)和交互校验标准误差(SECV=0.638)较小,预测模型的建模效果较好,可替代化学分析。棉酚含量预测模型的RSQ,1-VR,SEC和SECV分别为0.836,0.811,0.074和0.079,模型预测效果略差于蛋白质模型,但仍可用于棉仁粉中棉酚含量的测定。 相似文献
13.
近红外光谱技术定量测定杨梅汁可溶性固形物 总被引:2,自引:1,他引:2
采用近红外光谱分析技术对浙江省不同产地的杨梅汁进行了光谱测定和定量分析,通过计算样品的杠杆值、学生残差和马氏距离来判别异常样品,采用偏最小二乘法(PLS)对杨梅汁的可溶性固形物进行建模分析,选取不同的分辨率和波段范围对光谱进行有效的信息提取和分析,确定了最佳的回归因子数和用于定量分析的最优波段范围。结果显示: 杨梅汁样品中有一个为异常样品,在建模时予以剔除;用于杨梅汁可溶性固形物检测的最佳分辨率和最优波段分别是4 cm-1和4 000~12 267.46 cm-1,最佳的回归因子数是8,该PLS模型的相关系数为0.957 85,校正均方根误差(RMSEC)、预测均方根误差(RMSEP)和交互验证标准偏差(RMSECV)分别是0.431,0.925和1.07°Brix。研究表明近红外光谱检测技术能用于杨梅汁可溶性固形物的定量分析。 相似文献
14.
紫花苜蓿粗蛋白和粗纤维近红外分析模型的建立 总被引:2,自引:0,他引:2
采用近红外漫反射光谱技术,结合偏最小二乘法(PLS),以152个来源不同的紫花苜蓿样品建立了粗蛋白和粗纤维含量的近红外定量分析校正模型。在近红外光谱范围内(950~1 650 nm)对紫花苜蓿样品采集光谱数据时,分别设置了粗磨样、细磨样两种样品的状态和1,2,5 nm三种光谱扫描间隔,对建立的模型进行准确性和重复性的验证,比较其优劣。结果显示:光谱扫描时样品为细磨样,光谱扫描间隔为2 nm时所建立的粗蛋白和粗纤维含量的校正模型最佳,其相关系数(R2cal)分别是0.97和0.94,最佳因素数时的定标标准差(SECV)分别是0.42和0.78。所建近红外定量分析模型对独立检验集样品粗蛋白和粗纤维含量的预测值与化学值的相关系数(R2val)分别为0.96和0.92,预测标准差(SEP)分别为0.43和0.79。该研究结果表明:利用近红外漫反射光谱法测定紫花苜蓿内在主要品质性状是可行的,为紫花苜蓿粗蛋白和粗纤维含量的检验提供了新的方法模式。 相似文献
15.
以玉米粉末样品为研究对象,探讨了光谱散射预处理和数学预处理因素对建模效果的影响.结果表明采用一阶导数+SNV+Mean Center建立粗蛋白含量的校正模型效果最佳. 相似文献
16.
17.
借助近红外透射光谱技术得到香精样品的原始光谱,选取波段范围为8 800~8 540和7 500~5 085 cm-1,用主成分分析(PCA)法定性识别其中是否添加DEHP或DINP,正确率100%。同时测定了DEHP和DINP(浓度范围在0~100 mg·kg-1之间)在食用香精中的含量,并以偏最小二乘法(PLS)建立定量分析模型,DEHP和DINP预测结果的相对误差分别在-17.6%~15.8%和-7.6%~9.9%之间,预测均方根误差分别为1.39和0.98。为检测食用香精中增塑剂的含量提供了一种可同时定性与定量的快速、简便、廉价、准确的分析方法。 相似文献
18.
近红外漫反射光谱法测定整粒小麦单株蛋白质含量 总被引:16,自引:2,他引:16
应用近红外漫反射光谱技术(波长为1 100~2 498 nm,分辨率为2 nm),以整粒小麦为材料建立适合于小麦单株分析的蛋白质含量分析系统。首先选取籽粒蛋白质含量具有梯度差异的小麦样品,然后对样品扫描得到原始光谱信息,通过散射校正及数学处理来消除原始光谱噪声,最后分别采用多元线性回归、主成分分析法和偏最小二乘法法建立回归方程。结果表明,优化各项参数后,光谱经过标准乘性散射校正和一阶导数处理后,回归分析采用修正的偏最小二乘法(MPLS)得到的定标模型效果最佳。最终得到的预测方程定标相关系数(RSQ)、交叉验证标准误差(SECV)、交叉验证相关系数(1-VR)分别为0.94,0.42,0.87。数学模型经过验证样品集检验,预测相关系数达到0.88。该模型达到了快速、无损分析单株小麦的要求,非常适合于品质育种的早代选择。 相似文献
19.
偏最小二乘分光光度法同时测定Fe3+和Al3+ 总被引:6,自引:1,他引:6
以铬天青S(CAS)为显色剂,溴化十六烷基三甲胺(CTMAB)作为增溶增敏剂及丙酮作为稳定剂,采用偏最小二乘(PLS)分光光度法对Fe3 和Al3 同时测定。综合考虑光源稳定性,双组分吸光度加和性及线性等因素,选取6 10~6 70nm范围内7个波长以供多波长数据采集。作为比较,在后续数据分析中分别采用了CPA矩阵法和偏最小二乘法(PLS) ,结果表明后者具有明显的优势。 相似文献
20.