首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 109 毫秒
1.
偏稳健M回归在人体血糖浓度近红外无创检测中的应用   总被引:1,自引:0,他引:1  
采用偏稳健M回归方法有效地解决了人体血糖浓度近红外无创检测研究过程中由于样本奇异值影响模型稳健性的问题。该方法源于现有的迭代变权偏最小二乘法,计算快、易于实现,具有M估计的所有性质,且当权函数选择合适时,能降低奇异值的影响,建立具有稳健性的校正模型。采用该方法对近红外光谱实验数据进行了处理,并与传统的偏最小二乘(partialleast squares,PLS)建模方法进行了比较。结果表明,与PLS相比,该方法可建立稳健的校正模型提高预测精度,更适合复杂样品建模,对于人体血糖浓度近红外无创检测的进一步研究具有应用价值。  相似文献   

2.
本文以血清的近红外光谱为研究对象,首先运用载荷向量分析确定最佳定标谱区为4192-4943 cm-1与5294-7200 cm-1两个波段,然后分别用平滑、一阶导数、正交信号校正(OSC)预处理方法,结合偏最小二乘回归方法建立了血清中血糖的模型.用平滑、一阶导数所建立模型的预测标准偏差(RMSEP)分别是0.545、0.568,用OSC校正后所建立模型的RMSEP是0.390,结果表明使用OSC校正对光谱进行合理的校正,能够滤除光谱矩阵与浓度矩阵无关的信号,降低模型的因子数,从而降低模型的复杂性,提高模型的稳健性.  相似文献   

3.
提出了一种基于净信号分析的局部建模算法,以克服光谱定量分析中样本间差异性过大和样本待测性质与光谱之间存在非线性等问题。首先利用净信号分析方法得到校正样本和待测样本的净信号,然后用待测样本净信号和校正样本净信号之间的欧式距离作为样本相似性判据,选取一定数量的与待测样本最相似的校正样本组成局部校正子集,建立局部PLS回归模型。针对一组猪肉近红外光谱数据集的实验结果表明,该方法的预测精度显著优于全局建模方法和基于光谱欧式距离的局部建模方法。  相似文献   

4.
血糖浓度的准确检测对于糖尿病的治疗具有重要的意义.本文采用连续幂系数回归方法有效地提高了近红外无创检测人体血糖浓度的预测精度.该方法是传统偏最小二乘法(PLS)的扩展,实现简易,且当幂系数选取恰当时,能够明显地提高预测精度.应用该方法分别建立了四成分葡萄糖实验和人体口服葡萄糖实验的定量分析模型,并利用该模型对预测集样本进行预测.实验结果表明,与PLS相比,该方法建立的定量分析模型不仅可以提高预测精度,而且可以针对不同的测量对象没定不同的幂系数以达到最佳的建模效果.根据不同个体灵活地选取幂系数,对于人体血糖浓度近红外无创检测研究具有很大的应用价值.  相似文献   

5.
快速稳健偏最小二乘回归及其在近红外光谱分析中的应用   总被引:4,自引:0,他引:4  
现代近红外光谱,作为一种间接分析技术,将建立校正模型,实现对未知样本的定量分析。针对近红外光谱分析灵敏度低、抗干扰性差的弱点,构建一种快速稳健的偏最小二乘回归(RRPLSR)算法。它运用峭度法快速识别离群点,排除它们后,再实施偏最小二乘回归,消除复共线性,建立稳健可靠的定量校正模型。将RRPLSR方法实际应用于鱼类物质的近红外光谱数据分析,实现脂肪含量的定量检测,效果良好。与已有的其他方法相比,它能准确识别离群点,所建模型预测性能良好,且计算省时,效率高,适用于快速检测。  相似文献   

6.
基于近红外光谱和稀疏偏最小二乘回归的生物质工业分析   总被引:1,自引:0,他引:1  
林木生物质能源作为一种新型可再生能源,具有非常广阔的发展前景。基于近红外光谱技术,首次引入稀疏偏最小二乘回归建立木屑生物质的工业分析模型,用于生物质燃料特性的快速分析测定。工业分析总共测定了80种木屑的水分、灰分、挥发分和固定碳含量百分比;按照样品种类和产地将其划分为训练集和测试集,利用近红外光谱仪采集光谱数据并进行小波滤波处理;再利用稀疏偏最小二乘回归建立木屑生物质的定量分析模型,并与主成分回归、偏最小二乘回归、最小绝对收敛及变量筛选方法的建模效果进行比较。结果证明,相对于以上三种建模方法,稀疏偏最小二乘回归能够挑选出有重要影响的波长群组,降低非目标波段的噪声干扰,从而增强数学模型的解释能力并提高定量分析的准确度。利用稀疏偏最小二乘回归算法挑选的波长区间基本覆盖了工业分析中水分的吸收峰,而对于灰分、挥发分和固定碳的吸收峰波段尚无准确定位,需要继续探讨。总体而言,稀疏偏最小二乘回归能够减少无关信息的干扰,提高模型定量分析的准确度,增强模型的解释能力,将会在近红外光谱技术应用领域内起到重要作用。  相似文献   

7.
正丁醇具有互溶性好、挥发性低、价格低廉以及腐蚀性低等优势,被认为是理想的柴油添加物。柴油中正丁醇的精准定量分析对其品质快速评价与市场监督具有重要科学意义与实用价值。提出了一种基于拉曼(Raman)光谱结合偏最小二乘(PLS)的柴油中正丁醇快速定量分析方法。首先,采集了40个柴油样品的Raman光谱,并考察了不同预处理方法[一阶导数、二阶导数、多元散射校正、标准正态变换、归一化(Normalization)和小波变换]对PLS校正模型预测性能的影响;其次,采用变量重要性投影(VIP)对Normalization方法预处理后的光谱数据进行特征变量提取,并采用五折交叉验证优化VIP的阈值;最后,基于最优的光谱预处理方法、输入变量和模型参数,构建PLS校正模型对柴油中正丁醇含量进行快速定量分析,结果与基于原始光谱(RAW)和Normalization光谱的PLS校正模型的预测性能进行对比。结果表明:Normalization-VIP-PLS校正模型展现出优异的预测能力(RCV2和RMSECV为0.998 4和0.236 2%:R2  相似文献   

8.
提出了一种基于偏最小二乘增量式神经网络的近红外光谱定量分析模型。该模型采用典型三层反向传播神经网络(BPNN),不同波长吸光度和成分浓度是模型的输入和输出。在使用历史样本训练之前先进行偏最小二乘(PLS)回归,所得自变量和因变量的历史负荷矩阵分别用于确定模型输入层和输出层的初始权值,且自变量的主成分个数作为隐层的节点数。当获得新的样本时,对新数据与历史负荷矩阵组合后进行PLS回归,将所得新的负荷矩阵与历史负荷矩阵融合后作为模型输入层和输出层新的初始权值,接着使用新样本对模型进行训练来实现增量式更新。将所提模型与PLS、BPNN、基于PLS的BPNN、递归PLS在天然气燃烧烟气近红外光谱数据上测定后比较。对于烟气中二氧化碳浓度的预测,所提模型的预测均方根误差(RMSEP)分别降低了27.27%,58.12%,19.24%和14.26%;对于烟气中一氧化碳浓度的预测,所提模型的RMSEP分别降低了20.65%,24.69%,18.54%和19.42%;对于烟气中甲烷浓度的预测,此模型的RMSEP分别降低了27.56%,37.76%,8.63%和3.20%。实验结果表明,所提模型不仅通过PLS对BPNN结构和初始权重的优化,使模型具有较强的预测能力,而且能在已建模型信息的基础上,不访问旧数据而用新增样本即可完成自身的增量式更新,从而使模型具有较好的稳健性和泛化性。  相似文献   

9.
报道了在局部加权(LWR)回归方法基础上,自主改进的更简单、实用的局部偏最小二乘回归(LPLS)的原理和方法。并以云南优质烤烟为实验材料,在国产光栅漫反射型近红外仪器上,研究了主成分数以及局部建模样品数对检测结果的影响。结果表明:应用交叉验证方法推荐的尼古丁组分模型主成分数并不是最优,通过适当降低主成分数可提高检测效果;局部建模样品数为30~50个时总糖、总氮、尼古丁预测准确度的提高幅度可分别达7%,14%,10%以上。该方法能有效提高近红外数学模型的预测准确度,是建立具有高度适应性近红外数学模型的有效方法。  相似文献   

10.
拉曼光谱结合偏最小二乘法测定血清胆固醇含量   总被引:2,自引:0,他引:2  
以日常体检用血清样品为分析对象,采集了其拉曼光谱,波数范围为250~2 400cm-1,并对信号进行归属,与临床传统生化法测定得到的胆固醇含量对比,结合偏最小二乘法建立了血清胆固醇拉曼光谱定量模型(n=73)。结果表明,拉曼光谱能够表征血清中主要化学基团的信息。所建立的血清胆固醇定量校正模型的相关系数R为0.909 6,交叉验证校正标准差(RMSECV)为0.24;检验集(n=17)预测标准差(RMSEP)为0.69,相关系数r为0.926 2。证明了应用拉曼光谱技术结合偏最小二乘法建立血清胆固醇定量模型,用于未知血清样品胆固醇含量无损快速检测是可行的。  相似文献   

11.
近红外光谱法快速测定新疆薰衣草精油主要组分   总被引:1,自引:0,他引:1  
为建立快速测定新疆薰衣草精油中芳樟醇(linalool)、乙酸芳樟酯(linalyl acetate)含量的定量分析模型,采用近红外吸收光谱法(NIR)测定了165个精油样品,通过对近红外光谱吸收峰分析,在7 100~4 500 cm-1波数范围内化学信息量比较丰富且噪音低,可选择此波数段为分析区间。剔除8个异常样本后,通过聚类方法划分为105个校正集样本和52个验证集样本,结合气相色谱质谱(GC-MS)法测定的薰衣草精油linalool和linalyl acetate的含量,建立原始数据矩阵。对比不同的预处理方法对原始近红外光谱的过滤作用,其中正交信号变换(OSC)方法效果明显,对两种化合物的预测均方根误差(RMSEP) 分别为0.226和0.558,再用向前间隔偏最小二乘法(FiPLS)剔除与待测成分无关或呈非线性关系的波长点,最终得到8个间隔区间共160个波长点的数据子集。使用OSC-FiPLS优化处理的数据子集结合偏最小二乘法(PLS)建立新疆薰衣草精油中linalool和linalyl acetate的快速定量分析模型,在模型中二成分的隐变量数都为8。交互验证均方根误差(RMSECV)分别为0.170和0.416;预测均方根误差(RMSEP)分别为0.188和0.364。结果表明,经OSC和FiPLS预处理建立的PLS-NIR定量分析模型稳健性好,测定精度高,能快速测定薰衣草精油中linalool和linalyl acetate含量,并且具有良好的预测能力。可为新疆薰衣草精油主要成分的快速定量分析提供一种新的有效方法。  相似文献   

12.
土壤速效磷与速效钾在近红外区没有直接与它们相关的吸收峰,只能借助与其他拥有直接吸收峰物质(有机质,碳酸盐,粘土矿物,水分等)之间的相关关系而被近红外光谱技术所预测。这种相关关系会随着土壤样品构成的不同而不断变化,因此采用固定结构的近红外光谱模型很难对速效磷与速效钾取得较好的预测效果。提出采用递归偏最小二乘法(RPLS)在预测过程中递归更新土壤速效磷与速效钾的回归系数,以提高模型的预测能力;比较了偏最小二乘法(PLS),局部加权PLS(LW-PLS),滑动窗口LW-PLS(LW-PLS2)和RPLS对于土壤速效磷与速效钾含量的预测结果。194份土壤样品根据土壤类型分为建模集与预测集:建模集包含120份人为土样品;预测集则包含29份铁铝土样品,23份人为土样品和22份初育土样品。结果表明:RPLS模型取得了最优的预测结果,获得的决定系数(R2)分别为0.61与0.76,预测相对分析误差 (RPD)分别为1.60与2.05。说明RPLS通过不断更新模型的回归系数,能够适应新加入建模集样品的信息。相比于其他方法,预测精度更高,适用范围更广。  相似文献   

13.
李硕  汪善勤  张美琴 《光学学报》2012,32(8):830001-301
建模方法是影响可见-近红外光谱定量结果的主要因素之一。在470~1000nm波段的12个土壤剖面对48个剖面样经过风干、研磨、过筛后进行光谱采集。经一阶微分变换及Savizky-Golay平滑处理后,分别应用主成分回归(PCR)、偏最小二乘回归(PLSR)和反向传播神经网络(BPNN)3种方法建立土壤全氮(TN)的定量模型。PCR与PLSR两线性模型的决定系数(R2)分别为0.74和0.8,其剩余预测偏差(RPD)分别为2.23和2.22,但两模型仅能用于TN的粗略估计。由PCR提供主成分数,PLSR提供潜变量(LV)数分别作为BPNN的输入所构建的两个非线性模型均明显优于线性模型PCR和PLSR。其中以4个LV作为输入的BPNN-LV模型预测性能最优,R2以及RPD分别达到0.9和3.11。实验结果表明,提取可见-近红外光谱的PLSR LV因子作为BPNN的输入,所建定量模型可用于土壤氮纵向时空分布的快速准确预测。  相似文献   

14.
果酒发酵中的多酚是引起果酒口感、颜色变化的重要因素。为保证果酒品质,有必要开发一种快速监测发酵过程中多酚含量变化的技术。收集不同批次成熟期的蓝莓、桑葚为原料,分别碾压成汁,同时按比例混合二者,于小型发酵罐进行发酵。通过离线收集不同发酵时段的发酵液于离心管,高速离心后取上清液置于棕色瓶保存,共计得到48个果酒发酵样本。将上清液置于三个平行样比色皿,以傅里叶快速变换近红外光谱仪(FT-NIR)采集其透射光谱,取平均值作为该样本的光谱信号。然后将棕色瓶内的发酵液以国标法(即以标准液的吸光度值制定标准曲线)测定各样品的总酚含量,以duplex法计算样本光谱之间的距离且按2∶1的比例划分为训练集和预测集。采用间隔偏最小二乘法(iPLS)将训练集样本的透射光谱与总酚含量之间构建定量模型,间隔数从2依次变化到60个。该研究创新之处是使用共识方法融合多个已构建好的iPLS成员模型,按一定的共识规则分配权系数。通过各成员模型交互验证的残差及其残差之间的相关性来优化各成员模型的线性组合,以拉格朗日乘数法求解各成员模型的权系数,使间隔偏最小二乘-共识模型(consensual iPLS,CiPLS)的交互验证均方根误差最小。相比于全局PLS模型、划分不同间隔数量时的iPLS模型,CiPLS均具有较小的预测误差。当划分39个间隔时由三个iPLS成员模型(即14th,16th,18th)组成的共识模型误差最小为124.2,交互验证相关系数为0.944,对预测集样本的预测均方根误差为163.4,预测相关系数为0.931,预测性能均优于PLS和iPLS模型。另外,作为对比选用连续投影算法与无信息变量剔除法来优化光谱模型,其预测性能均不及本文提出的共识模型。分析各iPLS模型预测残差之间的相关性,发现共识模型主要是融合那些具有较高预测性能且模型间较低相关性的成员模型。结果表明,光谱分析结合共识方法可提高回归模型的预测精度、减少建模所需变量数,能够用于果酒总酚含量的离线快速检测。  相似文献   

15.
膜片钳测量过程中实时监测离体细胞生存环境温度,控制生理溶液温度值对提高测量的准确性,消除温度不确定性具有重要的意义。采用近红外光谱结合化学计量学法来研究生理溶液中不同离子不同浓度对温度模型精度的影响。通过配制CaCl2,KCl和NaCl各四种浓度的12份溶液样本,分别采集不同溶液样本在20~40 ℃温度范围内的光谱,波数范围为9 615~5 714 cm-1,并将每种溶液不同温度光谱数据按照三种方式划分训练集和预测集,采用间隔偏最小二乘方法选择有效波段,并建立与温度数值之间的定量校正模型。实验结果显示,浓度为0.25 g·mL-1的CaCl2溶液模型的RMSEP最大,三次实验结果为0.386 3,0.303 7和0.337 2 ℃,浓度为0.005 g·mL-1的NaCl溶液模型的RMSEP最小,实验结果分别为0.220 8,0.155 3和0.145 2 ℃。总体实验结果表明细胞生理溶液中Ca2+对建立温度模型的精度影响最大,K+其次,Na+最小,当三种离子浓度均增大时,各离子对模型精度影响均为增大。因此在建立细胞生理溶液的温度模型时,有必要在合理范围内改变细胞生理溶液中三种主要离子的配比,来校正不同离子浓度对测量生理溶液温度的影响,从而提高近红外光谱温度测量的精度。  相似文献   

16.
氮素是影响生菜产量和品质的重要因素,光谱技术是检测作物氮素含量最有效的手段之一。通过获取不同氮素水平下生菜冠层的反射光谱,对其进行FDSGF(first-order derivative based savitzky-golay filt)滤波后,利用后向区间偏最小二乘算法(BiPLS)、遗传算法(GA)及连续投影算法(SPA)对特征波长进行梯度提取,最终从2 151个波长点中提取了8个与生菜氮素最为相关的特征波长。分别利用多元线性回归(MLR)、径向基函数神经网络(RBFNN)及极限学习机(ELM)三种算法建立了基于特征波段或特征波长的8个生菜冠层氮素含量检测模型。结果表明: BiPLS-GA-SPA-ELM模型(RMSEC=0.241 6%,Rc=0.934 6,RMSEP=0.284 2%,Rp=0.921 8)的预测结果优于其他模型,为指导合理施肥和开发便携式仪器提供了理论基础。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号