首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 156 毫秒
1.
光谱数据变换和光谱特征波长提取是二种重要的光谱预处理方法,对消除环境等干扰具有重要的作用。以往文献主要对比研究不同的光谱数据变换方法,光谱特征波长提取方法的对比研究以及二者的组合研究较少。为了获取适宜的光谱预处理方法,提高潮间带沉积物氮的最小二乘支持向量机(LSSVM)模型精度,研究了4种光谱变换方法与3种特征波长提取方法组合对沉积物氮LSSVM模型精度的影响,以期实现潮间带沉积物氮的精确预测。研究结果表明,多元散射校正(MSC)或标准正态变换(SVN)光谱变换方法提高了光谱与氮含量的相关性,最高相关系数分别达到0.69和0.71;并且提高了LSSVM模型的预测精度,模型的预测R~2和RPD分别为0.88, 0.87和2.78, 2.69。无信息变量消除(UVE)特征波长提取方法也提高了LSSVM模型的预测精度,模型预测R~2和RPD分别0.89和2.70。但是, UVE提取的特征波长并不都与氮含量具有高相关性。此外,组合运用UVE特征波长提取方法和MSC或SVN光谱变换方法,也提高了模型预测精度,但并不优于单独运用UVE特征波长提取方法或单独运用MSC及SVN光谱变换方法。研究结果可为潮间带沉积物氮估算和光谱数据预处理提供技术参考。  相似文献   

2.
土壤组分光谱估算过程中校正样本集的构建会影响模型的预测精度。当前结合反射光谱和Kennard-Stone (KS)算法的校正样本集构建策略忽视了土壤反射光谱是土壤属性的综合反映,构建的样本集通常无法很好地代表目标土壤组分的变异。光谱变换方法可以突出目标组分的光谱特征,为此,本文以湖北省江汉平原滨湖地区水稻土为研究对象,结合包括一阶微分(FD)、Savitzky-Golay(SG)、Haar小波变换、标准正态变量变换(SNV)和多元散射校正(MSC)在内的光谱变换方法和KS算法进行校正样本集建构,通过对比不同样本集构建策略对使用偏最小二乘回归(PLSR)建立的土壤全氮含量光谱估算模型预测精度的影响,研究光谱变换是否有助于提高基于KS算法构建的校正样本集的代表性。结果表明:不同光谱变换会影响校正样本集的构建。反射光谱经过SG或Haar小波变换后,再使用KS算法构建校正样本集与直接基于反射光谱使用KS算法构建的校正样本集相同,建立的估算模型精度不变,相对分析误差(RPD)分别为1.41和1.27。结合FD,SNV或MSC变换和KS算法构建的校正集与基于反射光谱使用KS算法构建的校正集不同,建立的估算模型RPD分别从0.95,1.48和1.42提高到1.13、1.78和2.20。研究表明SNV和MSC等光谱变换方法可以提高基于KS算法构建的校正样本集的代表性,并可有效提高模型预测精度。  相似文献   

3.
土壤Cd含量实验室与野外DS光谱联合反演   总被引:3,自引:0,他引:3  
土壤重金属高光谱遥感建模理论上能够大大降低传统化学分析测定所需成本,正逐步发展为有效探查土壤污染空间分布与开展污染土壤综合防治的关键技术。然而土壤重金属高光谱遥感调查技术目前多局限于稳定可控条件下的实验室光谱模型,野外诸多因素(光照、湿度、土壤粗糙度等)影响下野外原位光谱模型的有效性已成为困扰该项技术大范围推广亟待突破的关键科学问题。以湖南衡阳市某矿区为例,分别利用ASD地物光谱仪和等离子发射光谱法测定46个土壤样品350~2 500 nm的实验室光谱和Cd含量,并在土壤取样时同步测量样品野外原位光谱。在运用DS(direct standardization)转换算法处理野外光谱的基础上,融合实验室光谱先验知识,基于主成分逐步回归建模方法开展了土壤Cd含量实验室与野外原位DS光谱联合反演实验,交叉验证了模型的稳定性。同时为深入探究实验室与野外原位DS光谱联合反演模型的有效性,将其与基于实验室光谱、野外原位光谱、野外原位DS光谱、实验室与野外原位光谱联合建立的主成分逐步回归模型开展了对比分析。结果表明:野外原位光谱反演模型精度(R2=0.56)明显低于实验室光谱反演模型(R2=0.64),野外原位DS光谱反演模型与之相比精度有所提升(R2=0.66);在野外原位光谱DS转换校正基础上,联合实验室光谱先验知识的土壤Cd含量反演模型精度最高,R2可达0.72。与此同时,实验室与野外原位DS光谱联合反演模型揭示482,565,979和2 206 nm波段对研究区土壤Cd含量有较好指示性,此结果与实验室光谱反演模型所识别的特征波段一致,两者物理意义相同。研究结果证实了实验室光谱先验知识以及DS转换算法能够提升野外原位光谱模型的可靠性,可为发展土壤Cd含量野外原位高光谱遥感探测提供重要的提供理论与方法支撑。  相似文献   

4.
田间原位可见-近红外光谱(VIS-NIR)能够有效的提高土壤属性的检测效率,但由于原位土壤中水分因素的影响,土壤属性的预测精度很难达到预期。如何有效去除土壤中的水分对土壤其他属性光谱预测的影响,是利用田间原位光谱高精度预测土壤属性所面临的难题,也是土壤光谱技术由室内转向田间的突破口。该问题的有效解决,可减除土壤样品的采集与室内预处理等过程,实现土壤属性的田间原位光谱测定。以新疆南部地区阿拉尔垦区十二团棉田为研究区,采用网格采样法共采集了116个0~20 cm深度的表层土壤样品,剔除1个异常值样品,得到115个有用样品,利用SR-3500型便携式地物光谱仪采集了231个样点的田间原位光谱数据,土样经风干、研磨和过筛等处理后测定其室内光谱和有机质含量。利用Kennard-Stone算法将115个土样分为69个转换子集及46个预测集,采用外部参数正交化法(EPO)、光谱直接转换法(DS)及光谱间接转换法(PDS)三种去除水分算法结合原位光谱反射率(R)、反射率一阶微分(R′)、反射率对数(LOG(R))以及反射率倒数(1/R)四种数学变换方式,运用随机森林(RF)模型进行不同组合模型的构建及精度评价。结果表明:(1)土壤有机质含量越高,土壤光谱反射率越低。土壤田间原位光谱反射率低于土壤室内光谱反射率;(2)室内光谱反射率与土壤有机质含量之间的相关性大于田间原位光谱,室内光谱经一阶微分变换后与土壤有机质含量之间的相关性显著提升。(3)土壤室内光谱反射率模型预测精度(R2=0.86, RPD=2.08, RMSE=1.55 g·kg-1, MAPE= 0.14)高于田间原位光谱反射率模型(R2=0.71, RPD=1.49, RMSE=2.17 g·kg-1, MAPE=0.20)。在去除水分算法模型中,以EPO一阶微分模型去除水分效果最好,决定系数R2由0.71提高到0.83,RPD由1.49提高到2.04,RMSE由2.17 g·kg-1降低至1.58 g·kg-1,MAPE由0.20降低至0.14。本研究实现了去除土壤水分因素的影响,提高了田间原位光谱预测土壤有机质的精度,为南疆棉田大尺度土壤有机质的预测及土壤肥力的评价提供了重要的参考。  相似文献   

5.
基于小波变换的水果糖度近红外光谱检测研究   总被引:12,自引:7,他引:12  
利用小波变换滤波技术对90个水果样品的近红外光谱信号进行了去噪处理,并结合滤波后重构光谱信号对水果糖度进行逐步线性回归(SMLR)建立其校正模型,通过34个样品的外部检验对校正模型精度进行评价。研究结果表明: 校正模型的预测精度在小波尺度为3时其预测精度最好,预测集的决定系数由原来的0.84提高到0.85, 预测集相对标准误差由原来的6.1% 降为6.0%。因此,使用小波去噪方法有消除原始光谱噪声作用,从而使最终的SMLR模型更具有代表性和稳健性,也提高了品质检测时模型预测精度。  相似文献   

6.
挥发性盐基氮(TVB-N)含量是评价猪肉新鲜度的重要理化指标。为了实现快速、无损检测猪肉的新鲜度,优选出与猪肉中TVB-N含量相关的特征波长,将包含特征波长的发光二极管(LED)光源用于多光谱检测系统,测定了猪肉中TVB-N的含量。首先利用可见-近红外(VIS-NIR)高光谱系统对猪肉进行检测,获取高光谱反射率数据,并采用一阶导数(FD)法、标准正态变量变换(SNV)以及其他预处理方法建立猪肉中TVB-N含量的偏最小二乘回归(PLSR)模型;然后分别利用逐步回归算法(SWA)、连续投影算法(SPA)、基因遗传算法(GA)筛选出与TVB-N含量相关的特征波长,利用筛选出的特征波长分别建立PLSR模型与多元线性回归(MLR)模型,比较模型结果后进一步优选特征波长;最后,将含有特征波长的LED光源用于多光谱检测系统,并建立PLSR模型与MLR模型,从而完成对猪肉中TVB-N含量的测定。实验结果表明:利用SWA、SPA、GA这3种算法筛选出的特征波长能够很好地反映全光谱的信息,建立的模型效果较好,变量数大大减少;包含优选特征波长的LED光源在多光谱检测系统中能很好地检测猪肉中的TVB-N含量;MLR模型结果好于PLSR模型结果,MLR模型的校正集相关系数和校正集均方根误差分别为0.9050和3.63×10-5,预测集相关系数和预测集均方根误差分别为0.9040和3.81×10-5。  相似文献   

7.
可见-近红外光谱已被证明是一种快速、有效的有机碳(TOC)含量预测方法。但是,当前利用光谱预测TOC含量的研究对象主要为土壤或湖泊沉积物,还未见潮间带海洋沉积物的研究报道。为了快速准确预测潮间带沉积物TOC含量,通过异常样本剔除、光谱特征变换、特征波长提取相结合,构建TOC预测模型,即,采集潮间带沉积物样品光谱,采用马氏距离、标准杠杆值和学生残差联合分析的方法剔除异常样本,利用多元散射校正(MSC)、平滑+微分进行光谱变换,利用遗传算法(GA)提取特征波长,采用偏最小二乘法(PLS)、最小二乘支持向量机(LSSVM)和BP神经网络(BPNN)对沉积物TOC含量进行建模和预测,通过决定系数(R~2)和剩余估计偏差(PRD)来评价模型精度。结果表明,剔除异常样本有助于提升模型精度, BPNN模型的检验R~2和PRD分别提升了28%和39%。MSC光谱变换效果优于平滑+微分,基于MSC光谱变换的PLS, LSSVM和BPNN模型检验R~2分别为0.81, 0.86和0.78, PRD分别为2.25, 2.59和2.07,比平滑+微分提升了9%~20%(R~2)和11%~22%(PRD),意味着MSC具有较强的TOC信息提取能力。GA不利于增加预测模型精度,基于GA特征波长的模型预测R~2降低了9%~36%, PRD降低了18%~33%,可能与GA提取的特征波长数量偏少有关。BPNN模型的预测精度最低,可能与其容易陷入局部极小点有关。PLS模型精度较高,可以很好的预测潮间带沉积物TOC含量。基于异常样本剔除和MSC光谱变换, PLS模型的建模R~2为0.98,检验R~2为0.81, RPD为2.25。LSSVM模型精度更优于PLS, LSSVM模型建模R~2为0.99,检验R~2和RPD分别为0.86和2.59,显示极好的TOC定量预测能力。总之,针对潮间带沉积物TOC含量预测,可以将剔除异常样本、 MSC光谱变换、 LSSVM建模结合起来,以获得可靠、稳定的预测模型。  相似文献   

8.
李硕  汪善勤  张美琴 《光学学报》2012,32(8):830001-301
建模方法是影响可见-近红外光谱定量结果的主要因素之一。在470~1000nm波段的12个土壤剖面对48个剖面样经过风干、研磨、过筛后进行光谱采集。经一阶微分变换及Savizky-Golay平滑处理后,分别应用主成分回归(PCR)、偏最小二乘回归(PLSR)和反向传播神经网络(BPNN)3种方法建立土壤全氮(TN)的定量模型。PCR与PLSR两线性模型的决定系数(R2)分别为0.74和0.8,其剩余预测偏差(RPD)分别为2.23和2.22,但两模型仅能用于TN的粗略估计。由PCR提供主成分数,PLSR提供潜变量(LV)数分别作为BPNN的输入所构建的两个非线性模型均明显优于线性模型PCR和PLSR。其中以4个LV作为输入的BPNN-LV模型预测性能最优,R2以及RPD分别达到0.9和3.11。实验结果表明,提取可见-近红外光谱的PLSR LV因子作为BPNN的输入,所建定量模型可用于土壤氮纵向时空分布的快速准确预测。  相似文献   

9.
氮、磷、钾元素是植物有机质的重要生化组分,准确估算其含量对监测管理植被的新陈代谢和健康状况具有重要意义。可见-近红外光谱结合多种建模方法已被用于植被生化参数的监测,其中支持向量机回归方法被证明能够较好拟合反射光谱和植被生化参数之间的非线性关系,而选取适当的核函数是其成功的关键。以宜兴地区水稻、玉米、芝麻、大豆、茶叶、草地、乔木和灌木等八种植被叶片样本为研究对象,分析比较基于径向基核函数、多项式核函数和S形核函数的支持向量回归模型估算叶片氮、磷、钾元素含量的能力。利用一阶微分变换、标准正态变量变换和反对数变换对叶片可见-近红外光谱进行预处理,运用bootstrapping法生成1 000组校正集和验证集,分别建立基于三种核函数的支持向量回归估算模型,以决定系数(R2)和相对分析误差(RPD)的均值作为评价指标。结果显示,结合一阶微分和反对数变换光谱,采用径向基核函数模型对氮、钾元素估算精度最高(氮:平均R2=0.64,平均RPD=1.67;钾:平均R2=0.56,平均RPD=1.48),结合一阶微分变换光谱,采用径向基核函数模型对磷元素估算精度最高(磷:平均R2=0.68,平均RPD=1.73)。研究表明,结合不同预处理的可见-近红外光谱,基于径向基核函数的支持向量回归模型具有较好的估算多种植被叶片生化组分含量的潜力。  相似文献   

10.
基于NLMS自适应滤波的近红外光谱去噪处理方法研究   总被引:2,自引:1,他引:1  
陈丛  卢启鹏  彭忠琦 《光学学报》2012,32(5):530001-299
为了去除直接采集的近红外(NIR)光谱中含有的噪声,将归一化最小均方(NLMS)自适应滤波方法引入到NIR光谱去噪领域中。以51份土壤样品的NIR光谱为研究对象,探讨NLMS自适应滤波方法在NIR光谱预处理中的应用,并将处理后的结果与土壤中有机质的含量相关联,建立模型。结果表明,通过NLMS自适应滤波去噪后的光谱,预测集的相关系数r由处理前的0.8284提高至0.9654,预测均方根误差(RMSEP)由处理前的0.3385降至0.1606。由此可见,NLMS自适应滤波对NIR光谱的去噪有显著效果,可以有效地提高光谱的分析精度和模型的稳健性,为NIR光谱的预处理提供了一种新方法。  相似文献   

11.
针对目前模型传递方法研究大多在不同仪器之间且均采用近红外光谱建立模型,采用高光谱技术建立猪肉pH值定量检测模型,并针对不同品种间的模型传递提出了一种光谱和预测值同步校正(sync correction of spectrum and prediction value, CSPV)的传递算法,并与模型更新方法进行比较。当模型满足预测相关系数(correlation coefficient of prediction, rp)rp≥0.837,且剩余预测偏差(residual prediction deviation, RPD)RPD≥1.9时,表明预测结果可靠。以杜长大、茂佳山黑猪和零号土猪3个品种猪肉样品为研究对象,以杜长大作为主品种,茂佳山黑猪和零号土猪作为从品种,采用偏最小二乘(partial least squares regression, PLS)法建立主品种猪肉pH值定量检测模型,模型校正相关系数(correlation coefficient of cross-validation rc)和预测相关系数rp分别达到0.922和0.904,交互验证均方根误差(root mean squared error of cross validation, RMSECV) 和预测均方根误差(root mean squared error of prediction, RMSEP)分别为0.045和0.046,RPD为2.380。用主模型分别对茂佳山黑猪和零号土猪pH值进行预测,rp仅达到0.770和0.731,RMSEP分别为0.111和0.209,RPD分别为1.533和1.234,预测精度较差。分别采用CSPV传递算法和模型更新方法对主模型进行传递和修正,比较并验证了两种方法的模型传递和修正结果。采用CSPV算法对模型传递后,当标样个数分别为9个和10个时,rp可提高到0.889和0.900,RPD提高到2.071和2.213,均满足rp≥0.837,且RPD≥1.9;而采用模型更新方法对模型修正后,当添加的代表性样品分别为11个和9个时,rp分别达到0.869和0.845,但RPD仅达到1.934和1.804,不满足RPD≥1.9的条件。结果表明,CSPV传递算法能实现主模型对茂佳山黑猪和零号土猪样品的预测,而模型更新方法只能实现对茂佳山黑猪品种的预测,不能实现对零号土猪样品的预测,且CSPV传递算法预测结果优于模型更新方法。  相似文献   

12.
研究了中红外光谱预测香菇蛋白质含量的可行性。去掉明显噪声部分后,研究香菇3 581~689 cm-1中红外光谱与蛋白质含量的关系。以Savitzky-Golay(SG)5点平滑预处理光谱建立偏最小二乘法(partial least squares, PLS)的预测模型的效果不理想,模型的建模集和预测集的相关系数均高于0.85,但剩余预测偏差(residual prediction deviation, RPD)值仅为1.77。采用连续投影算法(successive projections algorithm, SPA)算法从3000个波数点中选择7个特征波数,并以七个特征波数分别建立PLS、多元线性回归(multiple linear regression, MLR)、反向传播神经网络(back-propagation neural network, BPNN)和极限学习机模型(extreme learning machine, ELM)。与全谱的PLS相比,以特征波数的PLS模型和MLR模型的预测效果相对较差,而以特征波数的BPNN和ELM模型的预测效果相对较好。其中SPA-ELM模型的预测效果最佳,预测集相关系数(correlation coefficient of prediction)Rp=0.899 5,预测集均方根误差(root mean square error of prediction)RMSEP=1.431 3,剩余预测偏差RPD=2.18。研究结果表明,中红外光谱分析技术可以用于预测香菇蛋白质含量,且SPA选取特征波数能用来代替原始光谱进行建模分析,为香菇蛋白质含量的检测提供了新的思路。  相似文献   

13.
应用遗传算法结合连续投影算法近红外光谱检测土壤有机质研究。采集浙江省文城地区农田土壤样品近红外光谱数据,土壤样品数为394个。为简化模型,采用遗传算法结合连续投影算法挑选出18个特征波长建模,应用偏最小二乘回归建立有机质预测模型,建模集的决定系数为0.81,均方根预测误差为0.22, 剩余预测偏差为2.31,预测集的决定系数为0.83,均方根预测误差为0.20,剩余预测偏差为2.45。研究发现,遗传算法结合连续投影算法在简化模型同时,模型的预测评价指标同采用全谱波长建模并没有明显降低。因此,遗传算法结合连续投影算法挑选的特征波长可以应用于近红外光谱检测土壤有机质含量。  相似文献   

14.
近红外光谱技术结合RCA和SPA方法检测土壤总氮研究   总被引:1,自引:0,他引:1  
基于近红外光谱技术结合连续投影算法和回归系数分析对检测土壤总氮含量进行研究。采集农田土壤样本近红外光谱数据,土壤样本数量共394个。由于原始光谱数据量大,在500~2 500 nm光谱波长范围基础上,为简化模型,在原始光谱基础上采用连续投影算法和回归系数分析提取特征变量,以两种变量选择方法提取的特征变量作为输入,分别采用偏最小二乘回归(PLS)、 多元线性回归(MLR)和最小二乘支持向量机(LS-SVM)建模方法建立总氮预测模型,共建立了9个预测模型,最优预测集的决定系数为0.81,剩余预测偏差RPD为2.26。研究表明,基于连续投影算法和回归系数分析选择的特征波长可以应用于近红外光谱检测土壤总氮含量,同时可以大大简化模型,适合开发便携式土壤养分检测仪。  相似文献   

15.
基于可见-近红外光谱技术预测茶鲜叶全氮含量   总被引:6,自引:0,他引:6  
为快速无损监测茶树氮素营养及其生长状况,基于可见-近红外光谱技术建立了茶鲜叶全氮含量的预测模型。以茶鲜叶为对象,田间试验使用便携式光谱仪采集叶片漫反射光谱信息,通过不同预处理和统计分析,建立茶鲜叶全氮含量预测的光谱模型。试验共采集111个样品,其中86个样品作校正集,25个样品作预测集。通过一阶导数与滑动平均滤波相结合的预处理方法,用7个主成分建立的偏最小二乘模型最好,其校正集均方根误差(RMSEC)为0.097 3,预测集的相关系数为0.888 1,预测均方根误差(RMSEP)为0.130 4,预测的平均相对误差为4.339%。研究结果表明,利用可见-近红外光谱技术可以很好地预测茶鲜叶全氮含量,对于快速实时监测茶树长势和施肥管理具有重要指导意义。  相似文献   

16.
采用同步荧光技术结合化学计量学方法实现了鸡肉中甲磺酸达氟沙星(DFM)和氧氟沙星(OFL)残留的快速检测。首先,分析了DFM标准溶液、OFL标准溶液、空白鸡肉提取液和含DFM和OFL的鸡肉提取液的同步荧光光谱,确定了鸡肉中DFM和OFL残留的检测波长差(Δλ)分别为130和200 nm,荧光激发峰分别为288和325 nm。其次,采用单因素试验考察了氢氧化钠溶液浓度和表面活性剂种类对荧光强度的影响,确定了鸡肉中DFM和OFL残留的最佳检测条件为:氢氧化钠溶液浓度0.1 mol·L-1和SDS溶液浓度0.1 mol·L-1。最后,利用线性回归和偏最小二乘回归(PLSR)及多元线性回归(MLR)算法分别建立了鸡肉中DFM和OFL残留的预测模型。试验结果表明,与基于线性回归和MLR的DFM残留预测模型相比,基于PLSR的DFM残留预测模型的综合评价更好,其预测集决定系数(R2P)为0.978 3,预测集均方根误差(RMSEP)为1.934 2 mg·kg-1,相对预测误差(RPD)为5.876 5。与基于线性回归和PLSR的OFL残留预测模型相比,基于MLR的OFL残留预测模型的综合评价更好,其R2P为0.895 0,RMSEP为3.859 8 mg·kg-1,RPD为2.509 1。该方法操作简单、耗时短,可用于鸡肉中DFM和OFL残留的快速检测。  相似文献   

17.
可见近红外非成像光谱分析技术已被广泛用于土壤有机碳(SOC)含量估测,然而该技术的使用受土壤粗糙度的影响,对样本的前处理要求较高,导致模型的实用性受限。针对这一问题,以美国爱荷华州农田土壤为研究对象,使用成像及非成像光谱仪获取土壤样本研磨前后的可见近红外反射光谱,采用去包络线(CR)、吸光度变换(AB)、S-G平滑(SG)、标准正态变换(SNV)、多元散射校正(MSC)5种光谱预处理手段,利用偏最小二乘回归(PLSR)和支持向量回归(SVR)算法构建并对比土壤SOC光谱估算模型,探究利用成像光谱数据估测高粗糙度样本SOC含量的可行性。实验结果表明,使用成像光谱数据能够实现高粗糙度样本的SOC含量估算,而使用非成像光谱数据则无法估算高粗糙度样本的SOC含量;基于成像光谱数据建立的高粗糙度SOC最优PLSR估算模型R2能够达到0.739以及最优SVR估算模型R2为0.712,而基于非成像光谱数据建立的高粗糙度SOC最优PLSR和SVR估算模型R2仅仅分别为0.344和0.311。基于AB,SG,SNV和MSC这4种预处理手段之后的成像光谱数据建立的土壤样本研磨前的PLSR模型性能优于样本研磨之后建立的PLSR模型,而SVR模型性能正好相反。而对于非成像光谱数据来说,土壤样本研磨后建立PLSR和SVR模型精度总是强于样本研磨前建立的模型精度。对于这两种光谱数据和两个估算模型而言,不同的光谱预处理方法提高模型估算精度的能力不同。土壤样本研磨前后,基于成像光谱数据建立的PLSR和SVR模型性能均优于非成像光谱数据所构建的模型。成像光谱技术能够增强高粗糙度土壤样本可见近红外光谱与SOC的相关性,从而提高模型估算精度;能够克服土壤粗糙度的影响;为野外大尺度估测SOC含量提供了新的手段。  相似文献   

18.
近年来,深度学习在数据挖掘领域研究较多,深度学习中的集成学习算法也越来越多地应用到分类和定量回归中,但是,集成学习算法在红外光谱分析领域的应用研究较少。提出一种基于Blending模型融合的集成学习定量回归算法,利用GBDT算法、线性核支持向量机(LinearSVM)和径向基核支持向量机(RBF SVM)作为基学习器,将基学习器预测结果通过LinearSVM模型完成数据融合。以公开数据库中的药片和柴油近红外光谱数据为研究对象,首先对光谱数据进行一阶导数预处理,分别采用单核支持向量回归模型、GBDT模型和Blending集成学习模型,将模型预测结果进行分析比较。药片活性物含量和硬度性质采用RBF SVM模型的预测结果最优,RMSEP最小,RPD最大;其次为Blending集成学习模型;GBDT模型预测结果最差。药片质量采用Blending集成学习模型预测的R2最高,达到0.837 4;RBF SVM的RMSEP最小,为2.140 6,RPD最大,达到7.487 8;LinearSVM的预测结果最差。对于柴油沸点、闪点和总芳香烃三种性质,Blending模型预测效果最好,优于三种单模型预测结果。对于十六烷值,GBDT模型和RBF SVM模型预测结果优于Blending集成学习模型。对于密度,仅GBDT模型优于Blending集成模型,并且,使用单模型和集成模型的预测结果均较为理想,除了LinearSVM模型R2为0.944 5,其他模型R2均高于0.99。对于冰点的预测,RBF SVM和LinearSVM的预测效果优于Blending集成学习模型。对于黏性性质的预测,仅RBF SVM的预测效果优于Blending集成算法模型。由结果可以看出,由GBDT,LinearSVM和RBF SVM集成的Blending模型由于融合了单模型的特征,与单模型相比,预测效果较优或者最优,证明集成学习Blending模型用于红外光谱定量回归具有较强的适用性,且具有较高的预测精度和泛化能力,对于进一步研究集成学习算法在红外光谱定量回归中的应用具有重要的意义。  相似文献   

19.
可见光/近红外光谱模型是土壤属性预测的有效工具。波长优选在光谱建模过程中起着重要作用。文中首先利用从安徽省涡阳县采集的130个砂姜黑土土壤样本获得可见光/近红外光谱,然后利用平滑与多重散射校正联合的光谱预处理方式消除光谱中的无关变量和冗余信息以提高模型预测结果的相关性,再利用SPXY方法挑选建模集样本,分别利用连续投影算法和遗传算法进行波长优选,最后利用留一法进行交互验证建立有机质含量的主成分回归模型。研究结果显示:连续投影算法和遗传算法都可以有效地减少参与建模的波长数并提高模型的准确度,尤其是遗传算法能够更好地提高土壤有机质含量预测精度,其相关系数、预测均方根误差和相对分析误差分别达到0.9316,0.2142和2.3195。通过合适的特征波长选取,不仅计算量可以大大减少,预测精度也会有效提高。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号