首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 929 毫秒
1.
河套蜜瓜是我国西北河套地区独具特色的果品,一直深受消费者的喜爱。糖度(sugar content)是衡量蜜瓜品质和成熟度重要指标。采用Maya 2000pro便携式光谱仪和PR-101ɑ便携式数字折光仪获取"金红宝"蜜瓜光谱信息及糖度值,研究了不同特征波长提取方法:逐步多元线性回归(SMLR)、间隔偏最小二乘法(iPLS)、反向区间偏最小二乘法(biPLS)以及联合区间偏最小二乘法(siPLS))对蜜瓜样品模型精度和预测结果的影响。结果表明:采用biPLS特征波长提取方法将全波段光谱均匀分成20个子区间,PLS因子数为14,当剔除其中8个子区间,选择的波长变量数为218时,得到的biPLS模型最佳,对应的校正集和预测集的RMSE分别为0.996 1和1.18。采用biPLS光谱波长筛选方法可以有效地提取蜜瓜糖度的特征波长,提高建模预测能力,实现蜜瓜糖度的快速检测。  相似文献   

2.
用遗传算法快速提取近红外光谱特征区域和特征波长   总被引:9,自引:0,他引:9  
邹小波  赵杰文 《光学学报》2007,27(7):316-1321
提出了一种遗传区间偏最小二乘法(GA-iPLS),并用该方法快速提取苹果糖度近红外光谱的特征区域,在此基础上采用遗传偏最小二乘法(GA-PLS)提取苹果糖度近红外光谱的特征波长,进行苹果糖度预测。结果表明,整个光谱等分为40个子区间,遗传区间偏最小二乘法能快速寻找出5个特征子区间(第4,6,8,11,18号);在5个特征子区间的基础上用遗传偏最小二乘法继续优化,从中提取44个特征波长。建立在5个特征子区间和44个特征波长上的偏最小二乘法模型精度均优于全光谱偏最小二乘法模型,对预测集的预测相关系数提高了近10%;且模型得到了很大的简化,用于建模的主因子数减少了7个。这些结果表明,用这两种方法不但可以建立简洁、数据运算量少的模型,还可以快速地提取近红外光谱的特征区域和特征波长。  相似文献   

3.
将近红外光谱技术和化学计量学相结合分析慈竹纤维素结晶度。通过区间偏最小二乘法(iPLS)、联合区间偏最小二乘法(siPLS)和反向区间偏最小二乘法(biPLS)优化建模区域,建立经多元散射校正后光谱的结晶度分析模型,并与全光谱范围350~2 500nm建立的偏最小二乘(PLS)模型进行比较。结果表明,三种改进偏最小二乘法建立的结晶度模型预测效果均优于PLS模型,并且当采用联合区间偏最小二乘法将全光谱进行30个子区间划分,选择三个子区间[8 12 19]组合时,建立的siPLS模型预测效果最好,相关系数(r)达到0.88,预测标准差(RMSEP)为0.0117。因此,采用联合区间偏最小二乘法可以有效选择建模光谱区域,提高模型预测能力,实现慈竹纤维素结晶度的快速预测。  相似文献   

4.
用遗传区间偏最小二乘法建立苹果糖度近红外光谱模型   总被引:6,自引:2,他引:4  
为了简化苹果糖度预测模型和提高模型的精度,用遗传区间偏最小二乘法(GA-iPLS)建立苹果近红外光谱预测模型。应用结果表明,整个光谱划分为40个子区间, GA-iPLS选择其中的第4,6,8,11,18号共5个子区间联合建立苹果糖度模型。遗传区间偏最小二乘法所建的模型,其校正时的相关系数rc和交互验证均方根误差RMSECV分别为0.962和0.334 6,预测时的相关系数rp和预测均方根误差RMSEP分别为0.932和0.384 2。与全光谱模型相比,该方法建立的模型不论对校正集还是预测集,模型的预测能力都提高了许多,且模型得到了很大的简化:其实际采用的波数点个数比全光谱模型采用的波数点个数大大减少,主因子数也比全光谱少,由此建立的模型更加简洁、数据运算量也更少。  相似文献   

5.
利用反向区间偏最小二乘法(BiPLS)定位光谱糖度若干信息区间,运用遗传算法(GA)从中选择波长点,建立了多元线性回归(MLR)模型。光谱进行卷积平滑和二阶导数处理后,将光谱(225个数据点)分割成25个子区间时,BiPLS优化结果最优。在所定位的信息区间进行GA二次选择特征变量,运行100次依次选择入选频率较高的12个波长点。为简化MLR模型,对于入选的相邻波长选择频率较高者,最后选择 638,734,752,868,910,916和938 nm作为回归变量,建立的MLR预测模型相关系数(R2)、校正均方根误差(RMSEC)和预测均方根误差(RMSEP)分别为0.984,0.364和0.471,优于常用的逐步多元线性回归的建模结果。表明BiPLS结合GA可以有效地对李子糖度可见/近红外光谱MLR回归变量进行筛选,提高了模型的精度。  相似文献   

6.
基于SiPLS算法的近红外光谱检测梨可溶性固形物含量   总被引:3,自引:0,他引:3  
为了提高近红外光谱技术在梨的可溶性固形物含量(SSC)检测中的精度和稳定性,对采集的原始光谱进行标准归一化(SNV)预处理,采用联合区间偏最小二乘法(SiPLS)建立了SSC的预测模型;通过交互验证法确定了模型的主成分因子数,以预测时的相关系数(Rp)和预测均方根误差(RMSEP)作为评价指标对模型预测结果进行了分析,并与经典偏最小二乘(PLS)模型、间隔偏最小二乘(iPLS)模型进行了比较.结果表明,利用SiPLS所建的预测模型的最优组合包含21个光谱区间并联合4个子区间和15个主成分因子,其预测集的相关系数和预测均方根误差分别为0.9633和0.203;说明利用近红外光谱结合SiPLS算法可以准确、无损检测梨中可溶性固形物含量.  相似文献   

7.
利用傅里叶近红外光谱(FT-NIRS)测定了苹果的硬度。通过使用几种基于遗传算法和间隔偏最小二乘法的特征波长选取方法,包括动态向后间隔偏最小二乘(dynamic backward version of interval PLS,dynamic biPLS)、动态向后间隔偏最小二乘结合遗传算法(dynamic biPLS & GA-PLS)和反复的遗传算法(iterative GA-PLS),分析了苹果硬度的特征波长。结果表明,运用遗传算法和间隔偏最小二乘选择特征波长后,不但可以降低模型的复杂度,同时能够达到提高模型预测精度的效果。在此基础上,研究分析了苹果硬度特征波长的物理化学意义。由于果胶是在苹果成熟过程中一种和硬度有很大关联的物质,通过比较苹果硬度的特征波长和果胶的特征吸收峰,发现两者具有有很好的一致性。因此,采用遗传算法和间隔偏最小二乘法得到的苹果硬度的特征波长能够反映果胶的吸收信息,从而解释了近红外技术检测苹果硬度的机理。  相似文献   

8.
用特征谱区筛选法结合太赫兹时域光谱(THz-TDS)技术对多元混合物成分含量进行了定量分析研究。实验利用太赫兹时域光谱系统测量了由乳糖一水合物(LAC)、对乙酰氨基酚(APAP)、可溶性淀粉(starch)以及微晶纤维素(MCC)四种材料组成的混合物样品的太赫兹吸收光谱,并分别尝试采用常规区间偏最小二乘(iPLS)、向后区间偏最小二乘(biPLS)、联合区间偏最小二乘(siPLS)和移动窗口偏最小二乘(mwPLS)四种特征谱区筛选法对多元混合物的太赫兹吸收光谱进行特征子区间优选,建立了太赫兹吸收谱与四元混合物中乳糖一水合物含量之间的定量回归模型。通过比较四种谱区筛选算法模型及全光谱偏最小二乘(PLS)模型所得结果,表明采用移动窗口偏最小二乘法建立的谱区筛选模型得到的结果相对最优,其交互验证均方根误差(RMSECV)、预测均方根误差(RMSEP)、校正集相关系数(RC)和预测集相关系数(RP)分别为0.980 3,1.114 1,0.996 0和0.995 1。实验结果表明,采用特征谱区筛选方法可以有效选择多元混合物太赫兹吸收光谱的特征区间,提高模型精度和降低模型复杂性,为实现多元混合物成分含量的快速检测提供了一种有效的方法。  相似文献   

9.
为探寻一种快速可靠的分析方法用于橄榄油中掺杂煎炸老油含量的测定,实验采用可见和近红外透射光谱分析技术结合区间偏最小二乘法(interval partial least squares, iPLS)、联合区间偏最小二乘法(synergy interval partial least squares, SiPLS)和反向区间偏最小二乘法(backward interval partial least squares, BiPLS),对掺杂不同含量煎炸老油的橄榄油建模分析,并对不同模型比较优选。采集样品400~2500 nm范围内的光谱,对光谱数据进行Savitzky-Golay(SG)平滑去噪。剔除奇异样本后,采用sample set partitioning based on joint X-Y distance(SPXY)法划分样本集,以不同的iPLS优选建模区域,建立煎炸老油含量预测模型。结果表明:对掺杂不同含量煎炸大豆油的橄榄油,采用划分20个区间,选择2个子区间[4, 16]建立的SiPLS模型预测效果最好,相关系数(Rp)达0.998 9,预测均方根误差(RMSEP)为0.019 2。对掺杂不同含量煎炸花生油的橄榄油,采用划分20个区间,选择2个子区间[2, 16]组合建立的SiPLS和BiPLS模型具有相同的预测效果,预测均方根误差(RMSEP)为0.0120,均优于iPLS模型。此外,与SiPLS模型相比,BiPLS模型运算量少,速度快。由此可见,基于掺杂油样品的可见和近红外透射光谱,分别采用组合区间偏最小二乘法(SiPLS)和反向区间偏最小二乘法(BiPLS)优选建模光谱区域,可以对橄榄油中掺杂煎炸大豆油和煎炸花生油含量进行准确测定。而且,实验过程无需对掺杂油样品进行预处理,无环境污染,操作简单,快速无损。  相似文献   

10.
近红外光谱法快速检测猪肉中挥发性盐基氮的含量   总被引:15,自引:0,他引:15  
为了实现快速无损地检测猪肉新鲜度的目的,应用近红外光谱法测定猪肉新鲜度重要指标一挥发性盐基氮(TVB-N)的含量.猪肉原始光谱经标准偏差归一化方法(SNV)预处理后,用联合区间偏最小二乘法(siPLS)建立猪肉预处理后光谱和TVB-N含量的校正模型并与经典偏最小二乘法(PLS)模型、间隔偏最小二乘法(iPLS)模型作比较.试验结果表明,利用联合区间偏最小二乘法所建的预测模型最佳,其校正集相关系数(Rc)和交瓦验证均方根误差(fRv)分别为0.8332和3.75,预测集的相关系数(Rp)和预测均方根误差(fRP)分别为0.8238和4.17.研究结果表明利用近红外光谱和联合区间偏最小二乘法可以快速地测定猪肉中挥发性盐基氮的含量.  相似文献   

11.
《光谱学快报》2012,45(9):553-562
Abstract

The spectral wavelength selection method is important in near-infrared spectroscopy. Eliminating redundant information and extracting useful information can improve the prediction accuracy and modeling efficiency of the quantitative analysis model for spectral analysis to obtain a near-infrared calibration model with strong predictability and good robustness. This paper proposes a wavelength selection method for near-infrared spectroscopy by combining the partial least squares and false nearest neighbor methods. In this method, the correlation between the characteristic wavelength variables and the measured index is assessed by means of a similarity-based distance measure of the characteristic wavelength variable, and the characteristic wavelength is selected according to the order of the correlation. The method was used to select characteristic wavelengths from the near-infrared spectrum of waste liquid to establish a prediction model for the chemical oxygen demand. Compared with the full-spectrum partial least squares and interval partial least squares based models, the number of characteristic wavelength variables is reduced from 1557 to 176, and the prediction accuracy of the model is improved. This method both simplifies the model and achieves higher prediction accuracy. Therefore, this study provides a novel solution for wavelength selection for multivariate calibration in near-infrared spectroscopy.  相似文献   

12.
应用太赫兹时域光谱技术结合区间偏最小二乘法筛选玉米种子水分THz特征波段,并采用支持向量机构建基于特征谱区的抗非线性干扰的种子水分快速定量分析模型。实验以郑单958玉米种子为例,制备含水量范围9.58%~12.71%的种子粉末样本40组(每组取样3份),采用衰减全反射(ATR)附件扫描得到120份样本太赫兹时域光谱,根据SPXY(光谱-理化值共生距离算法)法划分得到训练集样本90份,测试集样本30份。种子水分对太赫兹波具有强烈吸收,首先采用基于偏最小二乘线性回归的移动区间(mwPLS)、独立区间(iPLS)、后向区间(biPLS)和联合区间(siPLS)方法筛选最优特征谱区组合;鉴于环境水分、种子其他成分及系统噪声对种子水分太赫兹光谱存在不可避免的非线性干扰,在上述光谱特征区间进一步采用基于RBF核函数的支持向量机和网格搜索法构建得到预测性能最优的种子水分快速定量分析非线性模型,训练集均方根误差为0.021 2,预测集均方根误差为0.069 7,相对分析误差为12.345 7,相较于传统偏最小二乘线性回归模型,模型性能得到提升。种子水分含量是影响种子贮藏安全和种子活力的重要因素,实验结果表明:太赫兹时域光谱结合化学计量学可以有效筛选种子水分特征吸收谱区,建立抗干扰、高精度的种子水分快速定量分析模型,有望成为未来种子质量快速测定领域一项极具应用潜力的补充技术。  相似文献   

13.
为了提高近红外光谱技术快速测定番茄苗氮含量的准确度和稳健性,比较分析竞争自适应重加权采样法(CARS)、蒙特卡罗无信息变量消除法(MCUVE)、向后间隔偏最小二乘法(BiPLS )和组合间隔偏最小二乘法(SiPLS)四种特征波长挑选方法,筛选与番茄苗氮含量相关的特征光谱。在十种不同氮素处理水平下(尿素溶液浓度0~120 mg·L-1),培育60株番茄苗样本(每个处理6株),使其分别处于不同程度的过量氮素、氮素适度、缺氮素和无氮素状态。分别采集每株番茄苗样本的叶片,扫描其12 500~3 600 cm-1波段的近红外光谱。比较四种方法所建立的番茄苗氮素定量分析模型可知:CARS和MCUVE挑选的特征变量所建定标模型的性能比BiPLS和SiPLS挑选的特征变量所建定标模型的性能更优,但是预测性能远低于后者。其中,基于BiPLS建立的番茄苗氮素含量预测模型性能最佳,相关系数(r)、预测均方根误差(RMSEP)和性能对标准差之比(RDP)分别为0.952 7,0.118 3和3.291 0。因此,近红外光谱技术结合特征谱区筛选可以有效地提高番茄苗叶片氮素含量的定量分析模型指标,使模型更实用化。但是,特征波长挑选方法不具有普适性。基于单个波长变量筛选的方法所建立的模型较为敏感,更适用于样本状态较为均匀的待测对象;而基于波长区间筛选的方法所建的模型相对抗干扰性更强,更适用于样品状态不均匀,重现性较差的待测对象。因此,特征光谱筛选只有与样本状态及建模指标结合,才能使其在建模过程中发挥更好的作用。  相似文献   

14.
采用近红外(NIR)漫反射光谱法对新疆特色梨果库尔勒香梨的五种不同果(包括青头、粗皮、脱萼、宿萼、突顶果)的硬度进行测定。由于近红外光谱数据量大且原始光谱噪声明显、测定水果时散射严重等导致光谱建模时关键波长变量提取困难。以新疆库尔勒香梨为研究对象,为了有效地消除固体表面散射以及光程变化对NIR漫反射光谱的影响,首先采用标准正态变量变换(SNV)和多元散射校正(MSC)对库尔勒香梨的原始光谱进行预处理。为寻找适合近红外光谱检测库尔勒香梨硬度的最佳特征波长筛选方法,进行香梨近红外光谱的特征波长变量选择方法的比较与研究。研究比较了两种特征波长筛选方法对库尔勒香梨硬度偏最小二乘法(PLS)建模精度的影响。同时使用反向偏最小二乘(BiPLS)和遗传算法结合反向偏最小二乘(BiPLS-GA)在全光谱范围内筛选香梨硬度的特征波长变量,将校正均方根误差(RESMC)、预测均方根误差(RESMP)以及决定系数(R2)作为模型的评价标准,并最终确定最优波段选择方法及最佳预测模型。基于选择的特征波长变量建立的PLS模型(BiPLS-GA)与全光谱变量建立的PLS模型进行比较发现BiPLS-GA模型仅仅使用原始变量中6.6%的信息就获得了比全变量PLS模型更好的库尔勒香梨硬度的预测结果,其中R2,RMSEC和RMSEP分别为0.91,1.03和1.01。进一步与基于反向偏最小二乘算法(BiPLS)获得的特征变量建立的PLS模型比较发现,BiPLS-GA不仅可以去除原始光谱数据中的无信息变量,同时也能够对共线性的变量进行压缩去除,使得建模变量从301个减少到20个。极大地简化模型的同时有效地提高了模型的预测精准度和稳定性。因此该方法能够有效地用于近红外光谱数据变量的选择。证明了近红外光谱分析技术结合BiPLS-GA模型能够高效地选择出建模变量,去除与库尔勒香梨硬度无关的近红外光谱信息,显著地提高库尔勒香梨硬度定量模型的预测精度。这不仅为新疆地区特色梨果库尔勒香梨的快速、精确、无损优选分级提供一定的技术支持,同时也为基于近红外光谱分析技术预测水果内部品质的研究提供了参考。  相似文献   

15.
水体中过高浓度的有机物含量危害巨大,不仅会造成严重的环境污染,而且危害人类身体健康,传统化学法检测水体化学需氧量(COD)的步骤繁琐且时效性差,不利于水体中COD的快速定量检测。针对这些问题,提出了一种将紫外光谱与组合权值模型相结合的快速定量检测COD方法,该组合权值模型是基于反向区间偏最小二乘法(BiPLS)结合组合区间偏最小二乘法(SiPLS)算法对紫外光谱的特征子区间筛选组合,然后依据特征子区间的权值建立的预测模型。首先按照一定的浓度梯度配制45份COD标准液样本,通过实验获取标准液的紫外光谱数据;对获取到的COD紫外光谱数据做一阶导数和S-G滤波(Savitzky-Golay)的预处理,消除基线漂移和环境干扰噪声;应用SPXY(Sample set partitioning based on jiont X-Y)算法将实验样本数据组划分成校正集和预测集。然后基于BiPLS算法对全光谱区间进行波长筛选,在BiPLS筛选过程中,目标区间的划分数量会对建模产生较大影响,于是对子区间划分数量进行优化,把子区间分成15~25个,在不同区间数下都进行偏最小二乘(PLS)建模,通过交互验证均方根误差(RMSECV)来筛选最优子区间数,得到区间数为18时,模型效果最佳。从18个波长区间筛选出了6个特征波长子区间,入选的子区间为2,1,3,11,7和6,对应波长为234~240,262~268,269~275,290~296,297~303和304~310 nm,这6个特征波长区间涵盖了大量的光谱信息,对最终预测模型的贡献度大;接下来通过SiPLS算法对这6个初选区间进行进一步的筛选组合,采用不同的组合数构建不同特征区间上的PLS模型,在相同组合数下,筛选出一个区间组合数最优的结果,对比不同组合数下预测模型的误差与相关性,将6个区间筛选组合为3个特征波长区间,分别为234~240,262~275和290~310 nm,这三个特征区间最佳因子数分别为4,4和3。对传统SiPLS的特征区间组合方法进行改进,基于权值的大小来对这3个特征区间进行线性组合,代替过去特征区间直接组合的方法。通过权值公式计算出这3个特征区间的权重大小分别为0.509,0.318和0.173,最终建立线性组合权值COD浓度预测模型。为了验证组合权重预测模型的精度,另外建立了全波长范围内的PLS预测模型、单个特征波长区间的PLS预测模型、直接组合特征波长区间的PLS模型,并使用评价参数相关系数的平方(R2)、预测值与真实浓度值的均方根误差(RMSEP)和预测回收率(T)来对模型评价。验证结果表明,相比其他预测模型,组合权值模型相关系数的平方达到了0.999 7,明显优于直接组合特征区间建模的0.968 0,预测均方根误差为0.532,比直接组合特征区间的预测模型误差降低了29.3%,预测回收率为96.4%~103.1%,显著地提高了预测精度。该方法简单可行,不会产生二次污染,可为在线监测水体中COD浓度提供一定的技术支持。  相似文献   

16.
苹果可溶性固形物便携式检测实验研究   总被引:1,自引:0,他引:1  
为实现苹果可溶性固形物的便携式快速检测,搭建了以STS光谱仪和自制样品杯作为光谱检测装置的苹果可溶性固形物便携式检测平台。采用自行设计的检测平台采集了苹果的近红外漫反射光谱,对比分析了不同的光照角度、光源与探头距离对光谱响应特性的影响,建立了苹果可溶性固形物偏最小二乘模型(PLS)和最小二乘支持向量机模型(LS-SVM),采用连续投影算法及主成分分分析法对最小二乘支持向量机模型进行了优化,并对比分析了两种检测模型的优劣。其中当光源距探头距离为15 mm光源角度为45°时,结合偏最小二乘法建立苹果的可溶性固形物定量检测模型精度最高。模型的预测集相关系数为0.924,预测均方根误差为0.334%。实验结果表明,采用四周照射、底部接收并结合避光圈的这种结构布置能够有效的克服杂散光现象并且提高了光谱中的有效信息。研究可为快速、便携的苹果可溶性固形物检测仪器的设计提供参考依据和理论支撑。  相似文献   

17.
LSSVM模型下的近红外光谱联合区间波长筛选方法   总被引:2,自引:0,他引:2  
针对传统近红外光谱波长选择方法忽略模型中非线性因素的缺陷,采用具有非线性处理能力的最小二乘支持向量机,结合间隔策略的波长选择方法和联合区间的思想,提出了一种非线性模型下的波长筛选算法—联合区间最小二乘支持向量机(synergy interval least squares support vector machines, siLSSVM)。以苹果糖度近红外光谱数据为例,与传统siPLS波长筛选方法相比,新算法的预测集均方根误差(RMSEP)在PLS模型和LSSVM模型预测时分别提高了37.43%和47.88%,预测集相关系数(RP)在PLS模型和LSSVM模型预测时分别增加了6.04%和7.31%。实例表明,对于存在非线性因素较强的光谱数据,siLSSVM算法能够有效的挑选最优波长区间与提高模型的预测精度和鲁棒性,为近红外光谱在非线性因素下筛选波长提供了新前景。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号