首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 243 毫秒
1.
为探寻一种快速可靠的分析方法用于橄榄油中掺杂煎炸老油含量的测定,实验采用可见和近红外透射光谱分析技术结合区间偏最小二乘法(interval partial least squares, iPLS)、联合区间偏最小二乘法(synergy interval partial least squares, SiPLS)和反向区间偏最小二乘法(backward interval partial least squares, BiPLS),对掺杂不同含量煎炸老油的橄榄油建模分析,并对不同模型比较优选。采集样品400~2500 nm范围内的光谱,对光谱数据进行Savitzky-Golay(SG)平滑去噪。剔除奇异样本后,采用sample set partitioning based on joint X-Y distance(SPXY)法划分样本集,以不同的iPLS优选建模区域,建立煎炸老油含量预测模型。结果表明:对掺杂不同含量煎炸大豆油的橄榄油,采用划分20个区间,选择2个子区间[4, 16]建立的SiPLS模型预测效果最好,相关系数(Rp)达0.998 9,预测均方根误差(RMSEP)为0.019 2。对掺杂不同含量煎炸花生油的橄榄油,采用划分20个区间,选择2个子区间[2, 16]组合建立的SiPLS和BiPLS模型具有相同的预测效果,预测均方根误差(RMSEP)为0.0120,均优于iPLS模型。此外,与SiPLS模型相比,BiPLS模型运算量少,速度快。由此可见,基于掺杂油样品的可见和近红外透射光谱,分别采用组合区间偏最小二乘法(SiPLS)和反向区间偏最小二乘法(BiPLS)优选建模光谱区域,可以对橄榄油中掺杂煎炸大豆油和煎炸花生油含量进行准确测定。而且,实验过程无需对掺杂油样品进行预处理,无环境污染,操作简单,快速无损。  相似文献   

2.
利用反向区间偏最小二乘法(BiPLS)定位光谱糖度若干信息区间,运用遗传算法(GA)从中选择波长点,建立了多元线性回归(MLR)模型。光谱进行卷积平滑和二阶导数处理后,将光谱(225个数据点)分割成25个子区间时,BiPLS优化结果最优。在所定位的信息区间进行GA二次选择特征变量,运行100次依次选择入选频率较高的12个波长点。为简化MLR模型,对于入选的相邻波长选择频率较高者,最后选择 638,734,752,868,910,916和938 nm作为回归变量,建立的MLR预测模型相关系数(R2)、校正均方根误差(RMSEC)和预测均方根误差(RMSEP)分别为0.984,0.364和0.471,优于常用的逐步多元线性回归的建模结果。表明BiPLS结合GA可以有效地对李子糖度可见/近红外光谱MLR回归变量进行筛选,提高了模型的精度。  相似文献   

3.
近红外(NIR)光谱一般具有较多的波长变量数,对其直接或间接地进行变量选择是提高模型稳定性能及预测性能的关键。最小角回归(LAR)是一种相对较新和有效的机器学习算法,常用于进行回归分析和变量选择。面向光谱建模应用,提出一种LAR结合遗传偏最小二乘法(GA-PLS)的变量选择方法,可有效筛选出少数特征波长点。首先在全光谱区利用LAR消除变量间的共线性得到初筛波长点,然后用GA-PLS对LAR筛选出的波长点进一步优选从而得到最终建模用的特征波长点。为验证本文方法的有效性,以药片和汽油的近红外光谱回归分析作为应用案例,对原光谱进行预处理后,采用该方法进行变量筛选,然后分别建模其中的活性成分含量和C10含量。结果显示,在这两个应用中,最终优化得到的特征波长点数均只需七个,而两者的预测决定系数R2p分别达到0.933 9和0.951 9,与全光谱、无信息变量消除法(UVE)和连续投影算法(SPA)等方法相比,特征波长点更少,同时R2p和预测均方根误差RMSEP值更优。因此,LAR结合GA-PLS,能有效地从近红外光谱中选择出信息变量从而减少建模波数,提高预测精度,拥有较好的模型解释性。该方法可为特定领域的专用光谱仪设计提供有效的波长筛选工具。  相似文献   

4.
利用三维同步荧光光谱法获取不同氧化状态下的葵花籽油荧光光谱数据,同时采集葵花籽油品质指标。运用平行因子法对三维同步荧光光谱矩阵进行降维处理,通过iPLS(interval partial least squares),BiPLS(backward interval partial least squares)和SiPLS(synergy interval partial least squares)模式识别方法进行数学建模。结果表明:波长差Δλ=50 nm时,样品同步荧光光谱具有显著差异,筛选用于数学建模初始数值。不同模式识别方法建模结果显示,iPLS,BiPLS和SiPLS法所得校正集模型和预测集模型的相关系数分别为0.908 3,0.961 2,0.954 5和0.872 3,0.925 2,0.852 5,交互验证均方根误差分别为0.050 3,0.033 1,0.035 9和0.073 3,0.054 1,0.065 5,比较发现采用BiPLS法建模效果最好。该研究将为葵花籽油品质快速辨别提供理论基础和技术支持,为其他食用油脂的快速检测提供方法指导。  相似文献   

5.
王动民  张军  赵滨 《光谱实验室》2006,23(5):921-925
对模拟退火算法进行了优化,并以小麦粉样品的光谱为对象,利用优化后的算法在分子含氢基团一倍频区域1400-1860nm(7144-5376cm-1)优选出了分析小麦蛋白质含量的4个特征波长,结合多元线性回归(MLR)建立了定标模型.同时,利用这个谱区的全谱数据,结合偏最小二乘法(PLS)建立了另外一个模型.经过比较,发现这两个模型具有相同的预测效果.说明优化后的模拟退火算法能很好地用于近红外光谱分析中定标波长的选取,进而建立"精而简"的模型.这对于简化定标模型及确定分立波长型仪器的定标波长具有十分重要的价值.同时,对处理其他优化组合问题也有一定的指导意义.  相似文献   

6.
用近红外透射光谱技术和偏最小二乘法建立甘蔗初压汁锤度的定量分析模型。用多元散射校正和Savitzky-Golay平滑化方法对原谱、一阶导数谱和二阶导数谱进行预处理。选取400—1100nm、1100—1400nm、1550—1850nm、2100—2350nm以及全谱(400—2500nm)5个波段,每个波段分别采用原光谱、一阶导数谱、二阶导数谱。同时调整Savitzky-Golay平滑点数和PLS因子数,通过多次PLS数值实验比较,按照预测效果确定每个模型的最优平滑点数、因子数,再从中选优。结果表明,采用二阶导数谱的1550-1850nm波段的定标效果最好,模型的预测相关系数、预测均方根偏差、相对预测均方根偏差分别为0.896,0.406,1.95%。1550—1850nm波段可以代替全谱波段得到好的定标效果,为设计小型专用近红外分析仪器提供依据。  相似文献   

7.
廿蔗初压汁锤度近红外光谱分析的波段优选   总被引:1,自引:0,他引:1  
用近红外透射光谱技术和偏最小二乘法建立甘蔗初压汁锤度的定量分析模型.用多元散射校正和Savitzky-Golay平滑化方法对原谱、一阶导数谱和二阶导数谱进行预处理.选取400-1100nm、1100-1400nm、1550-1850nm、2100-2350nm以及全谱(400-2500nm)5个波段,每个波段分别采用原光谱、一阶导数谱、二阶导数谱.同时调整Sayitzky-Golay平滑点数和PLS因子数,通过多次PLS数值实验比较,按照预测效果确定每个模型的最优平滑点数、因子数,再从中选优.结果表明,采用二阶导数谱的1550-1850nm波段的定标效果最好,模型的预测相关系数、预测均方根偏差、相对预测均方根偏差分别为0.896,0.406,1.95%.1550-1850nm波段可以代替全谱波段得到好的定标效果,为设计小型专用近红外分析仪器提供依据.  相似文献   

8.
近红外光谱法分析慈竹物理力学性质的研究   总被引:2,自引:0,他引:2  
采用近红外光谱法对慈竹密度、抗弯强度和顺纹抗拉强度进行快速预测.利用反向区间偏最小二乘法(BiPIS)优选光谱区间,建立原始光谱和不同预处理(一阶微分、二阶微分、卷积平滑和归一化处理)光谱分析模型,同时应用偏最小二乘法(PLS)在全谱范围350~2 500 nm建立各光谱分析模唰,并对所建模型进行比较分析.结果表明:同...  相似文献   

9.
质谱法和化学计量学方法相结合对混合物中苯甲醛,异辛烷,乙酸丁酯,苯乙酮四种物质进行定量分析。将混合物的质量色谱图数据分别用特征选择-多元线性回归(MLR)和全谱-偏最小二乘法(PLS)这两种方法对四种物质进行定量分析。苯甲醛特征选择和全谱建模的RMSEP分别为0.062和0.091; 异辛烷特征选择和全谱建模的RMSEP分别为0.048和0.057; 乙酸丁酯特征选择和全谱建模的RMSEP分别为0.021和0.020; 苯乙酮特征选择和全谱建模的RMSEP分别为0.010和0.032。结果表明苯甲醛,异辛烷,苯乙酮特征选择的结果均优于全谱建模的结果,乙酸丁酯特征选择的结果和全谱建模的结果相近。  相似文献   

10.
基于遗传算法的苹果糖度近红外光谱分析   总被引:12,自引:0,他引:12  
遗传算法(GA)应用在偏最小二乘法(PLS)校正模型的波段优化选择中具有显著的效果。将遗传算法用于波段选择, 能更快达到最优解, 有效提高测量精度,减少建模所用变量。文章研究了在近红外苹果糖度无损检测中,遗传算法作为模块进行波段选择,建立了GA-PLS模型;为了说明遗传算法优选波段可行性,另外建立了全谱和经验谱区的PLS定量模型,并评价了模型的稳健性。首先对傅里叶变换近红外光谱进行多元散射校正、Savitky-Golay卷积平滑后,用遗传算法优选波段(R-SGA),参与建模数据点从原始1 550减少到434个。然后采用一阶导数光谱建立GA-PLS模型,相比全谱PLS(1 550个数据点)和经验谱区PLS(717个数据点)模型具有更高的预测精度,其建模结果为RC=0.966,RMSEC=0.469,RP=0.954,RMSEP=0.797。结果表明, 遗传算法可用于PLS法建立苹果糖度校正模型前的数据优化筛选, 有效提高测量精度, 并减少建模变量。  相似文献   

11.
饶利波  陈晓燕  庞涛 《发光学报》2019,40(3):389-395
可溶性固形物含量是判断苹果内部品质的重要参考属性之一。利用高光谱技术获取苹果感兴趣区域的反射光谱,以S-G平滑(Savitzky-Golay smoothing)和直接正交信号校正(Direct orthogonal signal correction, DOSC)算法对光谱数据进行梯度预处理后,用后向区间偏最小二乘法(Bipls)优选出3,5,6,7,8,9,13,14,15,16,17,18,19,20,21,23等16个子区间,共计177个波长。结合竞争自适应重加权采样算法(CARS)再作进一步筛选,提取出449.6,512.9,544.8,547.2,594.3,596.8,928.2 nm等7个特征波长,利用偏最小二乘算法(PLS)建立基于特征波长的可溶性固形物含量检测模型,所得模型评价为R_c=0.906 2,RMSEC为0.482 2,R_p=0.871 6,RMSEP为0.614 0。该算法模型预测性能同Bipls和Bipls-SPA模型相比更为优异,证明了Bipls结合CARS算法在提高苹果可溶性固体物含量检测精度方面的有效性。  相似文献   

12.
采用近红外(NIR)漫反射光谱法对新疆特色梨果库尔勒香梨的五种不同果(包括青头、粗皮、脱萼、宿萼、突顶果)的硬度进行测定。由于近红外光谱数据量大且原始光谱噪声明显、测定水果时散射严重等导致光谱建模时关键波长变量提取困难。以新疆库尔勒香梨为研究对象,为了有效地消除固体表面散射以及光程变化对NIR漫反射光谱的影响,首先采用标准正态变量变换(SNV)和多元散射校正(MSC)对库尔勒香梨的原始光谱进行预处理。为寻找适合近红外光谱检测库尔勒香梨硬度的最佳特征波长筛选方法,进行香梨近红外光谱的特征波长变量选择方法的比较与研究。研究比较了两种特征波长筛选方法对库尔勒香梨硬度偏最小二乘法(PLS)建模精度的影响。同时使用反向偏最小二乘(BiPLS)和遗传算法结合反向偏最小二乘(BiPLS-GA)在全光谱范围内筛选香梨硬度的特征波长变量,将校正均方根误差(RESMC)、预测均方根误差(RESMP)以及决定系数(R2)作为模型的评价标准,并最终确定最优波段选择方法及最佳预测模型。基于选择的特征波长变量建立的PLS模型(BiPLS-GA)与全光谱变量建立的PLS模型进行比较发现BiPLS-GA模型仅仅使用原始变量中6.6%的信息就获得了比全变量PLS模型更好的库尔勒香梨硬度的预测结果,其中R2,RMSEC和RMSEP分别为0.91,1.03和1.01。进一步与基于反向偏最小二乘算法(BiPLS)获得的特征变量建立的PLS模型比较发现,BiPLS-GA不仅可以去除原始光谱数据中的无信息变量,同时也能够对共线性的变量进行压缩去除,使得建模变量从301个减少到20个。极大地简化模型的同时有效地提高了模型的预测精准度和稳定性。因此该方法能够有效地用于近红外光谱数据变量的选择。证明了近红外光谱分析技术结合BiPLS-GA模型能够高效地选择出建模变量,去除与库尔勒香梨硬度无关的近红外光谱信息,显著地提高库尔勒香梨硬度定量模型的预测精度。这不仅为新疆地区特色梨果库尔勒香梨的快速、精确、无损优选分级提供一定的技术支持,同时也为基于近红外光谱分析技术预测水果内部品质的研究提供了参考。  相似文献   

13.
水体中过高浓度的有机物含量危害巨大,不仅会造成严重的环境污染,而且危害人类身体健康,传统化学法检测水体化学需氧量(COD)的步骤繁琐且时效性差,不利于水体中COD的快速定量检测。针对这些问题,提出了一种将紫外光谱与组合权值模型相结合的快速定量检测COD方法,该组合权值模型是基于反向区间偏最小二乘法(BiPLS)结合组合区间偏最小二乘法(SiPLS)算法对紫外光谱的特征子区间筛选组合,然后依据特征子区间的权值建立的预测模型。首先按照一定的浓度梯度配制45份COD标准液样本,通过实验获取标准液的紫外光谱数据;对获取到的COD紫外光谱数据做一阶导数和S-G滤波(Savitzky-Golay)的预处理,消除基线漂移和环境干扰噪声;应用SPXY(Sample set partitioning based on jiont X-Y)算法将实验样本数据组划分成校正集和预测集。然后基于BiPLS算法对全光谱区间进行波长筛选,在BiPLS筛选过程中,目标区间的划分数量会对建模产生较大影响,于是对子区间划分数量进行优化,把子区间分成15~25个,在不同区间数下都进行偏最小二乘(PLS)建模,通过交互验证均方根误差(RMSECV)来筛选最优子区间数,得到区间数为18时,模型效果最佳。从18个波长区间筛选出了6个特征波长子区间,入选的子区间为2,1,3,11,7和6,对应波长为234~240,262~268,269~275,290~296,297~303和304~310 nm,这6个特征波长区间涵盖了大量的光谱信息,对最终预测模型的贡献度大;接下来通过SiPLS算法对这6个初选区间进行进一步的筛选组合,采用不同的组合数构建不同特征区间上的PLS模型,在相同组合数下,筛选出一个区间组合数最优的结果,对比不同组合数下预测模型的误差与相关性,将6个区间筛选组合为3个特征波长区间,分别为234~240,262~275和290~310 nm,这三个特征区间最佳因子数分别为4,4和3。对传统SiPLS的特征区间组合方法进行改进,基于权值的大小来对这3个特征区间进行线性组合,代替过去特征区间直接组合的方法。通过权值公式计算出这3个特征区间的权重大小分别为0.509,0.318和0.173,最终建立线性组合权值COD浓度预测模型。为了验证组合权重预测模型的精度,另外建立了全波长范围内的PLS预测模型、单个特征波长区间的PLS预测模型、直接组合特征波长区间的PLS模型,并使用评价参数相关系数的平方(R2)、预测值与真实浓度值的均方根误差(RMSEP)和预测回收率(T)来对模型评价。验证结果表明,相比其他预测模型,组合权值模型相关系数的平方达到了0.999 7,明显优于直接组合特征区间建模的0.968 0,预测均方根误差为0.532,比直接组合特征区间的预测模型误差降低了29.3%,预测回收率为96.4%~103.1%,显著地提高了预测精度。该方法简单可行,不会产生二次污染,可为在线监测水体中COD浓度提供一定的技术支持。  相似文献   

14.
基于激光近红外的稻米油掺伪定性-定量分析   总被引:1,自引:0,他引:1  
该文主要研究激光近红外光谱分析技术结合化学计量学方法对稻米油掺伪进行定性-定量分析。分别将大豆油、玉米油、菜籽油、餐饮废弃油掺入稻米油中,按照不同质量比配置189个掺伪油样,利用激光近红外光谱仪采集光谱;对采集的稻米油掺伪图谱数据进行多元散射校正(MSC)、正交信号校正 (OSC)、标准正态变量变换和去趋势技术联用算法(SNV_DT)三种不同预处理并与原始数据进行比较。采用连续投影算法(SPA)对经过预处理的光谱数据进行特征波长提取,应用支持向量机分类(SVC)方法建立稻米油掺伪样品的定性分类校正模型,选择网格搜索算法对模型参数组合(C,g)进行寻优,确定最优参数组合。另采用后向间隔偏最小二乘法(BiPLS)和SPA对预处理后的光谱数据进行特征波长提取,分别应用偏最小二乘法(PLS)和支持向量机回归(SVR)建立掺伪油含量的定量校正模型,并选用网格搜索算法对SVR模型参数组合(C,g)进行寻优,建立最优参数模型。研究表明,建立的SVC模型预测集和校正集的准确率分别达到了95%和100%;对比SVR和PLS方法建立的数学模型对稻米油中掺杂油脂的含量的预测,两种方法均能够实现含量预测,SVR模型的预测能力更好,相关系数R高于0.99,均方根误差(MSE)低于5.55×10-4,预测精度高。结果表明,采用激光近红外光谱分析技术可以实现稻米油掺伪的定性-定量分析,同时为其他油脂的掺伪分析提供了方法。  相似文献   

15.
用遗传算法快速提取近红外光谱特征区域和特征波长   总被引:9,自引:0,他引:9  
邹小波  赵杰文 《光学学报》2007,27(7):316-1321
提出了一种遗传区间偏最小二乘法(GA-iPLS),并用该方法快速提取苹果糖度近红外光谱的特征区域,在此基础上采用遗传偏最小二乘法(GA-PLS)提取苹果糖度近红外光谱的特征波长,进行苹果糖度预测。结果表明,整个光谱等分为40个子区间,遗传区间偏最小二乘法能快速寻找出5个特征子区间(第4,6,8,11,18号);在5个特征子区间的基础上用遗传偏最小二乘法继续优化,从中提取44个特征波长。建立在5个特征子区间和44个特征波长上的偏最小二乘法模型精度均优于全光谱偏最小二乘法模型,对预测集的预测相关系数提高了近10%;且模型得到了很大的简化,用于建模的主因子数减少了7个。这些结果表明,用这两种方法不但可以建立简洁、数据运算量少的模型,还可以快速地提取近红外光谱的特征区域和特征波长。  相似文献   

16.
在近红外光谱分析模型中全谱信息通常含有大量冗余信息,会导致模型解析时间延长、 加大模型解析难度,因此如何快速有效地选取特征波长至关重要。采用基于间隔偏最小二乘(interval partial least squares, IPLS)结合连续投影算法(successive projections algorithm, SPA)对小麦秸秆发酵过程微生物生物量进行特征波长选择,共制备85个样本,采用氨基葡萄糖法测定微生物生物量,选择68个样本作为校正集,17个样本作为验证集。首先对全谱区520个波长点根据间隔点大小10, 20, 30, 40进行分段建模,选取出4 450~4 925和9 194~9 993 cm-1两个波段范围作为特征波段,将选取出的特征波段再进行连续投影算法及遗传算法(genetic algorithm, GA)特征波长点选取,并进行综合分析对比。实验结果表明采用IPLS-SPA算法选择4 450~4 925和9 194~9 993 cm-1的组合波段具有最佳建模效果,相比于全谱建模其参与建模的波长点由520个减少到10个,模型验证集决定系数(R-Square, R2)从0.884 9提升至0.945 28,验证集均方误差根(root mean square error prediction, RMSEP)从11.104 9降至8.203 3,GA遗传算法虽取得了更优的模型精度,但其实验结果并不稳定且随机性较强,而IPLS结合SPA方法能够稳定而准确的(地)选择特征波长信息,提高模型运算速度并降低模型拟合难度,可以作为一种新的波段选择参考方法。结果表明采用近红外光谱分析方法对秸秆发酵生物量进行快速检测是可行的。  相似文献   

17.
小麦是制作馒头的主要原料之一,小麦中水、蛋白质、淀粉会因产地以及烘干程度的差异而不同,进而影响到加工成馒头的品质。所以实现对小麦产地和烘干程度的快速鉴别就显得尤为重要。感官评定是鉴别小麦产地和烘干程度常用的方法,对比感官评定,光谱分析可以识别样品中的分子结构等信息。基于此,尝试利用近红外和中红外光谱融合技术实现对不同产地和不同烘干程度的小麦同时鉴别。首先选取了两个不同产地的小麦,再利用微波干燥法对两个不同产地的小麦做烘干预处理,使烘干的小麦水含量为12%±0.5%,原麦水含量为18%±0.5%。分别标记为原麦A,烘干A,原麦B,烘干B,再将小麦研磨成粉末,过100目筛网筛选后,置于自封袋中备用。随后分别采集四种小麦样品的近红外和中红外光谱信息,在Matlab 7.10的环境下使用标准正态变量变换(standard normal variable transformation, SNVT)对采集到的原始光谱数据进行预处理,利用主成分分析对预处理后的数据进行降维处理,再结合线性判别分析(linear discriminant analysis,LDA)和支持向量机(support vector machine, SVM)分别建立小麦近红外、中红外光谱数据识别模型。另外利用联合区间偏最小二乘法(synergy interval partial least square, SiPLS)筛选出利用标准正态变量变换(SNVT)预处理后的小麦近红外和中红外光谱数据特征光谱区间,将筛选出的近红外和中红外光谱数据特征光谱区间融合后再结合线性判别分析(LDA)和支持向量机(SVM)建立小麦融合光谱信息的识别模型。然后比较同种光谱数据下利用线性判别分析(LDA)和支持向量机(SVM)建立的小麦识别模型识别率、比较同种建模方法下近红外和中红外光谱数据建立小麦识别模型识别率、比较同种建模方法下光谱数据融合和单一光谱数据建立小麦识别模型识别率。结果表明,同种光谱分析方法,利用SVM建立的四种小麦识别模型识别率高于利用LDA建立的小麦识别模型识别率。同种建模方法,近红外光谱数据建立的小麦识别模型识别率优于中红外光谱数据建立的小麦识别模型识别率。而在同种建模方法下,利用SiPLS筛选出近红外和中红外光谱数据的特征光谱区间数据融合后建立小麦识别模型识别率最高,光谱数据融合后结合LDA建立的小麦识别模型校正集识别率为98.75%,预测集识别率为97.50%;而将此选择的变量结合SVM建立的小麦识别模型的校正集和预测集识别率都达到100.0%。对比利用单一光谱数据建立的小麦识别模型识别率,光谱数据融合之后建立的小麦识别模型识别率得到显著提高,该研究从纵向和横向上全面地比较了光谱数据建立的小麦模型识别率,结果可为更准确地运用光谱融合技术建立小麦产地以及烘干程度识别模型提供参考。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号