首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 125 毫秒
1.
一种基于SCARS策略的近红外特征波长选择方法及其应用   总被引:4,自引:0,他引:4  
针对近红外光谱数据的内在特点,提出了一种基于稳定性竞争自适应重加权采样(stability competitive adaptive reweighted sampling, SCARS)策略的近红外特征波长优选方法。该方法以PLS模型回归系数的稳定性作为变量选择的依据,其过程包含多次循环迭代,每次循环均首先计算相应变量的稳定性,而后通过强制变量筛选以及自适应重加权采样技术(ARS)进行变量筛选;最后对每次循环后所得变量子集建立PLS模型并计算交互验证均方根误差(RMSECV),将RMSECV值最小的集合作为最优变量子集。利用饲料蛋白固态发酵过程近红外光谱数据集对所提方法进行了验证,并与基于PLS的蒙特卡罗无信息变量消除法(MC-UVE)和竞争自适应重加权采样(CARS)方法所得结果进行了比较。试验结果显示: 建立在SCARS方法优选的21个特征波长变量基础上的PLS模型预测效果更好,其预测均方根误差(RMSEP)和相关系数(Rp)分别为0.054 3和0.990 8;该优选策略能有效地增强固态发酵光谱数据特征波长变量选择的准确性和稳定性,提高了模型的预测精度,具有一定的应用价值。  相似文献   

2.
采用紫外可见光谱(UV-Vis)与极限学习机算法检测水体化学需氧量(chemical oxygen demand,COD)含量研究。采集135份水样进行紫外可见波段全光谱扫描,结合变量标准化(standard normal variate,SNV),多元散射校正(MSC)和一阶微分(1st D)对原始数据进行预处理,然后采用竞争性自适应重加权算法(competitive adaptive reweighted sampling,CARS)、随机青蛙(Random frog)算法和遗传算法进行特征波长选择。基于全光谱建立了偏最小二乘回归(partial least squares,PLS)和基于特征波长建立了极限学习机算法(extreme learning machine,ELM)模型。结果表明:使用CARS提取的9个特征波长建立的ELM模型的预测效果最优,决定系数R2为0.82,预测均方根误差RMSEP为 14.48 mg·L-1,RPD值为2.34。说明使用CARS变量选择算法获取UV-Vis光谱特征波长,应用极限学习机建模,可以准确、快速的检测养殖水体中COD含量,为实现养殖水体COD的动态快速检测以及水体其他微量物质含量参数检测打下基础。  相似文献   

3.
可溶性固形物(SSC)是脐橙重要内部品质之一。采用QualitySpec型光谱仪在350~1000 nm波段范围采集脐橙的可见/近红外漫透射光谱,采用CARS(competitive adaptive reweighted sampling)变量选择方法筛选出与脐橙SSC相关的重要变量,并与无信息变量消除(UVE)及连续投影算法(SPA)比较。最后,对选择的38个重要波长变量应用偏最小二乘(PLS)回归建立脐橙SSC预测模型,并对未参与建模的75个样品进行预测。研究结果表明,CARS方法优于UVE及SPA变量选择方法,能有效地筛选出重要波长变量。CARS-PLS建立的SSC预测模型优于全光谱的PLS模型,其校正集及预测集的相关系数分别为0.948和0.917,均方根误差分别为0.347%和0.394%。因此,可见/近红外漫透射光谱结合CARS方法可以预测脐橙可溶性固形物,CARS变量选择方法能有效简化预测模型和提高模型的预测精度。  相似文献   

4.
纺织品纤维成分的快速检测对其生产过程质量监控、贸易和市场监督均具有重要的意义。利用近红外光谱技术联合变量优选对棉麻混纺织物中的棉含量进行快速检测研究。采用NIRFlex N-500型傅里叶近红外光谱仪在4 000~10 000 cm-1光谱范围内采集样本的反射光谱,对样本光谱进行范围初选和预处理分析。在此基础上,利用UVE(uninformative variables elimination),SPA(successive projections algorithm)及CARS (competitive adaptive reweighted sampling)方法对光谱变量进行优选,再应用PLS(partial least squares)建立棉麻混纺织物中的棉含量预测模型。最后,采用最优预测模型对未参与建模的样本进行预测。研究结果表明,4 052~8 000 cm-1光谱范围为棉含量较优的建模光谱范围。CARS变量选择方法能较为有效地提高预测模型的精度,CARS-PLS模型的校正集、预测集相关系数和均方根误差分别为0.903,0.749和8.01%,12.93%。因此,近红外光谱联合CARS变量优选可以用于棉麻混纺织物棉含量的快速检测,CARS方法可以有效简化预测模型,提高预测模型性能。  相似文献   

5.
基于GA和CARS的真空包装冷却羊肉细菌菌落总数高光谱检测   总被引:1,自引:0,他引:1  
在光谱建模过程中,采用不同的变量筛选算法进行光谱特征波段的提取已成为提高模型效果的重要方法。以真空包装的冷却羊肉细菌菌落总数作为研究指标,比较了两种变量筛选算法对其高光谱偏最小二乘(partial least squares, PLS)模型效果的影响。研究提取了样品肌肉感兴趣区域(ROIs)的羊肉光谱并进行预处理,进而采用遗传算法(genetic algorithm, GA)和竞争性自适应重加权法(competitive adaptive reweighted sampling, CARS)分别对预处理后的473~1 000 nm范围光谱进行特征波段的提取,对比分析了不同波段下羊肉细菌菌落总数的GA-PLS, CARS-PLS和全波段PLS(W-PLS)模型效果。结果表明,GA-PLS和CARS-PLS的模型效果均优于W-PLS,且CARS-PLS模型效果最好,其校正集的决定系数(R2c)和均方根误差(root mean square error, RMSEC)分别为0.96和0.29,交互验证的决定系数(R2cv)和均方根误差(root mean square errorof cross validation, RMSECV)分别为0.92和0.46,预测集的决定系数(R2p)和均方根误差(root mean square error of prediction, RMSEP)分别为0.92和0.47,预测相对分析误差(relative prediction deviation, RPD)为3.58。因此利用高光谱图像技术结合CARS-PLS可以实现羊肉细菌菌落总数快速无损准确检测。  相似文献   

6.
三七是一种传统的中药材,具有较高的药用价值。目前市场上中药售假的现象屡见不鲜,许多不法商贩将三七支根或剪口粉末假冒主根粉末销售,严重损害了消费者的利益。利用高光谱技术结合多元分析方法实现三七不同部位粉末的快速无损鉴别。通过高光谱成像系统分别采集了三七剪口、须根和主根粉末在400~1 000 nm范围内的高光谱图像,共300个样本。采用Savitzky-Golay(SG)平滑结合标准变量变换(SNV)的方法对高光谱数据进行去噪和消除因散射引起的光谱差异。为了移除光谱变量中的重迭和冗余信息,利用竞争自适应重加权采样(CARS)算法和本文提出的一种考虑了变量间交互作用的二进制竞争自适应重加权采样(BCARS)算法进行特征波长选择。最后分别建立了基于全光谱、 CARS和BCARS特征波长的支持向量机(SVM)和极端梯度提升(XGBoost)分类模型。结果表明,BCARS-XGBoost模型的分类效果最优,训练集和测试集的分类准确率分别为100%和99.33%。与CARS相比,BCARS所选择的特征波长数量较少,有助于多光谱系统和便携式仪器的开发。利用高光谱技术结合BCARS-XGBoost模型...  相似文献   

7.
食药植物玛咖富含多种营养成分,极具药用价值。采用近红外漫反射光谱,对采自秘鲁及云南共139份玛咖样品进行产地鉴别。采用多元信号校正结合二阶导数和Norris平滑预处理光谱,利用光谱标准偏差初步选择光谱波段(7 500~4 061 cm-1),结合主成分-马氏距离(principal component analysis-mahalanobis distance,PCA-MD)筛选出适宜的主成分数为5。基于所筛选的光谱波段及主成分数,利用“模群迭代奇异样本诊断”方法剔除2个异常样品后,分别采用竞争自适应重加权法(competitive adaptive reweighted sampling,CARS)、蒙特卡洛-无信息变量消除法(monte carlo-uninformative variable elimination,MC-UVE)、遗传算法(genetic algorithm,GA)和子窗口重排(subwindow permutation analysis,SPA)四种方法筛选光谱变量信息,利用模型集群分析(model population analysis,MPA)思想对所筛选的光谱变量信息进行评价。结果显示,RMSECV(SPA)>RMSECV(CARS)>RMSECV(MC-UVE)>RMSECV(GA),分别为2.14,2.05,2.02,1.98,光谱变量数分别为250,240,250和70。采用偏最小二乘判别分析法(partial least squares discriminant analysis,PLS-DA)对四种方法筛选的光谱变量建立判别模型,随机选择97份样品作为建模集,其余40份样品作为验证集。通过R2,RMSEC和RMSEP分析可知,R2: GA>MC-UVE>CARS>SPA,RMSEC和RMSEP: GA相似文献   

8.
基于叶冠尺度高光谱的冬小麦叶片含水量估算   总被引:1,自引:0,他引:1  
叶片含水量(leaf water content,LWC)的快速监测对于作物的干旱诊断和灌溉决策至关重要。以叶片、冠层两个尺度,原始、一阶导数两种光谱处理形式的高光谱数据为基础,采用两波段植被指数如归一化差分(normalized difference spectral index,NDSI)和比值光谱指数(ratio spectral index,RSI),偏最小二乘回归(partial least squares regression,PLSR)和竞争自适应重加权采样-偏最小二乘回归(competitive adaptive reweighted sampling-partial least squares regression,CARS-PLSR)三种方法对叶片含水量进行建模分析,以确定最佳冬小麦叶片含水量预测模型。结果表明:三种方法中,基于叶片一阶导数光谱的CARS-PLSR模型对LWC的预测效果最好, LWC的预测值与实测值高度重合(R~2=0.969, RMSE=0.164, RRMSE=6.00%)。相同条件下,三种方法的叶片光谱模型对LWC的预测效果均优于冠层光谱模型。在两波段指数模型以及PLSR模型中,原始光谱模型对LWC的预测效果优于一阶导数光谱模型,而在CARS-PLSR模型中结果相反。在两波段指数模型中, RSI比NDSI具有更高的估算精度。研究表明,通过竞争自适应重加权采样方法提取敏感波段后所建立的偏最小二乘回归预测模型,无论是预测精度还是建模精度,与两波段指数和偏最小二乘回归模型相比都有了显著提高,该方法可为精准快速地监测冬小麦旱情以及灌溉决策提供参考。  相似文献   

9.
基于近红外光谱的淡水鱼新鲜度在线检测方法研究   总被引:1,自引:0,他引:1  
新鲜度是反映鱼类品质以及可否食用的重要指标,在线检测直接关系到食品质量与安全的实施应用,因此对淡水鱼新鲜度进行在线无损检测具有重要意义。应用近红外光谱对淡水鱼新鲜度进行在线检测,试验装置采用自行搭建的淡水鱼近红外光谱在线采集装置,试验时样品在输送链上以0.5 m·s-1的速度运动,采集其近红外漫反射光谱(900~2 500 nm),并用支持向量机(support vector machine, SVM)建立淡水鱼新鲜度在线检测模型。采用光谱理化值共生距离(sample set partitioning based on joint X-Y distance algorithm, SPXY)算法对样本集进行划分,其中校正集111条(新鲜57条,变质54条)、测试集37条(新鲜19条,变质18条),通过对比不同的光谱预处理方法对预测结果的影响,明确了一阶导结合标准化预处理为最优光谱预处理方法,经过该方法预处理后所建模型对校正集的正确识别率为97.96%,对测试集的识别率为95.92%。为了提高模型运行速度对建模所用光谱变量进行优化,分别采用遗传算法(genetic algorithm, GA)、连续投影算法(successive projection algorithm, SPA)和竞争性自适应重加权算法(competitive adaptive reweighed sampling algorithm, CARS) 三种不同的特征变量选择方法对特征波长进行筛选,通过建模比较分析确定CARS为最优波长选择方法,以所选的10个特征波长建立淡水鱼新鲜度支持向量机检测模型,模型对校正集的正确识别率为100%,对测试集的识别率为93.88%。该研究可为近红外光谱用于淡水鱼新鲜度在线检测提供技术支持。  相似文献   

10.
针对目前库尔勒香梨品质在线分级检测系统存在价格昂贵、结构复杂等问题,设计了库勒尔香梨内部品质在线无损检测分级系统。基于该系统研究了不同移动速度(0.3和0.5 m·s~(-1))对库尔勒香梨的可溶性固形物含量(solid soluble contents, SSC)和硬度在线预测模型的影响。不同移动速度下,采集样品相同部位的信息,所采集光谱存在差异。由于采集的光谱存在差异性,采用SG-平滑(Savitzky-Golay smooth)、 SG卷积导数、多元散射校正(MSC)、标准正态能量变换(SNV)、归一化(Normalization)等多种光谱预处理方法进行处理,基于偏最小二乘法(partial least squares, PLS),建立移动速度为0.3 m·s~(-1)(S1)和0.5 m·s~(-1)(S2)下库尔勒香梨的SSC和硬度模型。结果表明:移动速度为0.5 m·s~(-1)下,采用SG-DER(Savitzky-Golay Derivative)处理光谱图建立SSC模型优于0.3 m·s~(-1),其预测集相关系数和预测均方根误差为0.880 2和0.391 5°Bri。而在移动速度为0.3 m·s~(-1)下的结果,采用SGS(Savitzky-Golay smooth)处理光谱图建立的SSC模型优于0.5 m·s~(-1)下的结果,其预测集相关系数和预测均方根误差分别为0.820 2和0.470 8 N。后建立两个速度混合模型,采用竞争性自适应重加权算法(competitive adaptive reweighted sampling, CARS)和连续投影算法(successive projections algorithm, SPA)筛选特征变量,后采用PLS,建立混合速度下硬度和SSC预测模型。从建模效果来看SPA和CARS都可以有效减少建模所用变量数、提高库尔勒香梨在线SSC和硬度检测模型的预测能力和运算速度,增强模型的稳健性等。采用CARS方法,从501个光谱中筛选出24个变量,建立了CARS-PLS模型,建立的SSC模型较好,其预测集相关系数和预测均方根误差分别为0.915 0和0.371 9°Bri。采用SPA方法,从501个光谱中筛选出32个变量,建立硬度模型较好,其预测集相关系数和预测均方根误差分别为0.821 0和0.492 0 N。混合速度建立预测品质模型比单一速度建立模型稳健一些。研究表明:不同移动速度对建立果品品质预测模型产生不同影响,该研究有助于果品品质在线分选提供技术支持。  相似文献   

11.
通过消除光谱中的冗余信息变量,挑选出代表样品性质的特征变量代替全谱建立定量模型,可以提高近红外分析结果的准确性。基于进化论中适者生存原理的竞争性自适应重加权采样(CARS)算法因具有计算速度快、筛选得到的特征波长少等优点,在近红外特征变量筛选方面得到了广泛的应用。然而该方法在计算过程中容易出现校正集和验证集结果不一致情况。这是因为算法过于强调校正集交叉验证结果,且并未考虑相邻变量之间的协同作用。为了建立更加稳健的变量筛选方法,通过结合“窗口”以及CARS算法的优势,提出了一种基于窗口竞争性自适应重加权采样(WCARS)策略的近红外特征变量筛选方法,并将其应用于复杂植物样品近红外光谱与其化学成分含量之间的建模分析。采用WCARS方法可以实现准确定量分析,且通过与竞争性自适应重加权采样(CARS)方法结果相比较,WCARS方法得到的校正集和预测集结果一致,在一定程度上减少了过拟合问题的出现。该策略能有效增强特征变量选择的稳健性,提高了定量模型的可信度,具有一定的应用价值。  相似文献   

12.
刘津  孙通  甘兰萍 《发光学报》2018,39(5):737-744
利用共线双脉冲激光诱导击穿光谱(LIBS)技术对溶液中的倍硫磷含量进行定量检测研究。采用石墨对倍硫磷溶液进行富集,利用双通道高精度光谱仪获取样品的LIBS光谱。以碳元素谱线(CⅠ247.856 nm)为内标对210~260 nm波段谱线进行校正,然后利用竞争性自适应重加权算法(CARS)筛选与倍硫磷相关的重要波长变量,最后应用最小二乘支持向量机(LSSVM)建立倍硫磷含量的定标模型,并与基本定标法及内标法建立的单变量定标模型进行比较。研究结果表明,共线双脉冲LIBS技术可以用于溶液中的倍硫磷含量检测。基本定标法建立的最优定标模型的拟合度R2为0.935 04,预测集样品的平均预测相对误差(PRE)为41.50%;内标法建立的最优单变量定标模型的拟合度R2为0.993 61,预测集样品的平均PRE为14.91%;内标-CARS-LSSVM定标模型的拟合度R2为0.998 6,预测集样品的平均PRE为8.06%。对比上述3类定标模型,内标-CARS-LSSVM定标模型性能最优,内标法建立的定标模型次之,而基本定标法建立的定标模型最差。由此可知,CARS方法可以有效筛选倍硫磷相关的重要变量,内标法结合CARS及LSSVM方法可以改善定标模型性能,提高预测精度。  相似文献   

13.
为了实现库尔勒香梨依据可溶性固体含量(SSC)分级定等和按质论价,推动采后处理向标准化、产业化方向健康发展,利用高光谱成像技术研究出了一种快速、有效、无损检测库尔勒香梨SSC的方法。以表面无损伤的157个库尔勒香梨作为研究样本,应用高光谱成像采集系统获取400~1 000 nm波长范围内高光谱图像并用ENVI5.3软件提取感兴趣区域(ROI),获得高光谱数据。采用Kennard-Stone(KS)样本集划分方法将全部样本按照2∶1的比例划分为校正集(105)和预测集(52)。对比标准变量变换(SNV)、多元散射校正(MSC)、一阶导数(FD)和二阶导数(SD)等数据预处理方法对建模精度的影响,最终选用SNV方法对光谱曲线进行平滑去噪。该研究提出竞争性自适应重加权算法与平均影响值算法的组合算法(CARS-MIV)选择特征波长。在竞争性自适应重加权算法(CARS)方法中,建模样本由蒙特卡罗算法随机选择生成,变量回归系数会随之发生变化,因而回归系数的绝对值不能全面反映变量重要性,从而影响模型检测精度。为降低这种影响,应用平均影响值(MIV)算法对选出的自变量进行二次筛选,筛选出相关性较大的变量用以建模分析,并与CARS、连续投影算法(SPA)、蒙特卡罗无信息变量消除算法(MCUVE)等经典特征波长选择算法进行比较。最后分别以全波长(FS)光谱信息和四种特征波长选择方法得出的光谱信息作为输入矢量,应用支持向量回归(SVR)建立库尔勒香梨可溶性固体含量定量预测数学模型,以校正集相关系数(Rc)、校正集均方根误差(RMSEC)、预测集相关系数(Rp)和预测集均方根误差(RMSEP)四个参数来评估模型的预测精度。比较分析发现,CARS-MIV-SVR模型效果最佳,校正集相关系数(Rc)为0.985 94,预测集相关系数(Rp)达到0.946 31,校正集和预测集均方根误差分别为0.185 85和0.403 33。结果证明:CARS-MIV特征波长选择方法能够有效增强库尔勒香梨光谱数据特征波长选择的稳定性和精确性,提高模型的预测精度。利用高光谱技术结合CARS-MIV-SVR模型能够满足库尔勒香梨可溶性固体含量测定需求,实现库尔勒香梨的分级定等和按质论价。  相似文献   

14.
西瓜可溶性固形物含量的无损检测对提升其内部品质十分重要。为实现近红外光谱对小型西瓜表面各部位可溶性固形物含量的准确预测,减小检测部位差异对预测模型的影响,以“京秀”西瓜为研究对象,分别采集赤道、瓜脐和瓜梗三部位的漫透射光谱信息,利用偏最小二乘算法(PLS)建立并比较单一检测部位和混合所有检测部位的西瓜可溶性固形物近红外光谱预测模型,并分别采用连续投影算法(SPA)和竞争性自适应重加权算法(CARS)对西瓜可溶性固形物近红外光谱变量进行特征波长筛选。结果显示,相比于单一检测部位的模型,混合所有检测部位的校正集样本建立的模型取得了较优的预测结果。同时,利用CARS算法筛选的42个特征波长变量建模,对三种检测部位预测集样本的预测结果分别为赤道RP=0.892和RMSEP= 0.684 °Brix,瓜脐RP=0.905和RMSEP= 0.629 °Brix,瓜梗RP=0.899和RMSEP= 0.721 °Brix。模型得到了很大的简化,且预测精度较高。比较发现,利用SPA算法筛选的19个特征波长变量所建模型的预测精度较低。利用三种检测部位的西瓜样本建立的PLS混合预测模型,结合CARS算法进行有效特征波长变量筛选,可提高西瓜可溶性固形物预测模型的精度,实现西瓜表面各部位可溶性固形物含量的准确预测,减小检测部位差异对近红外光谱预测模型的影响。结果为今后开发便携式设备检测西瓜表面各部位可溶性固形含量提供参考依据。  相似文献   

15.
快速测量十六烷值对检测柴油品质及控制炼制工艺具有重大意义。首先对采集到的381份柴油样品进行近红外可见光谱波段全光谱扫描,利用小波分析(WT)对原始数据进行去噪声处理,应用竞争性自适应重加权算法(CARS)进行特征波长选择,将CARS提取的22个特征波长输入至LS-SVM预测模型,决定系数r2为0.723,预测均方根误差RMSEP为1.878%。结果表明,使用WT-CARS变量选择算法获取光谱特征波长,结合LS-SVM建模,可以快速、准确的测量柴油中的十六烷值,为进一步实现柴油十六烷值的在线检测以及其他性能参数的快速测定奠定了基础。  相似文献   

16.
无论是近红外还是红外光谱,多元校正模型的传递问题都尚未解决。为了实现模型和光谱的传递,提出了一种改进的PDS算法——SA-PDS算法,论方法通过PDS算法进行模型传递,使用光谱间的夹角大小作为判定准则来选择传递参数,使得模型传递过程不受到样品性质参考值的影响,也不再依赖于模型,并且可以双向传递。该方法分别通过在近红外数据和中红外数据中应用来证明模型传递的可行性,实验收集烟叶样本测得其近红外光谱,沥青样本测得其中红外光谱,将烟叶总糖会计师和沥青蜡含量作为模型预测对象。使用光谱夹角作为PDS参数选择标准与使用预测标准偏差作为判定准则相比,实验表明:对于近红外光谱的从机向主机的传递,其验证集预测精密度RMSEP从5.257 4降低至1.337 1,优于RMSEP(1.350 3)方法,预测偏差也同样被改善。对于中红外光谱从机向主机的传递,新方法验证集预测精密度RMSEP从0.525 1降低至0.186 9,优于RMSEP(0.219)方法。主机向从机的传递也取得了满意的传递结果。  相似文献   

17.
X射线荧光光谱分析作为一种以化学计量学为基础的定量分析技术,所建立模型优劣对结果的预测准确性显得十分重要。竞争性自适应重加权算法(CARS)采用自适应重加权采样技术,利用交互验证选出互验证均方根误差(RMSECV)值最低原则,寻出最优变量组合。为了进一步提高PLS模型的解释和预测能力,将竞争性自适应重加权算法(CARS)与X射线荧光光谱分析技术相结合,对土壤中重金属元素铅和砷进行特征波长变量筛选后建立偏最小二乘(PLS)模型。首先,利用CARS算法对铅含量密切相关的波长变量进行筛选,当采样次数为26次时,筛选出60个有效波长点;对砷含量密切相关的波长变量进行筛选,当采样次数为34次时,筛选出19个有效波长点;然后对优选出的波长点利用PLS方法分别建立土壤中铅和砷含量定量分析模型,并与经连续投影算法(SPA)及蒙特卡罗无信息变量消除(MC-UVE)方法波长变量筛选后所建立的PLS模型进行比较。结果显示:铅的CARS-PLS模型的预测集决定系数(R2)、交互验证均方根误差(RMSECV)、预测均方根误差(RMSEP)和相对预测误差(RPD)分别为0.995 5,2.598 6,3.228和9.401 1,砷的CARS-PLS模型的预测集R2,RMSECV,RMSEP和RPD分别为0.989 9,3.013 2,2.737 1和8.211 6;两元素的CARS-PLS模型性能均优于全波段PLS,SPA-PLS和MC-UVE-PLS模型。基于CARS-PLS的算法可以有效筛选出X射线荧光光谱特征波长点,在简化了建模复杂程度的同时,提高了模型的准确性和稳健性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号