首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 171 毫秒
1.
将经典的卡尔曼滤波器与近红外光谱分析技术相结合,提出了一种新的特征波长变量选择方法——卡尔曼滤波法。分析了卡尔曼滤波器用于波长优选的原理,设计了波长选择算法并将其应用到大豆油脂酸价的近红外光谱检测中。首先利用偏最小二乘法(PLS)对油脂不同吸收波段建模,初步筛选出4 472~5 000 cm-1油脂酸价特征波段共132个波长点,然后进一步利用卡尔曼滤波器进行特征波长选择,从中优选出22个特征波长变量建立PLS校正模型,预测集决定系数R2、预测误差均方根RMSEP分别为0.970 8和0.125 4,与利用132个波长点建立的校正模型预测结果相当,而波长变量数减少到原来的16.67%。该波长变量选择算法是一种确定性的迭代过程,无复杂的参数设置和变量选择的随机性,物理意义明确。优选出少数对模型影响较大的特征波长变量以代替全谱建模,在简化模型的同时提高了模型的稳健性,为开发专用油脂近红外光谱分析仪器提供了重要参考依据。  相似文献   

2.
探讨了可见-近红外光谱技术快速无损识别不同品牌车蜡的可行性。实验一共获得104 样本,其中40个样本(建模集)用于建立模型,剩余64个样本(预测集)被用于独立验证建立好的模型。基于五种不同品牌车蜡的可见-近红外光谱分别建立了线性判别分析(linear Discriminant Analysis,LDA)和最小二乘支持向量机(least square-support vector machine, LS-SVM)模型。基于两个算法的全波段光谱模型的预测集正确率分别达到了84%和97%。进一步采用连续投影算法(successive projections algorithm, SPA)算法从751波段中选取了7个特征波段(351, 365, 401, 441, 605, 926和980 nm)。基于SPA选择的变量建立LS-SVM模型,准确率依然保持在97%。说明SPA选择的特征波段包含了对于车蜡品牌鉴别最重要的光谱信息,而大多数无用信息则被有效剔除。将SPA与LS-SVM算法的车蜡识别模型在保证正确率的基础上,还可以大大降低模型计算复杂程度,说明该模型能快速准确的从车蜡可见-近红外光谱中提取有效信息,并实现车蜡品牌的无损鉴别。  相似文献   

3.
应用近红外高光谱成像技术实现三文鱼肉水分含量的快速无损检测。采集来自不同部位的三文鱼肉共90个样本的高光谱图像,提取样本感兴趣区域(ROI)的平均光谱。随机取60个样本作为建模集,其余30个样本作为预测集。分别采用偏最小二乘回归(PLSR)和最小二乘支持向量机(LS-SVM)对全波段和水分含量建立相关性模型,并对预测集样本的水分含量进行预测。再用一种新的变量提取方法random frog选择特征波长,并基于特征波长分别建立水分检测的PLSR和LS-SVM模型。特征波长模型的预测精度虽然稍逊于全波段模型,但是仅用12个变量代替了全波段的151个变量,大大简化了模型,更便于实际应用。PLSR和LS-SVM特征波长模型的预测相关系数(Rp)分别为0.92和0.93,预测均方根误差(RMSEP)分别为1.31%和1.18%,取得了满意的结果。研究表明,近红外高光谱成像与化学计量学方法结合可以准确预测三文鱼肉的水分含量,为鱼肉品质的快速监测提供重要的参考。  相似文献   

4.
采用可见/近红外光谱对丙酯草醚胁迫下大麦叶片过氧化氢酶(catalase, CAT)与过氧化物酶(peroxidase, POD)含量预测进行研究。对500~900 nm光谱采用移动平均法(moving average, MA)11点平滑方法进行预处理。采用蒙特卡罗-偏最小二乘法(monte carlo-partial least squares, MCPLS)方法分别对于CAT与POD的含量预测剔除7个与8个异常样本。基于全部光谱建立了CAT与POD含量预测的PLS,最小二乘支持向量机(least-squares support vector machine, LS-SVM)与极限学习机(extreme learning machine, ELM)模型,ELM模型对CAT含量预测效果最好,建模集相关系数(correlation coefficient of calibration, Rc)为0.916,预测集相关系数Rp为0.786;PLS模型对POD含量预测效果最佳,Rc为0.984,Rp为0.876。采用连续投影算法(successive projections algorithm, SPA)算法分别为CAT与POD预测选择了8个与19个特征波长,基于特征波长建立的PLS,LS-SVM与ELM模型中,ELM模型对CAT与POD含量预测效果均最佳,CAT含量预测的相关系数为Rc=0.928,Rp=0.790;POD含量预测的相关系数Rc=0.965,Rp=0.941。基于全谱与基于特征波长的回归分析模型预测效果相当,且对POD含量的预测效果优于对CAT含量的预测效果,而这需要进一步研究以得到精度和稳定性更高的预测模型。研究结果表明,采用可见/近红外光谱结合化学计量学方法可以实现对除草剂胁迫下大麦叶片CAT与POD含量的预测。  相似文献   

5.
基于高光谱技术的玉米种子可视化鉴别研究   总被引:2,自引:0,他引:2  
种子纯度是衡量种子品质的重要指标。提出一种基于近红外(874~1 734 nm)高光谱技术实现玉米种子可视化鉴别的方法。采集4个品种共384个玉米种子样本的高光谱图像数据,随机选择288个样本作为建模集,剩余96个样本作为预测集。对玉米种子光谱曲线进行分析后,通过连续投影算法(SPA)选取7个特征波段作为输入,结合偏最小二乘法判别分析(PLS-DA)模型,对预测集进行预测,获得较好的分类效果,其中RC=0.917 7,RMSECV=0.444 2; RCV=0.911 5,RMSECV=0.459 9,建模集和预测集的总体鉴别率分别为78.5%和70.8%。通过图像处理技术提取高光谱图像中每个玉米颗粒的平均光谱数据,输入建立的SPA-PLS-DA模型,在计算生成的鉴别图中以不同颜色标识不同类别,实现了混杂玉米种子样本的可视化鉴别。对3份不同组成的混杂种子样本进行鉴别,达到了较好的可视化效果。结果表明,通过可视化鉴别技术,可以直观方便地观察混杂种子样本中不同品种种子的分布和数量,为农业生产中种子的纯度鉴别和筛选提供了帮助。  相似文献   

6.
基于近红外光谱的淡水鱼新鲜度在线检测方法研究   总被引:1,自引:0,他引:1  
新鲜度是反映鱼类品质以及可否食用的重要指标,在线检测直接关系到食品质量与安全的实施应用,因此对淡水鱼新鲜度进行在线无损检测具有重要意义。应用近红外光谱对淡水鱼新鲜度进行在线检测,试验装置采用自行搭建的淡水鱼近红外光谱在线采集装置,试验时样品在输送链上以0.5 m·s-1的速度运动,采集其近红外漫反射光谱(900~2 500 nm),并用支持向量机(support vector machine, SVM)建立淡水鱼新鲜度在线检测模型。采用光谱理化值共生距离(sample set partitioning based on joint X-Y distance algorithm, SPXY)算法对样本集进行划分,其中校正集111条(新鲜57条,变质54条)、测试集37条(新鲜19条,变质18条),通过对比不同的光谱预处理方法对预测结果的影响,明确了一阶导结合标准化预处理为最优光谱预处理方法,经过该方法预处理后所建模型对校正集的正确识别率为97.96%,对测试集的识别率为95.92%。为了提高模型运行速度对建模所用光谱变量进行优化,分别采用遗传算法(genetic algorithm, GA)、连续投影算法(successive projection algorithm, SPA)和竞争性自适应重加权算法(competitive adaptive reweighed sampling algorithm, CARS) 三种不同的特征变量选择方法对特征波长进行筛选,通过建模比较分析确定CARS为最优波长选择方法,以所选的10个特征波长建立淡水鱼新鲜度支持向量机检测模型,模型对校正集的正确识别率为100%,对测试集的识别率为93.88%。该研究可为近红外光谱用于淡水鱼新鲜度在线检测提供技术支持。  相似文献   

7.
为了对鸡种蛋胚胎进行雌雄识别,探究利用紫外-可见-近红外透射光谱进行鸡胚雌雄识别的可行性,搭建了鸡种蛋透射光谱检测系统,采用横向和竖向大头朝上2种放置方式获取210枚鸡种蛋孵化0~15 d的光谱,光谱范围为360~1 000 nm。构建极限学习机(ELM)鸡胚雌雄识别模型,通过比较不同放置方式和孵化天数下模型的识别准确率,发现竖向放置且孵化第7 d的识别效果最好;将竖向放置孵化第7 d的光谱初步分为紫外(360~380 nm)、可见光(380~780 nm)、近红外(780~1 000 nm)、紫外-可见光(360~780 nm)和全波段(360~1 000 nm)5个不同的波段范围来分析,预测集准确率分别为82.86%,77.14%,75.71%,84.29%和81.43%,筛选出360~780 nm的紫外-可见光波段为有效波段;在紫外-可见光(360~780 nm)波段,采用多元散射校正(MSC)去噪,并用竞争性自适应重加权采样算法(CARS)和连续投影算法(SPA)筛选特征波长降维,建立不经筛选特征波长、CARS筛选特征波长和SPA筛选特征波长的3种ELM模型。其中不经筛选特征波长的ELM模型识别效果最好,但输入变量最多,隐含层神经元为680且激活函数为sig时,预测集准确率为84.29%。SPA筛选特征波长的ELM模型识别效果次之,输入变量有9个,隐含层神经元为840且激活函数为hardlim时,预测集准确率为81.43%。CARS筛选特征波长的ELM模型识别效果最差,输入变量有27个,隐含层神经元为100且激活函数为sig时,预测集准确率为78.57%;用遗传算法(GA)优化ELM模型的权值变量和隐含层阈值,不经筛选特征波长建立的GA-ELM模型,预测集准确率为87.14%,SPA筛选特征波长建立的GA-ELM模型,预测集准确率为87.14%,CARS筛选特征波长建立的GA-ELM模型,预测集准确率为81.43%。紫外-可见光波段不经筛选特征波长的GA-ELM模型识别效果和经SPA筛选特征波长的GA-ELM模型相同,表明SPA筛选的特征波长变量能够有效反映360~780 nm波段的信息,SPA使用的变量数仅占紫外-可见光波段的2.14%,因此,雌雄识别最佳模型为紫外-可见光波段经SPA筛选特征波长的GA-ELM模型,预测集准确率为87.14%,其中,雌性识别率为88.57%,雄性识别率为85.71%,单个样本平均判别时间0.080 ms。结果表明紫外-可见透射光谱技术和ELM模型为孵化早期鸡胚蛋雌雄识别提供了一种可行方法。  相似文献   

8.
西瓜可溶性固形物含量的无损检测对提升其内部品质十分重要。为实现近红外光谱对小型西瓜表面各部位可溶性固形物含量的准确预测,减小检测部位差异对预测模型的影响,以“京秀”西瓜为研究对象,分别采集赤道、瓜脐和瓜梗三部位的漫透射光谱信息,利用偏最小二乘算法(PLS)建立并比较单一检测部位和混合所有检测部位的西瓜可溶性固形物近红外光谱预测模型,并分别采用连续投影算法(SPA)和竞争性自适应重加权算法(CARS)对西瓜可溶性固形物近红外光谱变量进行特征波长筛选。结果显示,相比于单一检测部位的模型,混合所有检测部位的校正集样本建立的模型取得了较优的预测结果。同时,利用CARS算法筛选的42个特征波长变量建模,对三种检测部位预测集样本的预测结果分别为赤道RP=0.892和RMSEP= 0.684 °Brix,瓜脐RP=0.905和RMSEP= 0.629 °Brix,瓜梗RP=0.899和RMSEP= 0.721 °Brix。模型得到了很大的简化,且预测精度较高。比较发现,利用SPA算法筛选的19个特征波长变量所建模型的预测精度较低。利用三种检测部位的西瓜样本建立的PLS混合预测模型,结合CARS算法进行有效特征波长变量筛选,可提高西瓜可溶性固形物预测模型的精度,实现西瓜表面各部位可溶性固形物含量的准确预测,减小检测部位差异对近红外光谱预测模型的影响。结果为今后开发便携式设备检测西瓜表面各部位可溶性固形含量提供参考依据。  相似文献   

9.
LS-SVM的梨可溶性固形物近红外光谱检测的特征波长筛选   总被引:2,自引:0,他引:2  
为提高梨可溶性固形物含量(soluble solids content,SSC)的近红外光谱模型的精度和稳定性,以160个梨样品为实验对象,分别对原始光谱、多元散射校正(MSC)和标准正态变量变换(SNV)处理后的光谱,经无信息变量消除算法(UVE)挑选后,再结合遗传算法(GA)和连续投影算法(SPA),筛选梨可溶性固形物的近红外光谱特征波长。将筛选后的波长作为输入变量建立梨可溶性固形物的最小二乘支持向量机(LS-SVM)模型。结果表明经过SNV-UVE-GA-SPA从全波段3112个波长中筛选出的30个特征波长建立的梨可溶性固形物LS-SVM模型效果最好,该模型的预测集相关系数(Rp)和预测均方根误差(RMSEP)分别为0.956和0.271。该模型简单可靠,预测效果好,能满足梨的可溶性固形物含量的快速检测,为在线检测和便携式设备开发提供了理论基础。  相似文献   

10.
基于高光谱成像技术的油菜叶片SPAD值检测   总被引:11,自引:0,他引:11  
以油菜叶片为研究对象,利用高光谱成像技术,成功建立了叶绿素相对值SPAD值的预测模型。共采集了160个油菜叶片样本在380~1030 nm范围内的高光谱图像。选择500~900 nm之间的平均光谱作为油菜叶片样本的光谱。利用蒙特卡罗最小二乘法(monte carlo partial least squares, MC-PLS)剔除了13个异常样本,基于剩余的147个样本光谱数据与SPAD测量值进行分析,采用了不同的方法建立了多种预测模型,包括:全光谱的偏最小二乘法(partial least squares, PLS)模型,连续投影算法(successive projections algorithm, SPA)选择特征波长的PLS预测模型,“红边”位置(λred)的简单经验估测模型,三种植被指数R710/R760,(R750-R705)/(R750-R705)和R860/(R550*R708)分别建立的简单经验估测模型,以及基于这三种植被指数的PLS预测模型。建模结果显示,全光谱的PLS模型预测效果最为精确,其预测相关系数rp为0.833 9,预测均方根误差RMSEP为1.52。而使用SPA算法选出的8个特征波长所建立的PLS模型其预测结果可达到与全光谱的PLS模型非常接近的水平,而且在保证一定精度的条件下减少了大量运算,节省了运算时间,大幅提高了建模的速度。而基于红边位置和选择的三种植被指数而建立的简单经验估计模型其预测结果虽与基于全光谱的PLS预测模型有一定差距,但模型简单、运算量小,适合用于对精度要求不高的场合,对后续的便携仪器设备开发有一定的指导作用。  相似文献   

11.
将经验模态分解(EMD)和连续投影算法(SPA)结合用于面粉过氧化苯甲酰(BPO)添加量的近红外光谱检测分析中。在波长898~1 725 nm范围内采集添加了BPO的面粉样本光谱,先通过EMD分解法对其进行噪声预处理,然后利用SPA算法提取光谱特征波长。EMD处理后的光谱建模精度比原始光谱建模精度大大提高,通过SPA算法从512个波长中提取了7个特征波长,基于特征波长建立的模型,与EMD处理后全波长建模结果相比,建模波长个数大幅缩减,但是模型精度与全谱建模相当,结果表明:EMD和SPA结合可有效用于面粉BPO检测的光谱去噪和特征波长提取,该结果为开发便携式面粉BPO检测仪提供了参考和依据。  相似文献   

12.
智能优化算法应用于近红外光谱波长选择的比较研究   总被引:3,自引:0,他引:3  
近红外光谱(NIRS)是一种间接分析技术,其应用需建立相应的校正模型。为了提高模型的解释能力、预测准确度和建模效率,需要对NIRS进行波长选择,优选最小化冗余信息。智能优化算法是以生物的行为方式或物质的运动形态为背景,经过数学抽象建立算法模型,通过迭代计算来求解组合最优化问题,其核心策略是以某种目标函数为标准,基于多元校正建模并以逐步逼近的方法筛选出有效的波长点。选用蚁群优化(ACO)、遗传优化(GA)、粒子群优化(PSO)、随机青蛙(RF)和模拟退火(SA)5种智能优化算法对烟叶总氮和烟碱近红外光谱数据进行特征波长选择,结合偏最小二乘(PLS)算法,构建了多个烟叶总氮和烟碱的校正模型,结果显示:所选用两个数据集的总氮最优模型分别为PSO-PLS和GA-PLS模型,烟碱最优模型分别为GA-PLS和SA-PLS模型,五种智能优化算法所建模型预测性能并非全部优于全谱PLS模型,但是通过智能优化算法进行波长选择后建立的PLS模型大大简化,模型的预测精度、可解释性和稳定性均有所提高。同时也对优选波长进行了解释和分析,烟叶总氮特征波长优选组合为4 587~4 878和6 700~7 200 cm-1;烟叶烟碱特征波长优选组合为4 500~4 700和5 800~6 000 cm-1,优选出来的特征波长具有实际物理意义。  相似文献   

13.
为实现近红外光谱进行勾兑梨汁中原汁含量的快速检测,采用相同可溶性固形物含量的新鲜梨汁和果汁粉冲剂按照原汁含量为0%~100%进行勾兑,并结合遗传算法(GA)、粒子群算法(PSO)以及萤火虫算法(GSO & FA)进行特征波长筛选,比较分析四种算法分别建立的偏最小二乘(PLS)模型。结果表明,GA-PLS,PSO-PLS,GSO-PLS,FA-PLS四种模型均能够剔除大部分波长变量,其中以FA-PLS模型效果最佳,不仅保证模型的稳健性,而且简化了模型,提高了预测的精度。为了进一步优选特征波长,利用连续投影算法(SPA)在FA基础上做进一步波长筛选,并比较全波段PLS,SPA-PLS,FA-PLS,FA-SPA-PLS模型,四种模型泛化能力为:FA-PLS>PLS>FA-SPA-PLS>SPA-PLS,其预测均方根误差分别为0.029 1,0.033 3,0.033 9和0.137 0,相应的波长变量数量依次367,765,20和18。其中SPA-PLS波长变量最少,但预测误差远远高于其他三种模型,综合考虑预测精度与波长变量数目,FA-SPA-PLS模型不仅波长变量较少而且预测精度较高,能够有效鉴别勾兑梨汁中原汁含量。研究利用近红外光谱技术为快速鉴别勾兑果汁提供一种有益思路,并通过波长变量筛选简化定量分析模型。  相似文献   

14.
基于连续投影算法的土壤总氮近红外特征波长的选取   总被引:13,自引:0,他引:13  
讨论了如何利用连续投影算法提取土壤总氮的近红外特征波长.使用连续投影算法对光谱数据进行初步压缩,将优选出的波长按其对总氮贡献值的大小进一步筛选,剔除不敏感的波长,降低模型的复杂度.分析85份土壤样品的近红外光谱,使用连续投影算法得到了总氮的12个波长,贡献值筛选后,波长数量减少到6个,所建模型的预测相关系数(Rp)为0.913,预测均方根误差(RMSEP)为0.011%,模型的预测精度与贡献值筛选前相当,且优于全谱偏最小二乘回归结果.结果表明结合贡献值筛选的连续投影算法能够有效选取待测成分的特征波长,文章所优选的土壤总氮的6个特征波长可以作为小型滤光片式近红外光谱仪波长选择的参考依据.  相似文献   

15.
目前,近红外光谱(NIRS)可以实现种子活力的快速、无损检测,但区分的活力等级一般少于3级且精度不高。建立种子活力多等级、高精度的NIRS检测模型,解决活力等级增加与预测模型精度之间的矛盾是现阶段近红外种子活力检测的主要任务。以玉米种子为研究对象,采用人工老化的方法获得5种活力等级的种子样本并采集对应的光谱数据建立反向神经网络(BP)预测模型。为了提高模型的精度和稳健性,提出一种耦合平均影响值-连续投影特征波长提取算法(MIVopt-SPAsa)。该算法针对连续投影算法(SPA)耗时过长的问题,采用平均影响值算法(MIV)对其预降维。MIV方法实现了对波长影响值的排序,但缺乏选取波长影响阈值的指标,因此引入相对距离比对MIV算法进行优化(MIVopt),实现特征波长范围的有效分割。针对SPA提取特征变量数目确定的问题,设定了特征波长数目范围并在此范围内优中选优,实现了自适应的SPA(SPAsa)特征提取。使用耦合MIVopt-SPAsa算法对具有1 845个波长的玉米种子近红外全谱数据进行特征提取,提取出特征波长37个,主要分布在玉米种子近红外光谱的7个主要吸收峰附近,表明该算法可以有效提取出与玉米种子生化物质近红外吸收特性一致的特征波长。为了测试该算法对模型性能的影响,建立了全谱BP模型、MIV-BP模型、SPAsa-BP模型、MIVopt-SPAsa-BP模型和竞争自适应重加权CARS-BP模型对5个等级的玉米种子活力进行分级,MIVopt-SPAsa-BP模型的预测平均准确率可达99.1%,预测精度高于其他模型;其计算平均时间为14.382 s,低于MIV-BP模型的计算时间(24.523 s)、CARS-BP模型的计算时间(97.226 s)和SPAsa-BP模型的计算时间(101.224 s),但高于全谱模型的平均计算时间(0.253 1 s);其最佳表现交叉熵为0.007 892,远远低于另外4个模型。实验结果表明:MIVopt-SPAsa算法可以有效地提高玉米种子活力近红外检测模型的精度,实现种子活力多等级、精确、无损检测,为种子活力检测模型的优化提供参考。  相似文献   

16.
多分类器融合提取土壤养分特征波长   总被引:2,自引:0,他引:2  
光谱已经应用于土壤养分速测的分析,但是如何寻找土壤光谱特征波段,尽最大可能避免无用信息干扰、保留有用信息,建立准确度高、预测效果好的模型仍是一个亟需解决的问题。以青岛三个不同地区土壤样品为例,测定土壤样品的紫外-可见-近红外光谱及其总碳(TC)、总氮(TN)、总磷(TP)含量;分别采用连续投影算法(SPA)、无信息变量消除法(UVE)、遗传算法(GA)、相关系数法(CC)四种算法(四种单分类器)对土壤光谱提取特征波长;再引入投票法和加权投票法的多分类器融合方法将四种算法融合得到特征波长;以偏最小二乘回归(PLSR)建立各土壤养分含量的模型,通过对模型效果的评价标准(建模集绝对系数R2c、校正均方根误差RMSEC、检验集绝对系数R2p、预测均方根误差RMSEP和相对分析误差RPD值)来判别各单分类器算法和多分类器融合算法对土壤养分含量特征波长的提取效果。分别对四种算法、筛选其中三种算法、最优二种算法进行融合,分析融合后模型效果和特征波长个数,结果表明:将四种单分类器经投票法融合后,其模型效果大部分不如单分类器,且相对好的模型特征波长个数较多;相较于投票法多分类器融合,四种单分类器经加权投票法融合模型效果有了一定的提高,TC和TN都能够在较少的波长中获得较好的预测效果,但仅TN经融合后,模型效果优于每个单分类器;TC,TN,TP分别在取SPA+UVE+GA,SPA+UVE+GA(或SPA+GA+CC)、SPA+UVE+GA三种单分类器进行加权投票法融合后,均能获得最优模型效果,且明显优于每个单分类器,模型效果有了显著提高;各土壤养分含量经两个最优单分类器加权投票法融合后,仍能得到好于最优单分类器的建模效果,TC和TP建模效果略差于三个单分类器融合结果,TN建模效果与三个单分类器融合结果相同。因此,在筛选三种算法融合,且其中包含最优两种算法的情况下,能够以较少的特征波长个数获得明显高于单分类器的建模效果。该方法为寻找土壤养分以及其他复杂物质成分的光谱特征波段提供了新方法,也为多种算法的综合运用提供了新思路。  相似文献   

17.
使用近红外光谱鉴别蚕茧雌雄设备成本较高,挑选有用特征可以减少成本。雌雄蚕茧的近红外光谱存在着共线性的关系,因此提出了一种包裹式的特征选择方法,基于支持向量机的自助重加权采样(BRS-SVM)的特征选择方法。使用NirQuest512近红外光谱仪采集了蚕茧的漫透射近红外光谱。用试验集的全波段建模得到特征重要度热图,并通过热图得到重要特征波段的范围。然后在重要特征波段范围内,分别用BRS-SVM、基于SVM的特征排序方法(MBR-SVM)、基于逻辑回归的特征排序方法(MBR-LR)、递归特征消除法(RFE)、连续投影算法(SPA) 和遗传算法(GA)挑选单波段特征和连续波段面积特征,再分别用支持向量机(SVM)和逻辑回归(LR)建立雌雄分类模型。通过特征重要性热力图发现,蚕茧雌雄分类重要区域在900~1 399 nm内,用此波段范围建立SVM模型,试验集准确率为99.40%。用BRS-SVM挑选5个单波段特征,然后再用SVM建模,验证集准确率为93.88%,高出其他特征选择方法5%~12%,测试集准确率为89.56%,测试集准确率高出其他特征选择方法2%~4%。用BRS-SVM挑选27个单波段特征,建立SVM雌雄分类模型测试集准确率为94.97%,准确率达到生产条件要求。用BRS-SVM挑选的14个连续波段面积特征,再用SVM建模,测试集准确率为94.43%。在挑选少量特征情况下,我们提出的BRS-SVM要优于其他方法。用BRS-SVM挑选少量的特征,可以建立性能良好的蚕茧雌雄分类模型,有效减少了成本,具有重要的现实意义。  相似文献   

18.
研究了中红外光谱预测香菇蛋白质含量的可行性。去掉明显噪声部分后,研究香菇3 581~689 cm-1中红外光谱与蛋白质含量的关系。以Savitzky-Golay(SG)5点平滑预处理光谱建立偏最小二乘法(partial least squares, PLS)的预测模型的效果不理想,模型的建模集和预测集的相关系数均高于0.85,但剩余预测偏差(residual prediction deviation, RPD)值仅为1.77。采用连续投影算法(successive projections algorithm, SPA)算法从3000个波数点中选择7个特征波数,并以七个特征波数分别建立PLS、多元线性回归(multiple linear regression, MLR)、反向传播神经网络(back-propagation neural network, BPNN)和极限学习机模型(extreme learning machine, ELM)。与全谱的PLS相比,以特征波数的PLS模型和MLR模型的预测效果相对较差,而以特征波数的BPNN和ELM模型的预测效果相对较好。其中SPA-ELM模型的预测效果最佳,预测集相关系数(correlation coefficient of prediction)Rp=0.899 5,预测集均方根误差(root mean square error of prediction)RMSEP=1.431 3,剩余预测偏差RPD=2.18。研究结果表明,中红外光谱分析技术可以用于预测香菇蛋白质含量,且SPA选取特征波数能用来代替原始光谱进行建模分析,为香菇蛋白质含量的检测提供了新的思路。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号