首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 491 毫秒
1.
分别基于近红外和电子鼻融合数据、近红外数据以及电子鼻数据建立判别烟叶清香型、中间香型和浓香型三种香型风格的定性判别模型,结果表明虽然三种模型的建模准确率差异不大,都超过了89.00%,但基于融合数据建立的模型对中间香型和浓香型的预报准确率分别为82.67%和80.00%,比仅仅利用近红外数据建立模型的72.41%和73.33,也比仅仅基于电子鼻数据建立模型的68.97%和53.33%都有明显的提高。融合后预报准确率提高的可能原因是:电子鼻风味分析仪对于影响中间香型和浓香型的烟叶致香成分感应更加灵敏,捕获的信息也更多,这些新的信息可以作为NIR数据信息的有利补充,可用于建立烟叶香型分类判别准确率更高的模型。同时本研究还基于相同的融合数据,对比不同数据挖掘算法建模和预报结果差异性。实验结果表明:人工神经网络的建模结果高于支持向量机建模,人工神经网络模型的预报结果准确率只有65.00%,远低于支持向量机模型的预报结果的83.75%。这也验证了支持向量机算法可以在建模过程中减少过拟合。该研究可以为快速鉴别烟叶香型风格提供支撑,而且随着研究的深入可以争取为烟草系统的专业评吸人员提供辅助的鉴别方法。  相似文献   

2.
以全国17个主要烤烟产地省份中收集的3 914个烟叶样品的近红外光谱为实验对象,其中浓香型、中间香型、清香型烟叶光谱分别865条、1 403条、1 646条,应用近红外光谱和多算法融合方法分析其香型风格特征。在以产地进行初步划分烟叶香型以及认可过渡型和非典型香型类型的基础上,选取基于主成分及Fisher准则的投影法(PPF)、偏最小二乘判别(DPLS)、支持向量机(SVM)作为单分类器,得到各个算法第1和2判别分析结果;应用PPF-DPLS-SVM融合和各算法第1和2判别分析结果,将预测验证样品的分析结果详细划分为典型、过渡型、非典型香型样品(分别为493,392,115个);其中典型香型烟叶样品的判别准确率达到92.7%,较未进行典型样品划分时PPF,DPLS,SVM单算法的识别准确率分别提高了30.2%,15.4%,16.6%。样品数据来源于全国主要烤烟产地,数据量大,代表性较好,分析结果具有一定普遍性;提出的多算法融合分析方法大幅度提高了通过客观数据判别烤烟香型的准确率;同时,将烤烟香型细划分为典型、过渡型和非典型香型的方式,对烤烟烟叶原料的科学合理利用以及烟叶原料的模块化工业加工等有指导作用。  相似文献   

3.
提出了一种基于烟叶近红外光谱(NIR)和烟叶电子鼻(EN)融合数据的烟叶年份判别的支持向量机分类模型。在NIR和EN数据融合的基础上,利用遗传算法来进行变量选择,再建立烟叶年份判别支持向量机模型,所得到的烟叶判别模型在训练集和独立测试集上都具有较高的准确率。建立的烟叶判别NIR-ESVM模型的建模准确率达到100%,留一法准确率达到98.55%,对未知样本的预报准确率为90%。  相似文献   

4.
提出了一种基于烟叶近红外光谱(NIR)和烟叶电子鼻(EN)融合数据的烟叶年份判别的支持向量机分类模型。在NIR和EN数据融合的基础上,利用遗传算法来进行变量选择,再建立烟叶年份判别支持向量机模型,所得到的烟叶判别模型在训练集和独立测试集上都具有较高的准确率。建立的烟叶判别NIR-E-SVM模型的建模准确率达到100%,留一法准确率达到98.55%,对未知样本的预报准确率为90%。  相似文献   

5.
葡萄酒带有浓厚的葡萄原产地地域特点与个性,快速准确地判别葡萄酒原产地具有重要意义,感官评定的方法存在一定的局限性。提出用贝叶斯信息融合技术将葡萄酒样品的近红外透射光谱及中红外衰减全反射光谱联立进行葡萄酒原产地判别的方法。分别用近、中红外光谱仪采集来自中国四个不同葡萄主栽产地(河北怀来、山东烟台、甘肃、河北昌黎)的153个葡萄酒样品的近红外透射光谱和中红外衰减全反射光谱,然后用偏最小二乘判别分析法(PLS-DA)分别建立基于近红外光谱和中红外光谱的葡萄酒产区判别模型;该模型输出的节点值归一化后作为所有样品分属每一类别的先验概率,代入Bayes判别公式得到后验概率,根据此概率判断样品的新类别属性,即用贝叶斯信息融合技术实现了两种判别结果的修正决策。近红外和中红外融合后的模型结果为:十次随机划分建模集和检验集,四产区葡萄酒判别模型建模集的平均准确率由78.21%(近红外)和82.57%(中红外)变为融合后的87.11%,检验集平均准确率由82.50%(近红外)和81.98%(中红外)变为融合后的90.87%,均优于单独采用一种光谱技术的判别结果。实验结果表明:信息融合技术有助于模型判别效果的提高,采用近、中红外光谱的贝叶斯信息融合技术对葡萄酒原产地进行快速识别是可行的。  相似文献   

6.
应用近红外光谱投影模型法分析烟叶的产区与风格特征   总被引:1,自引:0,他引:1  
以在2003年—2012年向国内17个主要烤烟产地,五大烟叶生态产区,收集的4 733个烟叶样品的近红外光谱为试验对象, 其中浓香型烟叶光谱1 580条, 清香型2 004条, 中间香型1 149条;应用基于主成分及Fisher准则(PPF)的方法建立烟叶生态产区和风格特征的投影分析模型,以生态产区模型的分析结果阐释了烟叶香型风格划分的合理性,并依据风格特征模型得到的预测样品投影值与模型中各类投影均值之间的欧氏距离,对预测样品给出最近和次近类别及描述风格特征程度的量化分值,结合模型中各类投影值的离散度以及设定阈值,将预测结果细化为典型浓、浓偏中、中偏浓、典型中、中偏清、清偏中、典型清、清透浓、浓透清等9类或超模型范围样品;应用2102在实际复烤生产加工及各烟叶原料基地中收集的不同部位、不同产地的35个烟叶样品验证了分析结果的合理性。该种分析方式,不仅可以实现预测样品的判别分析,并且可得到关于预测样品更细化的风格特征信息,可对烟草工业企业实现原料的跨区组合及叶组配方等提供指导。  相似文献   

7.
卷积神经网络(CNN)在图像分类识别领域应用广泛,但其在近红外光谱分类中的研究还未见报道,对基于CNN的近红外光谱分类建模方法进行了研究。针对近红外光谱数据的特点,提出了一种改进的卷积神经网络建模方法,对CNN经典模型LeNet-5所做改进:①将方形矩阵卷积核改为适用于一维近红外光谱的向量卷积核;②简化网络结构,将LeNet-5结构中C5,F6及输出层改为单层感知机。同时,采用隔点采样的方法对近红外光谱降维,加快收敛速度;并对卷积核尺寸对建模结果的影响进行了研究。以我国东北、黄淮、西南三大烤烟产区的600个中部烟叶样本的近红外光谱为实验对象,建立烟叶产区分类NIR-CNN模型。该模型对训练集和测试集的判别准确率为98.2%和95%。实验结果表明,应用卷积神经网络可对近红外光谱数据准确、可靠地判别分类;烟叶产区NIR-CNN建模方法可为卷烟企业烟叶原料科学合理利用提供指导,为维护卷烟产品的质量稳定有重要意义;基于卷积神经网络的近红外光谱判别方法也可推广到其他农产品的分类应用中。  相似文献   

8.
基于红外与近红外光谱的烟叶部位识别   总被引:2,自引:0,他引:2  
以烟叶样品的红外及近红外光谱为基础,采用基于主成分分析的马氏距离判别模型,研究了不同类型仪器、建模区间、模型参数及光谱预处理方式对烟叶部位识别准确率的影响。结果表明根据红外和近红外光谱均可对烟叶部位进行良好识别,近红外光谱因包含的样品信息更为丰富,可以得到比红外光谱更好的识别效果。其中仪器A的二阶导数光谱给出的烟叶部位识别准确率最高,可达94.11%;仪器B的一阶导数及SNV光谱给出的烟叶部位识别准确率次之,为88.24%;Nicolet公司的Antaris360傅里叶红外仪的一阶导数光谱给出的烟叶部位识别准确率为82.35%。对于同一仪器,最佳建模区间及主成分个数随样本情况及光谱预处理方式而变。  相似文献   

9.
烟草是一种成分复杂的天然植物,地理位置、生长条件等外界因素直接影响着烟叶的品质;我国烟叶种植范围十分广泛,每个产区种植的烟叶都有其独特的风格特征,不同产区的烟叶配比对卷烟的质量起着决定性的作用。为实现烟叶产地准确、快速判别,基于近红外光谱(NIRS),采用灰狼算法(GWO)优化的支持向量机(SVM)算法实现烟叶产地鉴别分类。以8个产地的824个烟叶样本为研究对象,基于x-y距离样本集划分(SPXY)方法得到校正集617个和验证集207个样品。首先应用最佳波长筛选方法,如竞争自适应加权采样(CARS)和随机青蛙(RF)算法减少光谱冗余信息,最终从1 609个变量中分别获得141和534个与产地相关的重要变量,并以此输入SVM作为建模数据,接下来在相同搜索范围内比较了粒子群优化算法(PSO)、遗传算法(GA)和GWO对SVM分类模型的优化效果。结果表明,经RF筛选后的光谱变量较CARS具有更好的产地建模性能,其中RF-GWO-SVM对8个产地烟叶的整体判别正确率达到了96.62%,相较于RF-PSO-SVM和RF-GA-SVM正确率更高。同时,RF-GWO-SVM的运行时间分别比RF-PSO-SVM和RF-GA-SVM的运行时间缩短156和131 min,RF-GWO-SVM具有精度更高、寻优速度更快等优点。GWO对于SVM模型参数具有更高效的优化能力,可用于烟叶产地快速鉴别模型的建立。  相似文献   

10.
为探究中红外光谱快速检测核桃产地和品质的可行性,基于中红外光谱分析技术,并将化学计量学的算法应用于中红外光谱判别分析之中,对中国四大核桃主产区的10类主要核桃品种进行检测,取得较好效果。通过提取核桃粉末的光谱透射率,去除原始光谱首尾部分的明显噪声,对保留的700~3 450 cm-1范围的光谱采用小波分析(wavelet transform,WT)算法进行去噪预处理,并采用无信息变量消除结合连续投影算法(UVE-SPA)提取光谱特征波数,采用主成分分析法(PCA)对光谱定性分析,基于反向传播神经网络(BPNN)、极限学习机(ELM)、随机森林(RF)、径向基函数神经网络(RBFNN)及偏最小二乘判别分析(PLS-DA)对全谱和特征波数建模对比。在4类不同产地核桃判别中,得到12个特征波数:803,1 355,1 418,1 541,1 580,1 727,1 747,1 868,2 338,2 462,2 824和3 166 cm-1,基于特征波数分类的正确率高于全谱的分类结果,BPNN算法结合特征波数建模得到的识别正确率高达97%,RF算法分类判别效果最差,正确率仅69.70%;在10类不同品种判别中,得到10个特征波数:903,1 275,1 507,1 541,1 563,1 671,1 868,2 311,2 845和3 437 cm-1,基于特征波数分类的正确率依然高于全谱的分类结果,BPNN算法结合特征波数建模得到的识别正确率高达83.3%。在特征波数通用性方面,两组特征波数范围中有2个特征波数相同:1 541和1 868 cm-1,其他大多特征波数也都相近,将10类品种特征波数作为输入变量对4类不同产地的核桃进行分类,分类结果较差,因此,在10类品种监督值下选取的特征波数无法适用于4类产地的判别问题,由此推断,即使是同一原始数据,基于不同判别问题得到的特征波数在建模时通用性较差。结果表明,经UVE-SPA算法提取特征波数后,变量数可减少99%以上,有效地简化了模型,减少计算量,提高预测的稳定性;总体上,每个分类器的表现为:BPNN>RBFNN>ELM>PLS-DA>RF;基于小波变换结合特征波数选取和反向传播神经网络算法能有效地实现核桃的产地和品种识别。  相似文献   

11.
针对近红外光谱高维、高冗余、非线性和小样本等特点导致光谱相似性度量时出现的“维度灾难”,提出一种基于核映射和rank-order距离的局部保持投影(KRLPP)算法。首先将光谱数据经过核变换映射到更高维空间,有效保证了流形结构的非线性特征。然后改进局部保持投影(LPP)算法对数据进行降维操作,将rank-order距离替代传统的欧氏距离或测地线距离,通过共享邻近点的信息,得到更加准确的局部邻域关系。最后在低维空间通过距离的计算实现光谱的度量。该方法不仅有效解决了高维空间存在的“距离失效”问题,同时还提高了相似性度量结果的精度。为了验证KRLPP算法的有效性,首先根据降维前后数据集信息残差的变化确定了最佳参数近邻点的个数k和降维后的维数d。其次,从光谱降维投影效果和模型分类效果两个角度与PCA,LPP和INLPP算法进行了对比,结果表明KRLPP算法对于烟叶的部位有较好的区分能力,降维效果以及对于不同部位的正确识别率明显优于PCA,LPP和INLPP。最后,从某品牌卷烟叶组配方中选取了5个代表性烟叶作为目标烟叶,分别采用PCA,LPP和KRLPP方法从300个用于配方维护的烟叶样品中为每个目标烟叶寻找相似烟叶,并从化学成分和感官评价两方面对替换前后的烟叶及叶组配方进行了评价分析。其中LPP和KRLPP用于降维的参数选择保持一致,PCA选择前6个主成分。结果表明,由KRLPP选出的替换烟叶与替换配方在总糖、还原糖、总烟碱、总氮等化学成分以及香气、烟气、口感等感官指标上较PCA、LPP方法差异最小,相似性度量准确度最高。该方法可应用于配方产品替换原料的查找,辅助企业实现产品质量的维护。  相似文献   

12.
利用近红外光谱技术(near infrared spectroscopy,NIR)并结合化学计量学方法鉴别洋槐蜜中掺入大米糖浆的可行性研究。以来自不同蜂场的20个洋槐原料蜜样品与大米糖浆混合成7个不同浓度梯度(10∶0,9∶1,7∶3,1∶1,3∶7,1∶9,0∶10 g·g-1)共121个样品为研究对象,利用近红外光谱仪和光谱处理软件分别不同浓度梯度的对掺假样品进行光谱扫描和数据转换,并进行主成分分析(PCA),结合典型判别分析进行区分。结果表明,经过主成分分析后,前2个主成分的得分累计贡献率达97.23%,但掺假样品在第一、第二主成分得分散点图的区域划分不明显。用典型判别分析进一步判别,所有样本均得到准确的判别,准确率为100%,6个典型判别函数中前两个判别函数的累积贡献率达到91.6%,同时在第一类和第二类典型判别函数的分组图中,不同浓度梯度的掺假蜂蜜能够被较好的判别。表明该方法能够快速、有效鉴别大米糖浆在洋槐蜂蜜中的掺假,具有一定可行性和实用性。  相似文献   

13.
石油污染的出现,导致生态环境遭到破坏。因此,油类识别方法的研究对于环境的保护具有重要意义。采用荧光光谱法获得石油光谱数据,并对其进行预处理,再通过降维方法来提取特征信息,最后利用模式识别算法进行分类,从而可以实现对油类的定性分析,因此研究一种更高效的数据降维方法以及识别分类算法极其重要。基于三维荧光光谱技术,利用稀疏主成分分析(SPCA)对FS920光谱仪测得的荧光光谱数据进行特征提取,再利用支持向量机(SVM)算法对提取的特征数据进行分类识别,获得了一种更加高效的油类识别方法。首先,利用海水和十二烷基硫酸钠(SDS)配制成浓度为0.1 mol·L-1的胶束溶液,将其作为溶剂配制柴油、航空煤油、汽油以及润滑油各20种不同浓度的溶液;然后,利用FS920光谱仪测得样本溶液的三维荧光光谱数据,对得到的光谱数据进行预处理;最后,对预处理后的数据分别利用SPCA和主成分分析(PCA)进行特征提取,再利用SVM和K最近邻(KNN)两种模式识别算法对特征向量进行分类,最终得到四种模型PCA-KNN,SPCA-KNN,PCA-SVM以及SPCA-SVM的分类结果。研究结果表明,由四种模型得到的分类准确率分别为85%,90%,90%和95%,其中,在同种分类算法中,利用SPCA进行特征提取得到的分类准确率均比PCA的准确率高5%,因此可知,SPCA的稀疏性具有突出主要成分的作用,在提取光谱特征时能够减小非必要成分的影响,并且载荷矩阵的稀疏化可以去除变量之间的冗余信息,优化降维特征信息,为后续分类提供更有效的数据特征信息;在同种特征提取算法下,利用SVM算法进行分类得到的分类准确率均比KNN算法得到的准确率高5%,表明SVM算法在分类中更具有优势。因此,本文利用三维荧光光谱技术结合SPCA和SVM算法,实现了对石油的准确识别与分类,为今后对石油污染物的高效检测提供了新思路。  相似文献   

14.
PCA-SVR联用算法在近红外光谱分析烟草成分中的应用   总被引:5,自引:0,他引:5  
由50份烟草样品的近红外漫反射光谱组成的光谱矩阵经过主成分分析降维,采用基于支持向量机回归(SVR)算法,以常规化学分析方法测定的总糖、还原糖、总氮、烟碱的含量为参考值,建立了烟草中主要成分近红外光谱定量分析定标模型,并采用留一法交叉验证(LOOCV)对模型进行验证。以内部交叉验证预测的RMSE值为判据,从核函数类型、惩罚因子C和不敏感函数ε取值等方面对定标模型进行优化,获得不同成分定标模型的优化参数。烟草总糖、还原糖、总氮、烟碱优化定标模型的RMSE值分别为1.581,1.412,0.117和0.313。同时建立了烟草以上成分的偏最小二乘回归(PLS)、多元线性回归(MLR)以及误差反向传播人工神经网络(BP-ANN)定标模型,通过内部交叉验证的RMSE值与SVR定标模型进行比较,结果表明SVR模型具有更好的预测效果。  相似文献   

15.
血痕的种属鉴别在刑事技术和检验检疫等领域有重要的实践意义,拉曼光谱技术为血痕种属鉴别提供了思路。实验采集人血及猪、鸡、鸭、牛、鼠5种动物的血样并获取其拉曼光谱,采用Savitzky-Golay方法平滑降噪,airPLS方法进行基线校正,选取100~1 700 cm-1波段进行实验。训练集有600组数据,测试集有300组拉曼光谱数据。第一部分实验对比了PLS-DA,LDA,PCA+LDA,SVM和PCA+SVM等方法,测试集准确率分别为84.0%,49.3%,78%,83.0%和85.7%,验证了降维算法结合SVM分类器的有效性。第二部分采用互信息算法、遗传算法和等间隔组合三种波段选择算法,结合SVM分类器做对比实验,结果显示互信息结合SVM算法的分类准确率最优,在选择波段数为50时,测试集准确率达到86.0%。在波段选择数为300时,三种波段选择算法结合SVM分类器的准确率都达到93%左右,大幅高于传统分类方法。实验结果表明,采用波段选择算法进行光谱降维,可以有效的提高算法的准确率和鲁棒性,同时使拉曼光谱种属鉴定的可解释性更强。波段选择算法确定了血痕鉴别的关键波段位置,对设计用于执法的便携式拉曼系统也有重要意义。  相似文献   

16.
蒲黄炭是由香蒲花粉炮制而成,具有止血、化瘀、通淋等多种功效,被广泛应用于临床抗血栓,创面和出血。然而蒲黄炭在炒炭过程中,常常会出现炭化过轻或者炭化过重的现象,从而出现不同炭化程度的蒲黄炭药品,主要为轻度炭化、标准炭化与重度炭化三种不同的蒲黄炭药品。由于炭化程度不同,蒲黄炭的凝血效果优劣不等,其中标准炭化的蒲黄炭药品药效最优。目前,鉴别蒲黄炭药品的方法多为人工凭借肉眼与经验进行判别。基于人工的蒲黄炭药品判别方法判别效率低,受主观因素影响大,判别结果不稳定,难以区分出标准炭化的蒲黄炭。为有效地对不同炭化程度的蒲黄炭进行识别,提出一种基于卷积神经网络与投票机制的蒲黄炮制品近红外判别方法。该方法创新性地结合深度学习与机器学习算法,有效利用卷积神经网络强大表征提取能力的同时通过投票决策提升算法模型的泛化能力与鲁棒性。首先通过近红外光谱技术获取蒲黄炭的近红外光谱,并通过卷积神经网络分别提取样本经过四种预处理方法所得到光谱图的高阶特征,并计算预测结果。按照样本准确率与损失值为四种预处理方法分配相应权重得到蒲黄炮制品预测模型。该模型将所得到的四种预测结果结合权重共同投票出样本的最终结果,从而鉴别出蒲黄炭的炭化程度。实验结果表明所提方法可以有效判别蒲黄炮制品的炭化程度。当训练集所占样本比例为80%时,预测准确率达到95.4%。所提方法与传统卷积神经网络方法、线性判别分析方法以及标准正太变量变换-线性判别分析方法相比预测准确率分别提高8.6%,4.3%和2.6%。同时,所提方法具有一定的稳定性,当训练集所占样本比例大于70%时,测试准确率高于90%;当训练集比例仅占10%时,预测准确性仍然能够达到约80%。  相似文献   

17.
快速准确监测农田土壤全氮含量,可显著提高土壤肥力诊断与评价工作的效率。传统测定土壤全氮的方法存在耗时费力、成本高、环境污染等缺点,而基于光谱学原理的土壤全氮定量方法克服了传统测量的劣势。中红外(MIR)光谱相较于可见光-近红外(VNIR)光谱而言,具有更多的波段数和信息量,如何利用中红外光谱监测土壤全氮含量是具有重要应用前景的研究课题。为了探索中红外光谱对土壤全氮监测的可行性,以新疆南疆地区采集的246个农田土样为研究对象,以室内测定的全氮含量和中红外光谱反射率数据为数据源,分析了不同全氮含量土样的中红外光谱特征差异,以主成分分析法(PCA)和连续投影算法(SPA)对光谱数据进行降维,然后采用偏最小二乘回归(PLSR)、支持向量机(SVM)、随机森林(RF)和反向传播神经网络(BPNN)四种建模方法分别构建基于全波段和降维数据的土壤全氮含量定量反演模型。研究结果表明:(1)土壤在中红外波段光谱反射率随全氮含量的增加而增加,在3 620,2 520,1 620和1 420 cm-1附近存在明显的吸收谷;将中红外光谱数据进行最大值归一化处理后,可明显提高土壤光谱反射率与全氮含量的相关性。(2)对比两种数据降维方法,PCA和SPA分别使模型变量数减少了99.8%和97.5%,但以PCA提取的8个主成分为自变量建立的模型预测精度总体要高于SPA对应的模型,因此以PCA提取的主成分建模更适于土壤全氮模型的构建。(3)在建模集中,PLSR和SVM模型以全波段建模精度最高,但建模变量数多,建模效率较低,而RF和BPNN模型分别以PCA和SPA降维后的数据建立的模型在保持精度相当的前提下,可显著提高建模效率;在预测集中,基于PCA降维数据的BPNN模型预测能力最高,R2和RMSE分别为0.78和0.12 g·kg-1,RPD和RPIQ值分别为2.33和3.54,模型具备较好的预测能力。研究结果可为农田土壤全氮含量快速估测提供一定的参考价值。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号