首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 156 毫秒
1.
模式识别技术及数据挖掘方法已成为化学计量学的研究热点。近红外(NIR)光谱分析以其快速、简便、非破坏性等优势广泛应用于光谱信号的处理和分析模型的建立。基于五种不同的模式识别方法:局部线性嵌入(LLE),小波变换(WT),主成分分析(PCA),偏最小二乘(PLS)和支持向量机(SVM),利用NIR技术建立了玉米种子的模式识别系统,并将其应用于108玉米杂交种和母本178种子的近红外光谱样品。首先利用LLE,WT,PCA,PLS进行消噪或降维,然后运用SVM进行分类识别,而一模支持向量机(1-normSVM)算法直接进行分类识别。三个不同NIR光谱范围的数值实验显示:PCA+SVM,LLE+SVM和PLS+SVM识别效果甚佳,而WT+SVM和1-norm SVM方法也有较高的分类精度。实验结果表明了本文提出方法的可行性和有效性,为利用近红外光谱和模式识别技术进行种子识别研究提供了理论依据和实用方法。  相似文献   

2.
基于PCA和SVM的高光谱遥感图像分类研究   总被引:4,自引:0,他引:4  
支持向量机(SVM)是根据统计学习理论提出的新的研究方法,它在解决小样本、非线性及高维模式识别问题中表现出了许多特有的优势,在模式识别、函数逼近和概率密度估计等方面取得了良好的效果。由于高光谱图像波段数目多,各波段间具有较强的相关性,因此通过主成分分析(PCA)方法对高光谱数据进行预处理,达到了降维的目的,同时也去除了噪声波段。用支持向量机方法对高光谱遥感图像进行分类,可实现图像的分类识别。  相似文献   

3.
转基因技术在过去的几十年里快速发展, 然而此项技术对生态环境、伦理道德等可能带来的影响尚存争议,因此针对农作物的转基因成分检测和鉴别的相关技术研究十分重要。本研究以转双价基因(cry1Ab/cry2Aj-G10evo)玉米籽粒和玉米面粉为研究对象,采用近红外光谱仪采集900~1 700 nm波段范围的光谱,结合 Savitzky-Golay(SG)平滑算法对提取出的光谱数据进行去除噪声处理。基于全波段光谱和PCA主成分分别建立了偏最小二乘判别分析(PLS)和支持向量机判别模型(SVM)。试验结果表明,在转基因玉米籽粒全谱的判别分析模型中,SVM判别模型效果要优于PLS判别模型,SVM模型识别正确率达到90%以上,PLS的模型识别率只有85%左右。以PCA降维后建立的模型中,SVM模型也取得了最优的效果,建模集和预测集识别正确率达到100%。虽然转基因玉米在研磨加工后外源蛋白和DNA有所下降,但是转基因玉米粉末基于全波段光谱建立的SVM模型的建模集正确率仍有90.625%。结果表明应用近红外光谱技术集合化学计量学方法对转基因玉米的鉴别是可行的,为转基因玉米乃至其他转基因农产品的鉴别提供了技术支持,具有重要的理论意义和应用价值。  相似文献   

4.
NIR光谱的LLE-PLS非线性建模方法及应用   总被引:4,自引:1,他引:4  
传统的偏最小二乘(PLS)建模方法不能有效反映近红外(NIR)光谱与分析样本的物理化学性质之间存在的非线性关系.局部线性嵌入(LLE)是一种新的非线性降维方法,属于流形学习方法,它能有效地发现高维数据中的本真低维结构.结合LLE和PLS,提出一种近红外光谱非线性建模的新方法,并用于建立丹参多酚酸盐柱层析过程中丹酚酸B含量的回归校正模型.该方法首先用LLE对NIR光谱数据降维,再用PLS建立校正模型.结果表明,与多元散射校正、一阶导等预处理方法结合PLS建模比较,参数优化后的LLE-PLS方法能更准确地预测丹酚酸B的含量,其交叉验证均方根误差为0.128 mg·mL-1、决定系数为0.998 8.基于NIR光谱及LLE-PLS建模,可实现丹参多酚酸盐柱层析过程的在线检测.  相似文献   

5.
近红外光谱结合化学计量学方法对癌症的辅助诊断已有了文献报道.该文测定了77例不同生理阶段的子官内膜组织病理切片的近红外光谱,对其分别进行多元散射校正(MSC)、正交信号校正(OSC)以及二者联用的预处理方法,采用拉丁配分法选择3/4样本作为训练集,1/4样本作测试集,建立支持向量机(SVM)模型进行分类,并与基于同样预处理方法建立的偏最小二乘(PLS)模型分类结果进行了比较.SVM对正常、增生和癌变三类不同的组织样品分类结果较好,总分类正确率约92%,好于PLS模型的结果(最高正确率90%).研究结果表明,光谱数据的预处理和建模方法对分类结果有重要影响,SVM结合子宫内膜组织的近红外光谱有望发展成为一种新型的肿瘤诊断方法.  相似文献   

6.
近红外化学模式识别方法及应用研究   总被引:3,自引:2,他引:3  
近红外模式识别技术是现代近红外光谱分析技术的一个重要方面.文章较系统地介绍了近红外模式识别中常用的化学模式识别方法和这一领域内的最新进展,涉及到聚类分析、判别分析、特征投影显示3个方面多种方法的基本原理,以及近年来出现的支持向量机(SVM)、气泡凝聚算法(BA)、焦点本征函数(FEF)等新方法的基本思想.综述了近几年近红外模式识别技术在农业、医药、食品分析、石油等领域的具体应用.  相似文献   

7.
塑料牌号是塑料生产公司根据原料性质、用途的差异而内部制定的编号。通过检测材料的物理化学性能能间接识别其牌号,但速度慢且具有破坏性。因此,利用了近红外光谱(near infrared spectroscopy, NIR)技术对不同牌号的聚乳酸(polylactic acid), PLA)进行识别。采用主成分分析法(principle component analysis, PCA)分别与马氏距离(mahalanobis distance, MD)、人工神经网络(artificial neural network, ANN)和支持向量机(support vector machine, SVM)结合的模型进行分析预测。在900~1 700 nm的波长范围,采用三种不同牌号的聚乳酸共90个样本的光谱进行建模,另取这3种牌号共90个样本进行识别,比较三种预测模型对PLA牌号的识别能力。结果表明,在对样品的光谱数据做主成分分析后,以验证集的前两个主成分做散点图,发现明显的聚类现象,以前9个主成分得分作为输入变量所建立的马氏距离判别、人工神经网络判别、支持向量机判别均能够对不同牌号的聚乳酸有效识别。最好的判别方法——马氏距离判别正确率能够达到98.9%。因此,近红外光谱能够对不同牌号的PLA进行无损、快速、准确的识别。  相似文献   

8.
Lin W  Ni YN 《光谱学与光谱分析》2011,31(8):2106-2108
采用了近红外光谱法测定了4个品牌牙膏样品的近红外光谱,然后对所得的光谱进行变量预处理,再运用偏最小二乘法(PLS)、人工神经网络法(ANN)和K-最近邻法(KNN)等几种有监督模式识别法,以及主成分分析(PCA)和聚类分析两种无监督模式识别法对样品进行了品牌的分类及聚类分析.结果表明采用近红外光谱法所得的光谱变量经多元...  相似文献   

9.
近红外光谱法对甲醇柴油中甲醇含量测定   总被引:1,自引:0,他引:1  
应用近红外光谱结合化学计量学方法实现了对甲醇柴油中的甲醇含量的定量分析。以实验室配制的32种不同浓度[浓度范围为2%~25.8%(φ)]的甲醇柴油溶液为研究对象,在4 500~7 000 cm-1光谱范围内,建立偏最小二乘(PLS)、支持向量机(SVM)和最小二乘支持向量机(LS-SVM)三种定量分析模型。在建立SVM模型时,经过比较分析,径向基函数(radial basis function,RBF)作为SVM模型的核函数时可以获得更高的预测精度。最终获得甲醇含量的PLS, SVM和LS-SVM三种模型的预测相关系数RP分别为0.985 9, 0.990 3, 0.998 9,预测均方根误差RMSEP分别为0.405 2, 0.356 3, 0.062 4,可以看出,三种预测模型都可以达到很好的效果,最优的预测模型是使用LS-SVM建模。研究结果表明,利用近红外光谱法结合化学计量学方法对甲醇柴油中甲醇含量的检测具有可行性,并可以达到很好的效果。采用近红外光谱技术结合化学计量方法对甲醇柴油中甲醇含量进行定量分析,也为近红外光谱技术快速无损检测甲醇柴油甲醇含量提供参考和应用价值。  相似文献   

10.
基于近红外光谱(NIR)和潜在语义分析(LSA)方法,对5种典型壮阳中药材进行分类鉴别研究。利用潜在语义分析对光谱预处理后的5种壮阳中药材光谱数据进行特征提取和鉴别分类后,将经光谱预处理和主成分分析(PCA)提取特征后的光谱特征数据分别带入K近邻(KNN)、BP神经网络(BP-ANN)和偏最小二乘支持向量机(LSSVM)三种典型的分类模型进行分类,并将结果与潜在语义分析模型结果进行对比。在4119.20~9881.46cm-1波数范围内,NIR光谱数据经多元散射校正(MSC)预处理后,代入潜在语言空间维数为3时所建立的LSA分类模型,训练集和测试集准确率均达到了100%。结果表明,在壮阳类中药材的近红外光谱分析鉴别中,潜在语义分析可以作为一种全新的提取光谱信息并分类的方法,具有较好的运用前景和实际意义。  相似文献   

11.
为了快速检测玉米品种类型,基于支持向量机(SVM)和近红外光谱联合建立玉米品种的分类模型。以郑单958、先玉335、京科968、登海605和德美亚等五个品种共计293个样本为研究对象,对采集的近红外光谱进行标准正态变量变换(SNV)处理后使用主成分分析法(PCA)对光谱数据进行降维处理。按照6∶1比例,随机选取251个样本为训练集,42个样本作为测试集,探讨贝叶斯优化算法(BO)对SVM模型性能的影响。分别使用网格搜索(GS)、遗传算法(GA)和BO算法等三种方法对SVM模型的两个重要参数惩罚因子C和径向基核函数参数γ进行寻优。选择各模型十折交叉验证识别准确率最高时对应的惩罚因子和核参数作为建模参数,建立SVM分类模型。将使用BO算法建立的SVM分类模型与使用GS和GA进行参数寻优后建立的模型性能进行比对。实验发现,使用BO优化的SVM分类模型相比于其他两种优化算法得到的SVM模型性能具有显著优势,测试集的识别准确率可达到100%。说明使用BO算法寻优的SVM模型参数是全局最优参数,其他两种优化算法寻优的参数可能陷入了局部最优,从而导致模型性能表现不佳。在进行PCA降维前后的光谱数据上分别建立BO-SVM模型,结果表明,BO算法对于高维数据优化效果不佳,更适用于低维数据。对于不同样本类别间数量不均衡导致模型性能表现不佳的问题,通过剔除郑丹958和先玉335两类数量较少的样本,使用剩余三个类别,共计248个样本重新建立SVM模型,实验发现,剔除两类小样本之后,各个模型在测试集上的性能均有提升,说明对于类间样本数量不均衡问题,某类样本数量越多,对于模型参数的修正就越细腻,模型对该类的拟合效果就越好。研究结果可用于玉米品种的快速鉴别,也可为基于近红外光谱的其他农产品分类和产地鉴别提供参考。  相似文献   

12.
近红外光谱结合一类支持向量机算法检测鸡蛋的新鲜度   总被引:5,自引:0,他引:5  
研究利用近红外光谱技术结合模式识别方法识别鸡蛋的新鲜度,在识别模型建立过程中,引入一类支持向量机(OC-SVM)算法解决新鲜蛋和非新鲜蛋训练样本数量不平衡问题。首先获取鸡蛋在10 000~4 000 cm-1范围内的近红外漫反射光谱,通过主成分分析方法提取光谱数据中的特征信息,优选了3个主成分作为模型的输入向量,然后采用OC-SVM区分新鲜蛋和非新鲜蛋。在模型建立过程中,对相关参数进行了优化,试验结果显示在相同条件下,OC-SVM模型识别结果较传统的支持向量机模型好。最优OC-SVM模型对新鲜蛋和非新鲜蛋的识别率均为80%,传统的支持向量机对新鲜度的识别率为100%,对非新鲜度的识别率却为0%。研究结果表明利用近红外光谱快速识别鸡蛋新鲜度方法是可行的;OC-SVM算法为训练样本数量不平衡提供了一种有效的解决方法。  相似文献   

13.
贮存时间是影响生菜品质的一项重要因素,传统的贮存时间鉴别方法主要依靠人工经验,但是这种方法的准确率和可信度并不高。研究的目标是建立一种基于模糊识别的模型进行生菜光谱分析以实现生菜贮存时间的鉴别,并与其他鉴别方法作比较。为此,在当地超市购买60份新鲜生菜样品,存放于冰箱中待用。首先,通过Antaris Ⅱ近红外光谱检测仪采集生菜样品的近红外光谱数据,每隔12小时检测一次,每个样本检测重复三次,并取三次平均值作为实验数据。其次,利用多元散射校正(MSC)减少近红外光谱中的冗余信息。为了进一步去除近红外光谱中的无用信息以及简化随后的数据分类过程,分别运用主成分分析(PCA)和排序主成分分析 (PCA Sort)。其中,PCA Sort通过改进对主成分的排序方法能提高分类准确率,同时便于模糊线性鉴别分析(FLDA)进一步提取特征。PCA和PCA Sort的计算仅运用了前15个主成分(能充分反映光谱的主要信息)。最后,利用模糊线性鉴别分析算法(FLDA)和K近邻算法(KNN)进一步分类所得的低维数据。基于PCA和KNN算法的模型鉴别准确率达到43%,而基于PCA,FLDA和KNN算法的模型鉴别准确率可达83%。上述结果说明基于PCA,FLDA和KNN算法的模型鉴别准确率已经得到较大程度提高。当用PCA Sort替代了模型中的PCA算法后,结合FLDA和KNN算法则鉴别准确率达到98.33%。实验结果表明PCA Sort结合FLDA和KNN所建立的模型是有效的生菜贮存时间鉴别模型。  相似文献   

14.
近红外光谱属微弱信号,其质量易受被测物体自身状态及各种外界因素干扰,具体而言,在近红外光谱定性分析中,影响光谱质量的因素主要有光谱仪状态改变、光谱采集人员错误操作、奇异样本干扰等。建模时若混入质量较差的光谱易影响所建模型的稳健性与适用性,因此光谱质量判定是确保模型预测能力的一项重要工作。目前用于定量分析的光谱质量判定研究较多,而用于定性分析的光谱质量判定研究较少,为此,提出一种基于支持向量机数据描述的近红外光谱定性分析光谱质量判定方法,采用自制漫透射近红外光谱装置采集单籽粒玉米光谱,以正常状况下采集的某品种玉米单籽粒漫透射光谱作为正常样本,而人为漏光、近红外探测器窗口覆盖玉米表皮碎屑、光源强度改变、光源与被测玉米籽粒距离改变、相近品种玉米籽粒混入等几种情况下所采集光谱作为异常样本,在此数据集基础上研究了基于支持向量机数据描述的定性分析光谱质量判定模型建立的原理与方法,其后将支持向量机数据描述方法与常用的马氏距离法、局部异常因子法等光谱质量判定方法进行了对比,并以正常样本正确识别率与异常样本正确拒识率的均值作为评价标准,对实验结果进行分析,由实验结果可以看出相比其他两种方法,基于支持向量机数据描述的光谱质量判定方法具有最优判定能力,建模集正常样本数目会影响光谱质量判定能力,在实际使用光谱质量判定方法时,建模集应包含足量样本。在近红外定性分析时可以将该方法作为剔除异常光谱的手段,在预处理、特征提取,模式分类等近红外光谱定性分析步骤前首先进行基于支持向量机的光谱质量判定步骤,并剔除异常光谱,可有效提高近红外光谱定性分析模型的可靠性,亦为近红外光谱定性分析光谱质量判定提供新的方法参考。  相似文献   

15.
花椒是我国的八大调味料之一。目前花椒市场掺假现象较为多见,为实现掺假花椒粉的快速定性鉴别,采用了近红外光谱结合化学计量学方法进行了探讨。将麦麸粉、稻糠粉、玉米粉和松香粉以1 Wt/Wt.%的递增梯度分别掺入红花椒粉和青花椒粉中,制备掺假浓度范围为1~54 Wt/Wt.%的掺假花椒粉样品,以掺假花椒粉和纯花椒粉共462份样品依次采集其800~2 500 nm范围的漫反射近红外光谱。采用主成分分析法(PCA)对光谱数据进行分析,前3个主成分累计贡献率达98.72%,做出的得分图表明PCA法对掺假的花椒粉具有较好的区域划分。347份样本作为校正集,以特征谱区2 000~2 200 nm范围的257个采样点的光谱信号作为输入,采用判别偏最小二乘法(DPLS)和支持向量机(SVM)建立定性鉴别模型,经不同光谱预处理,对115份验证集样本进行预测,总体鉴别正确率在97.39%~100%之间,表明该方法是快速定性鉴别掺假花椒粉的一个有效手段。  相似文献   

16.
以2009年产自海南的农华101玉米种子作为研究对象,基于近红外漫透射光谱法(波长范围908.1~1 677.2 nm),研究了一种高强高效近红外光源在不同光源电压以及光源至光谱仪不同距离两种条件下对玉米杂交种鉴别的影响。对光谱进行一阶导数、矢量归一化的预处理后,使用主成分分析(PCA)和正交线性判别分析(OLDA)提取光谱特征,使用支持向量机(SVM)分别建立种子纯度鉴定模型,统计不同实验条件下的识别率。结果表明,在电压较低或者光源至光谱仪的距离较大的时候,光源强度较低,得到的光谱曲线有较多的毛刺,此时的识别率较低,增大电压或者降低光源至光谱仪的距离时,光谱曲线变得较为平滑,识别率明显升高,说明在一定范围内增大光源强度会提高模型的正确鉴定率。  相似文献   

17.
近红外光谱结合化学计量学方法对癌症的辅助诊断已有了文献报道.该文测定了77例不同生理阶段的子官内膜组织病理切片的近红外光谱,对其分别进行多元散射校正(MSC)、正交信号校正(OSC)以及二者联用的预处理方法,采用拉丁配分法选择3/4样本作为训练集,1/4样本作测试集,建立支持向量机(SVM)模型进行分类,并与基于同样预...  相似文献   

18.
拉曼光谱结合模式识别方法用于大豆原油掺伪的快速判别   总被引:1,自引:0,他引:1  
大豆原油是我国的战略储备物资,然而目前储油市场上频繁出现大豆原油掺混的现象严重影响了食用油储备安全。基于此,通过大豆原油与部分植物精炼油拉曼谱图的特征差异,并结合主成分分析-支持向量机(PCA-SVM)模式识别建立了大豆原油是否掺伪的快速判别方法。以28个大豆原油、46个精炼油、110个掺伪油的拉曼谱图为模型样本;选择位于780~1 800 cm-1波段的谱图,预处理方法同时采用Y轴强度校正、基线校正和谱图归一化法;在此基础上应用PCA法提取特征变量,即以贡献率最高前7个主成分为变量进行SVM分析。SVM校正模型的建立是以随机选取的20个大豆原油和75个掺伪油样组成校正集,以8个大豆原油和35个掺伪油样组成验证集,分别运用并比较四种核函数算法建立的大豆原油SVM分类模型,并采用网格搜索法(grid-search)优化模型的参数,以四种模型的分类性能作为评判标准。结果表明:应用线性核函数算法构建的SVM分类模型可以很好地完成掺伪大豆原油的判别,校正集识别准确率达到100%,预测结果的误判率为0,判别下限为2.5%。结果表明应用拉曼光谱结合化学计量学能够用于大豆原油掺伪的快速鉴别。拉曼光谱简便、快速、无损、几乎没有试剂消耗,适合现场检测,从而为大豆原油的掺伪分析提供了一种新的备选方法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号