首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 250 毫秒
1.
近红外光谱(NIR)分析具有测试方便、不破坏样本、响应快速等优势,但是,由于在谱带分布和结构分析中存在着许多复杂因素,使得在提取特征光谱信息时存在许多困难。现阶段,虽然已经有多种光谱数据降维方式被广泛使用,但是这些传统的数据降维方式都有一个局限性,就是数据的降维仅仅针对于一个数据集,当数据集中有多个关键因素形成干扰时,数据降维和分类的结果往往不是很理想,得不到想要分析的信息。这一问题造成了在分析近红外光谱时建立的数据降维模型极差,无法正确的对样品进行预测分类。对比主成分分析(contrastive principle component analysis, cPCA)是一种基于主成分分析(PCA)的改进算法,起源于对比学习,并应用于基因组信息解析。cPCA算法的优势就是能够将一个数据集中的降维推广到两个相关联数据集之间的降维,从而能够得到数据集中的关键信息。将cPCA算法应用于近红外光谱处理中,建立了准确的近红外光谱数据降维模型。在实验验证中,使用cPCA算法对不同类型水果(苹果和梨)表面农药残留进行分析。结果表明,在对不同类型的水果进行农药残留分析时,使用PCA算法进行数据降维只能区分出不同的水果类型,而水果表面是否喷洒农药这一关键的特征信息并不能分析出来;而使用cPCA算法进行数据降维分析时,由于对背景光谱的约束作用,能够清晰的将有无喷洒农药的样本分类。这说明了, cPCA在近红外光谱数据降维中有着明显的优势,解决了近红外光谱数据降维模型中数据集受限和特征信息的提取问题,进而建立准确的近红外光谱数据降维模型。  相似文献   

2.
双孢蘑菇质地柔嫩、营养丰富,具有很好的降血压、降血脂、消炎护肝等多种保健价值,其新鲜度是反映内外部品质的重要指标之一。目前双孢蘑菇新鲜度鉴别大多依据其外观品质变化(褐变),缺乏精准的量化评价指标与方法,因此提出了以贮藏天数为新鲜度检测的量化指标,并利用近红外光谱技术对双孢蘑菇新鲜度进行检测分析。依据存储天数不同,将双孢蘑菇样本分为1~5组,每组40个样本,依次采集每组双孢蘑菇的近红外光谱数据。针对采集的原始光谱数据,首先选用卷积平滑滤波(SG)与多元散射校正(MSC)消除原始光谱噪声、基线平移以及光散射的影响,并选取399.81~999.81 nm的光谱波段作为数据处理范围;然后分别使用主成分分析(PCA)和连续投影算法(SPA)进行光谱降维和特征波长选择,继而建立极限学习机(ELM)分类模型;同时考虑到ELM模型中初始值对分类准确率影响较大,分别选用粒子群优化算法(PSO)、海鸥优化算法(SOA)对ELM中初始权值及阈值进行寻优,形成PSO-ELM,SOA-ELM优化组合分类模型;最后分别将全光谱、提取主成分以及所选的特征波长{556.87,445.51,481.15,885.10,802.25,720.90,861.34,909.79,924.44,873.17 nm}输入到分类模型中,建立不同输入、不同分类模型的双孢菇新鲜度检测模型。最终试验结果表明,当ELM为分类模型,以全光谱、主成分以及特征波长为输入时的预测精度分别为75%,95%,88%;以SPA优选特征波长作为输入的PSO-ELM、SOA-ELM分类模型训练集精度为96.25%,93.25%,预测集精度为92.5%,94%。可知,SPA波长选择算法可以有效降低光谱信息中存在的冗余信息,加快建模效率,同时海鸥优化算法能较好的优化ELM分类模型的初始参数,分类精度较ELM模型提高了6.8%,同时不产生过拟合现象。因此,利用光谱特征可以快速、准确无损的识别双孢蘑菇的新鲜度,研究结果为便携式双孢蘑菇新鲜度快速无损检测设备的开发提供了理论依据。  相似文献   

3.
贮存时间是影响生菜品质的一项重要因素,传统的贮存时间鉴别方法主要依靠人工经验,但是这种方法的准确率和可信度并不高。研究的目标是建立一种基于模糊识别的模型进行生菜光谱分析以实现生菜贮存时间的鉴别,并与其他鉴别方法作比较。为此,在当地超市购买60份新鲜生菜样品,存放于冰箱中待用。首先,通过AntarisⅡ近红外光谱检测仪采集生菜样品的近红外光谱数据,每隔12小时检测一次,每个样本检测重复三次,并取三次平均值作为实验数据。其次,利用多元散射校正(MSC)减少近红外光谱中的冗余信息。为了进一步去除近红外光谱中的无用信息以及简化随后的数据分类过程,分别运用主成分分析(PCA)和排序主成分分析(PCA Sort)。其中,PCA Sort通过改进对主成分的排序方法能提高分类准确率,同时便于模糊线性鉴别分析(FLDA)进一步提取特征。PCA和PCA Sort的计算仅运用了前15个主成分(能充分反映光谱的主要信息)。最后,利用模糊线性鉴别分析算法(FLDA)和K近邻算法(KNN)进一步分类所得的低维数据。基于PCA和KNN算法的模型鉴别准确率达到43%,而基于PCA, FLDA和KNN算法的模型鉴别准确...  相似文献   

4.
近红外光谱结合ELM快速检测固态发酵过程参数pH值   总被引:1,自引:0,他引:1  
pH值是固态发酵过程关键参数之一,为此提出基于近红外光谱技术的秸秆蛋白饲料固态发酵过程参数pH值检测方法。利用近红外光谱系统获取140个固态发酵过程产物样本在10 000~4 000cm-1范围内的近红外光谱数据,通过酸度计测得近红外光谱预测模型的参考测量值;运用ELM算法建立pH值的预测模型,在模型建立过程中由交互验证法确定最佳主成分因子数和ELM网络隐含层节点数。试验结果显示:最佳ELM网络模型的拓扑结构为10-40-1,模型预测集相关系数(Rp)和预测均方根误差(RMSEP)分别为0.961 8和0.104 4。研究结果可为固态发酵过程参数的在线检测提供技术基础。  相似文献   

5.
基于光谱技术鉴别机油品种的新方法   总被引:1,自引:0,他引:1  
提出了一种用可见-近红外透射光谱技术快速鉴别机油品种的新方法,应用可见-近红外光谱仪测定三种机油的光谱曲线,然后用主成分分析法对不同品种的机油样本进行聚类分析,并获取机油可见-近红外光谱的特征信息,再结合多类判别分析技术建立机油占占种鉴别的模型.对经过预处理的光谱数据进行主成分分析.结果表明,以样本在第一主成分和第二主成分卜的得分做出的二维散点图,对不同种类机油具有很好的聚类,能定性区分不同种类机油;经过主成分分析得到的前8个主成分的累积可信度已达95.38%,说明这8个变量能够代表绝大部分原始光谱的信息.从180个样本中随机抽取150个样本用于建立多类判别分析品种鉴别模型,余下的30个样本用于验证.对未知的30个样本进行品种预测,准确率为100%.证明本方法具有明显的分类和鉴别作用,为不同品种的机油鉴别提供了一种新方法.  相似文献   

6.
为解决模糊学习矢量量化(FLVQ)对噪声数据敏感问题,在无监督可能模糊聚类(UPFC)基础上提出一种无监督可能模糊学习矢量量化(UPFLVQ)算法。UPFLVQ用UPFC的隶属度和典型值来更新学习矢量量化网络的学习速率,计算类中心矢量。UPFLVQ 属于无监督机器学习算法,适用于无学习样本情况下的样本分类。研究了UPFLVQ用于近红外光谱生菜品种鉴别的可行性。采用FieldSpec@3型便携式光谱分析仪获取波长范围为350~2 500 nm的三种生菜样本的短波近红外光谱和长波近红外光谱,然后采用主成分分析(PCA)进行近红外光谱的维数压缩,取前三个主成分,累计可信度达97.50%,将2151维的近红外光谱压缩为三维数据。再运行模糊C-均值聚类(FCM)至迭代终止,并以FCM的类中心作为UPFLVQ的初始聚类中心,最后运行UPFLVQ得到隶属度和典型值以实现近红外光谱的生菜品种鉴别。同时,运行UPFC进行近红外光谱的生菜品种鉴别。实验结果表明:UPFLVQ和近红外光谱技术相结合的模型具有检测速度快,鉴别准确率高,对生菜不造成损坏等优点,可实现不同品种生菜的鉴别。UPFLVQ是将UPFC和FLVQ相结合的聚类算法,利用UPFLVQ建立近红外光谱的生菜品种鉴别模型时无需学习样本,适用于线性可分的数据聚类,为快速和无损地鉴别生菜品种提供了一种新的方法。  相似文献   

7.
模型转移是解决近红外光谱仪器间存在差异导致校正模型难以在多台仪器间通用问题的重要方法。利用主成分-马氏距离方法判断样品在不同仪器间的光谱差异性,然后通过吉洪诺夫正则化约束和校正模型参数,提出新的模型转移算法,实现模型在不同近红外光谱仪器上的共享和使用。首先使用一组标准样品光谱,建立主机和子机近红外光谱模型预测误差最小化函数。通过约束主机和子机的模型参数的差异,求出子机的模型参数,从而达到模型转移的目的。该方法应用于药物活性成分和烟叶中总植物碱与总糖的含量分析,结果表明使用15个标准样品时,子机光谱样本的预测均方根误差(RMSEP)分别从8.3 mg、 0.49%和1.91%降到3.9 mg、 0.09%和0.83%。转移后模型预测相对分析误差(RPD)均大于3.0,子机光谱样本的预测效果得到明显提高。该方法理论明确、直观,在实际应用中样品预测准确性较好,为具有标准样品的模型转移方法提供一种新思路。  相似文献   

8.
不同品种茶叶因其所含的有机化学成分不同,其效果也会有差别。所以,寻找出一种能准确迅速的鉴别茶叶品种的技术方法是非常重要的。近红外光谱(NIR)分析是一种无损检测技术,能很好的鉴别茶叶品种。使用NIR光谱仪采集茶叶的NIR数据。为了对包含噪声信号的茶叶近红外光谱进行准确鉴别,提出了一种模糊线性判别QR分析的新方法,可以对茶叶近红外光谱进行准确分类。通过使用模糊线性判别分析(FLDA)将由主成分分析(PCA)压缩的茶叶近红外光谱数据进行降维,由模糊线性判别分析得出的特征向量构建鉴别向量矩阵,对鉴别向量矩阵进行矩阵的QR分解,得到新的鉴别向量矩阵。经过模糊线性判别QR分析后使用K近邻算法进行分类,具有准确率高等优点。以岳西翠兰、六安瓜片、施集毛峰和黄山毛峰四种茶叶为研究样本,每类65个,茶叶样本总数为260个。采集茶叶近红外光谱数据的仪器为AntarisⅡ型傅里叶近红外光谱仪对光谱数据进行预处理,采用多元散射校正,由于采集到的茶叶光谱数据存在散射干扰。以此得到的近红外光谱数据的维数为1557维,通过主成分分析压缩数据集的维数,使得光谱数据集的维数达到7维。经压缩过后的光谱数据集中的鉴别信息再...  相似文献   

9.
极限学习机理论(extreme learning machine, ELM)作为一种新的化学计量学方法,在近红外光谱定量分析中的应用研究,已引起学术界的高度重视。然而,由于光谱数据维数较高,建立ELM模型时需要大量的隐节点,导致隐含层输出矩阵维数高且存在高度共线性,用现有的Moore-Penrose广义逆算法求取隐含层输出矩阵与待测性质间的回归模型往往会存在病态问题。基于ELM建立光谱波长变量与性质之间的回归模型,提出以ELM模型隐含层输出矩阵作为新的变量,采用作者最新提出的基于变量投影重要性的改进叠加PLS算法(stacked partial least squares regression algorithm based on variable importance in the projection,VIP-SPLS),建立新变量与待测性质间的回归模型。VIP-SPLS算法充分利用了每个隐节点的输出信息,能有效解决高维共线性问题,同时具有模型集成的优点,从而改进了ELM模型的性能。将提出的改进ELM算法(improved ELM,iELM)应用于标准近红外光谱数据集,结果表明iELM模型的精度相对于现有的PLS模型和ELM模型分别显著提升了29.06%和27.47%。  相似文献   

10.
目前,国内外铜矿品位分析多以化学分析法为主,但由于化学分析法存在成本高、时间长和污染物残留等缺点,其相对配矿流程存在严重的滞后效应,致使尾矿铜含量过高,必然造成资源浪费。开展斑岩型铜矿可见光-近红外光谱特征与建模研究是解决这一问题的有效途径。以121个乌山斑岩型铜矿的化学分析与光谱测试数据为数据源,分析了斑岩型铜矿可见光-近红外光谱特征,以主成分分析法(PCA)、局部线性嵌入算法(LLE)两种降维算法对原始光谱数据进行了处理,所降维数分别为3维和5维,同时利用遗传算法(GA)对原始光谱数据进行了波段选择,共选取了467个最佳波段。然后以BP神经网络为建模方法,并分别以92个和29个斑岩型铜矿可见光-近红外光谱数据作为建模样本和测试样本,建立了斑岩型铜矿可见光-近红外光谱的定量反演模型。利用原始数据所建模型的品位反演平均绝对误差为0.104%,利用主成分分析法、局部线性嵌入算法、遗传算法处理后的数据所建模型品位反演平均绝对误差分别为0.110%, 0.093%和0.045%,由此可见,利用主成分分析法处理后的数据所建模型品位反演精度较差,利用局部线性嵌入算法处理后的数据所建模型品位反演精度略有提高,而利用遗传算法处理后的数据所建模型品位反演精度有明显提高。研究结果表明,基于低品位斑岩型铜矿可见光-近红外光谱数据反演模型的品位分析具有一定的可行性,为我国低品位斑岩型铜矿的品位快速检测提供了一种有效的手段。  相似文献   

11.
采用可见/近红外光谱对丙酯草醚胁迫下大麦叶片过氧化氢酶(catalase, CAT)与过氧化物酶(peroxidase, POD)含量预测进行研究。对500~900 nm光谱采用移动平均法(moving average, MA)11点平滑方法进行预处理。采用蒙特卡罗-偏最小二乘法(monte carlo-partial least squares, MCPLS)方法分别对于CAT与POD的含量预测剔除7个与8个异常样本。基于全部光谱建立了CAT与POD含量预测的PLS,最小二乘支持向量机(least-squares support vector machine, LS-SVM)与极限学习机(extreme learning machine, ELM)模型,ELM模型对CAT含量预测效果最好,建模集相关系数(correlation coefficient of calibration, Rc)为0.916,预测集相关系数Rp为0.786;PLS模型对POD含量预测效果最佳,Rc为0.984,Rp为0.876。采用连续投影算法(successive projections algorithm, SPA)算法分别为CAT与POD预测选择了8个与19个特征波长,基于特征波长建立的PLS,LS-SVM与ELM模型中,ELM模型对CAT与POD含量预测效果均最佳,CAT含量预测的相关系数为Rc=0.928,Rp=0.790;POD含量预测的相关系数Rc=0.965,Rp=0.941。基于全谱与基于特征波长的回归分析模型预测效果相当,且对POD含量的预测效果优于对CAT含量的预测效果,而这需要进一步研究以得到精度和稳定性更高的预测模型。研究结果表明,采用可见/近红外光谱结合化学计量学方法可以实现对除草剂胁迫下大麦叶片CAT与POD含量的预测。  相似文献   

12.
烤烟等级质量对配方设计和卷烟工业生产的稳定起着重要的作用。采用传统外观分级法对2018年全国40个地级市产地的768份烤烟烟叶样品进行分类定级,包括7个不同烟叶质量等级。应用近红外光谱建立烟叶质量等级预测模型,分析不同等级烟叶化学基团及相关成分的近红外吸收光谱特征。结果表明:不分产区建立全国烟叶等级预测模型,建模集与预测集的预测标准差不大于1.35。将样品按五大产区分区后,建立各产区模型,发现较全国模型,分区后各个产区所建模型的预测标准差有所降低,其中东南、西南、黄淮烟区模型提高较大,检验集与预测标准差均不大于1.07。对不同质量等级烟叶的平均光谱进行标准正态变量变换预处理后,依据近红外光在不同频率范围吸收的有机基团及相关物质成分信息,发现质量等级较好的烟叶,纤维素含量较低,淀粉等糖类物质含量较高;质量等级较差的烟叶,纤维素含量较高,淀粉等糖类物质含量较低;质量等级最差(上部低等)烟叶,同时具有蛋白质类物质含量较高的特点。因此,应用近红外光谱可实现烟叶质量等级的快速预测,预测偏差基本在相邻等级之间,满足实际应用要求,通过建立不同产区预测模型可进一步提高预测准确度;同时,不同等级烟叶在以纤维素、淀粉和糖类、蛋白质类等物质为主产生的基团吸收特征不同,这也是应用近红外光谱实现烟叶质量等级快速检测的信息基础。该研究结果对完善烟叶分级评价体系,进一步优化分级方案,为产品质量和维护等方面可提供了更加科学的方法指导和技术支撑。  相似文献   

13.
赤霞珠酿酒葡萄总酚含量的近红外光谱定量分析   总被引:1,自引:0,他引:1  
酿酒葡萄中的总酚含量是影响葡萄品质的重要指标,也是影响葡萄酒质量的关键因素。为了快速准确地检测赤霞珠葡萄的总酚含量,利用近红外光谱技术结合GA-ELM预测模型对赤霞珠葡萄总酚含量进行预测研究。试验采用5个收获期(每期采集40串,每串取10个)的赤霞珠葡萄,采集200组葡萄的12 500~4 000 cm-1波段范围内的近红外光谱。基于福林酚比色法原理对赤霞珠葡萄的总酚含量进行测定,使用SPXY算法将样品按照3∶1比例分为校正集和预测集,共计150个校正集和50个预测集。分别采用多元散射(MSC)、标准正态变换(SNV)、数据中心化(MC)、移动窗口平滑(MA)和一阶导数+SG方法对原始光谱进行预处理,优选出最佳的预处理方法为MSC。并进一步采用竞争性自适应重加权算法(CARS)、遗传算法(GA)、联合区间偏最小二乘算法(si-PLS)和连续投影算法(SPA)分别对光谱波段进行提取,经对比分析发现CARS提取的69个特征波长数据能有效提高模型的稳定性和预测结果。在MSC预处理和特征波长提取的基础上,引入极限学习机(ELM)算法,建立赤霞珠葡萄总酚含量的预测模型,在总酚含量预测过程中,采用遗传算法(GA)对ELM模型进行优化,并探究了不同的激活函数和隐含层神经元个数对GA-ELM模型预测能力的影响,确定最优的激活函数为Sigmoidal,最优的神经元个数为50个。最后,将ELM和GA-ELM模型的预测能力进行对比,结果显示GA-ELM模型的预测能力高于ELM模型的预测能力,其中MSC+CARS+GA-ELM模型预测能力最好,校正相关系数(Rc)为0.901 7,预测相关系数(Rp)为0.901 3,校正均方根误差(RMSEC)为2.112 4,预测均方根误差(RMSEP)为1.686 8,剩余预测偏差(RPD)为2.308 0。研究结果表明:利用近红外光谱技术结合变量优选建立的GA-ELM模型可实现对赤霞珠葡萄的总酚含量的预测,为赤霞珠葡萄品质的检测奠定了理论基础。  相似文献   

14.
近红外光谱药品鉴别作为识别假冒伪劣药品的一种有效技术手段,已被广泛应用到各大医疗行业和药品监督管理机构,并结合模式识别建模方法在基层药品打假中得到较好的推广。由于传统建模方法很难满足药品鉴别中大规模、多分类、快速建模等问题,因此采用一种基于波形叠加极限学习机(SWELM(CS))分类方法对光谱数据进行鉴别。通过选用极限学习机(ELM)作为光谱药品分类器,使得分类模型具有快速学习能力以及对训练样本不敏感的特点;由于极限学习机的连接权值和隐层神经元阈值是随机生成导致网络稳定性差,因此结合布谷鸟搜索算法优化分类模型参数;采用反双曲线正弦函数与Morlet小波函数叠加的激励函数代替ELM原有的单一激励函数改善了分类模型的收敛速度和稳健性。通过上述改进方法使得SWELM(CS)具有对训练样本不敏感性,布谷鸟参数优化的分类稳定性、波形叠加函数的强收敛性与信号特征提取能力。该方法为核函数提供的信号特征提取及拟合的思想,可推广到其他学习算法中以获取更高的分类准确度及稳定性。该实验选定西安杨森制药厂生产的249个近红外光谱药品样本作为研究的主要对象,重点研究光谱药品的二分类和多分类实验,实验证明SWELM(CS)分类器相比BP神经网络、标准ELM以及粒子群优化ELM等传统分类器算法具有更高的分类准确度、分类稳定性及更小的训练样本敏感性。  相似文献   

15.
转基因水稻及其亲本叶片的可见/近红外光谱分析   总被引:1,自引:0,他引:1  
应用可见/近红外光谱技术实现了转基因水稻叶片的快速识别和叶绿素含量(SPAD)的快速检测。建立偏最小二乘-支持向量机(LS-SVM)鉴别模型,校正集的正确率为100%,同时应用连续投影算法(SPA)提取有效波长,建立SPA-LS-SVM鉴别模型,只用了全变量的0.3%进行建模,其预测集的正确率达到87.27%。在定量分析中,各模型的最优结果均来自经过正交信号校正(OSC)的光谱数据,经过SPA处理后的模型均优于最优的全波段PLS模型,说明SPA是一种有效的波长选择方法。最优SPAD值预测模型为SPA-LS-SVM,其相关系数(r)和预测均方根误差(RMSEP)分别为0.902 2和1.312 1,获得了满意的结果。这说明提出的SPA-LS-SVM方法能快速识别转基因水稻叶片并对SPAD值进行准确预测,为实现大田活体鉴别与连续监测提供了新方法。  相似文献   

16.
研究盐碱地的性质、组成,对于生态环境具有重要意义。传统的含盐量测定方法大多基于化学分析,因其成本高、效率低的缺点使得应用于大面积土地的可行性很低。极限学习机(ELM)作为一种基于前馈神经网络构建的机器学习系统,在许多研究中作为一种光谱处理方法被成功运用。为了改进传统的盐碱地含盐量检测方法,采用光谱学结合改进的极限学习机(ELM)模型的方法对盐碱地进行研究。根据镇赉县采集得到的62个土壤表层样本得到对应的光谱反射率和含盐量数据,提出了基于随机值改进粒子群优化算法(RVIPSO-MELM)优化的多层极限学习机模型。首先使用主成分分析提取光谱数据特征,并使用ELM算法对光谱数据建立分类模型,引入改进的粒子群优化算法以提高精度和速度。该模型结合了具有随机值的多层ELM(RV-MELM)和改进PSO算法的多层ELM(IPSO-MELM)二者的优点,在运用启发式算法搜索最优值的同时还具有随机性,提高了模型优化速度,同时以提高模型性能为目的对隐含层之间参数进行优化和选择。并且该模型可以推广到多层,对隐含层之间的参数的两种选择方法,根据经验公式计算和使用改进的启发式算法搜索,进行了提高模型性能和优化时间的讨论,实践结果表明,选择第一层参数使用改进粒子群优化算法,确定随后的隐含层之间参数选择,使用经验公式进行计算得到一种更具现实意义的方法模型。模型在进行启发式搜索最优值之前,利用蒙特卡罗方法确定一个较好的初值,使得模型能保持较高准确率的条件下,优化速度进一步提高。相比于传统方法,这种光谱分析结合ELM的模型节省时间和经济成本,有一定推广意义。  相似文献   

17.
结合分类与局部PLS的近红外光谱定量分析   总被引:3,自引:0,他引:3  
近红外光谱分析技术是近年来发展起来的一种快速检测技术。为了提高近红外光谱定量分析的精度,文章首先用支持向量机法对测试样本进行分类,然后选用与待测样本性质相近的同类部分校正集样品建模来预测待测属性值。为了克服分类错误样本的影响,提出了一种新的混合PLS算法(称为H_PLS法)。该算法由基于分类的局部PLS法(称为C_PLS法)和基于全部训练样本集的局部PLS法(称为D_PLS法)组成,通过比较C_PLS法和D_PLS法的输出,计算测试样本的待测属性值。针对一批汽油样本的实验结果表明,在分类完全正确时C_PLS法的预测精度高于D_PLS法,然而存在分类错误时C_PLS法的预测精度将会显著下降。H_PLS法结合了C_PLS法和D_PLS法的优点,即使存在分类错误样本,使用该方法也可以将复相关系数从D_PLS法的0.973 4和C_PLS法的0.965 6提高到0.985 8。  相似文献   

18.
采用近红外透射光谱研究了汽车制动液品牌及新旧的鉴别。采集宝马(BMW),丰田(Toyota),沃尔沃(Volvo)以及嘉实多(Castrol)四种品牌的汽车制动液全新样本以及用过的样本的透射光谱。分别对每一种品牌下全新与用过汽车制动液样本的光谱数据进行主成分分析(PCA),主成分得分图表明不同品牌制动液以及该品牌下全新样本以及用过的样本能够被较好的区分,其光谱特性存在差异。基于主成分载荷(Loadings)进行特征波数选择,偏最小二乘判别分析(PLS-DA),线性判别分析(LDA),簇类独立软模式法(SIMCA),k最邻近分类算法(KNN),随机森林(RF),误差反向传播人工神经网络(BPNN),径向基神经网络(RBFNN),极限学习机(ELM),支持向量机(SVM),最小二乘支持向量机(LS-SVM)等判别分析方法用于建立基于特征波数的判别分析模型,判别模型的建模集和预测集判别正确率均略低于或达到了100%。与其他三种品牌汽车制动液相比,嘉实多全新样本与用过样本的差异较小,KNN与LS-SVM模型的建模集正确率均低于100%。结果表明,近红外透射光谱结合特征波长选择以及判别分析模型对不同品牌制动液以及同一品牌下全新样本以及用过的样本进行识别是可行的,为开发在线或便携式仪器提供理论支持。  相似文献   

19.
在聚合物加工过程中,如果在同一生产线上混用不同牌号的原材料,可能会影响产品性能,降低产品合格率。然而采用传统方法识别相同类型不同牌号的聚合物往往耗时长且具有滞后性,目前还缺乏一种快速实时的牌号识别方法。因此,以5种不同牌号的通用聚苯乙烯(GPPS)为研究对象,利用自主开发的安装于挤出机上的在线近红外光谱测量系统,将近红外光谱与化学计量学、机器学习算法相结合,实现对挤出过程中GPPS牌号的快速在线识别。首先利用在线近红外光谱测量系统实时采集5种不同牌号GPPS熔体的在线近红外光谱,波长范围为900~1 700 nm。经过谱图分析后,利用主成分分析结合K均值聚类算法验证在线近红外光谱数据对于不同牌号的可分性。最后采用偏最小二乘判别分析和随机森林两种算法分别建立GPPS牌号识别模型并进行对比。结果表明:①经过基线校正、最大最小归一化、7点移动平均平滑预处理后,在线近红外光谱在1 207,1 388,1 407和1 429 nm处的特征峰峰值会随着牌号的变化呈阶梯状改变,以前3个主成分得分作为K均值聚类的输入变量得到聚类正确率为88%,说明了不同牌号GPPS在线近红外光谱数据的可分性;②所建立的两种预测模型均能够对GPPS牌号有效识别,最佳主因子数为3的偏最小二乘判别分析模型对验证集的分类正确率为90.4%,以前5个主成分得分作为输入变量建立的随机森林模型对验证集的分类正确率达95.6%,所以随机森林模型的牌号识别性能更好。因此,在线近红外光谱测量系统结合化学计量学、机器学习算法可以实现GPPS牌号的快速在线识别,为在生产线上利用近红外光谱识别同种聚合物的不同牌号提供参考。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号