首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 166 毫秒
1.
稀疏降噪自编码算法用于近红外光谱鉴别真假药的研究   总被引:1,自引:0,他引:1  
近红外光谱分析技术作为一种快速、无损检测技术十分适用于真假药品现场鉴别。自编码网络作为当前机器学习领域研究的热点受到广泛关注,自编码网络是一种典型的深度学习网络模型,它比传统的潜层学习方法具有更强的模型表示能力。自编码网络使用贪婪逐层预训练算法,通过最小化各层网络的重构误差,依次训练网络的每一层,进而训练整个网络。通过对数据进行白化预处理并使用无监督算法对输入数据进行逐层重构,使网络更有效的学习到数据的内部结构特征。之后使用带标签数据通过监督学习算法对整个网络进行调优。首先对真假琥乙红霉素片的近红外光谱数据进行预处理以及白化预处理,通过白化处理降低数据特征之间的相关性,使数据各特征具有相同的方差。数据处理之后利用稀疏降噪自编码网络针对真假药品光谱数据建立分类模型,并将稀疏降噪自编码网络模型与BP神经网络以及SVM算法在分类准确率及算法稳定性方面进行对比。结果表明对光谱数据进行白化预处理能有效提升稀疏降噪自编码网络的分类准确率。并且自编码网络分类准确率在不同训练样本数量下均高于BP神经网络,SVM算法在少量训练样本的情况下更有优势,但在训练数据集样本数达到一定数量后,自编码网络的分类准确率将优于SVM算法。在算法稳定性方面,自编码网络较之BP神经网络和SVM算法也更稳定。使用稀疏降噪自编码网络对真假药品近红外光谱数据进行建模,能对真假药品进行有效的鉴别。  相似文献   

2.
近红外光谱分析技术对检测样品无损伤且检测速度快、精度高,因此被广泛应用在了药品检测、石油化工等领域,尤其近年来机器学习和深度学习建模方法的深入应用使其具备了更准确的检测性能。然而,样品的近红外光谱数据具有比较高的维度且存在谱间重合、共线性和噪声等问题,对近红外光谱模型的性能产生消极影响,此时样品有效特征波长的筛选极为重要。为了提高近红外光谱定量和定性分析模型的准确性和可靠性,提出了一种近红外光谱变量选择方法,其结合了最小角回归(LAR)和竞争性自适应重加权采样(CARS)的优点,具有更优的性能。该方法利用LAR初步筛选样品全谱区的特征波长,接着利用CARS对筛选出来的特征波长进一步选择,从而有效去除无关特征波长。为验证该方法的有效性,从定量和定性分析两个方面评价该方法。在定量分析实验中,以FULL,LAR,CARS,SPA和UVE作为对比方法,以药品样品数据集为实例建立PLS回归分析模型,经LAR-CARS筛选出的变量建立的PLS模型在药品数据集表现出较高的预测决定系数和较低的预测标准偏差。在定性分析实验中,以SVM,ELM,SWELM和BP作为对比方法、不同比例训练集的药品数据集为实例建立分类模型,经LAR-CARS筛选出的变量建立的SVM分类模型精度最高达100%。从实验结果可见,LAR-CARS可有效的筛选出表征样品特征的波长,利用其筛选出的波长建立的定量、定性分析模型具有更好的鲁棒性,可用于样品光谱的特征波长筛选。  相似文献   

3.
近红外光谱(NIR)分析具有分析高效、样品无损、环境无污染以及可现场检测等优点,特别适合药品的快速建模分析。但NIR存在吸收强度弱以及谱带重叠等缺点,需要建立稳健可靠的化学计量学模型对其进行分析。深度卷积神经网络是深度学习方法中一个重要分支,它通过逐层抽取数据特征并进行组合、转换,形成更高层的语义特征,具有极强的建模能力,广泛应用于计算机视觉、语音识别等领域,而在药品NIR分析方面尚未见报道。基于深度卷积网络模型,对药品NIR多分类建模进行研究。针对药品NIR数据的特点,设计若干个面向多品种、多厂商药品NIR分类的一维深度卷积网络模型。模型中卷积层和池化层交叠排列用于逐层抽取NIR数据特征,输出层连接softmax分类器,对药品NIR数据进行分类概率预测。在输出层之前采用全局最大池化层,将特征图进行整体池化,形成一个特征点,用于解决全连接层存在的限制输入维度大小,参数过多的问题。同时,在网络模型中引入批处理操作和dropout机制,以防止梯度消失和减小网络过拟合的风险。在网络模型的设计过程中,通过设计不同的卷积网络层数以及不同的卷积核尺寸大小,分析其对建模效果的影响,同时分析五种经典数据预处理方法对NIR分析的影响。以我国7个厂商生产的头孢克肟片和11个厂商生产的苯妥英钠片样本NIR为实验对象, 建立药品的多品种、多厂商分类模型,该模型在二分类、多分类实验中取得了良好的分类效果。在十八分类实验中,当训练集与测试集比例为7∶3时,分类准确率为99.37±0.45,比SVM, BP, AE和ELM算法取得更优的分类性能。同时,深度卷积神经网络模型推理速度较快,优于SVM和ELM算法,但训练速度慢于二者。大量实验结果表明,深度卷积神经网络可对多品种、多厂商药品NIR数据准确、可靠地判别分类,且模型具有良好的鲁棒性和可扩展性。该方法也可推广到烟草、石化等其他领域的NIR数据分类应用中。  相似文献   

4.
提出一种稀疏降噪自编码结合高斯过程的近红外光谱药品鉴别方法。首先对近红外光谱数据进行小波变换以消除基线漂移,然后用稀疏降噪自编码(SDAE)网络提取光谱特征并降维表示,最后采用高斯过程(GP)进行二分类,其中GP选用光谱混合(SM)核函数作为协方差函数,记此分类网络为wSDAGSM。自编码网络具有很强的模型表示能力,高斯过程分类器在处理小样本数据时具有优势。wSDAGSM网络通过稀疏降噪自编码学习得到维数更低但更有价值的特征来表示输入数据,同时将具有很好表达力的光谱混合核作为高斯过程的协方差函数,有利于更准确的光谱数据分类。以琥乙红霉素及其他药品的近红外光谱为实验数据,将该方法与经过墨西哥帽小波变换的BP神经网络(wBP)、支持向量机(wSVM), SDAE结合Logistic二分类(wSDAL)、SDAE结合采用平方指数(SE)协方差核的GP二分类(wSDAGSE),以及未采用小波变换的SDAGSM网络等方法进行对比。实验结果表明,对光谱数据进行墨西哥帽小波变换预处理能有效提升SDAGSM网络的分类准确率和稳定性。wSDAGSM方法无论从分类准确率还是分类结果稳定性方面,都优于其他分类器。  相似文献   

5.
近红外光谱药品鉴别作为识别假冒伪劣药品的一种有效技术手段,已被广泛应用到各大医疗行业和药品监督管理机构,并结合模式识别建模方法在基层药品打假中得到较好的推广。由于传统建模方法很难满足药品鉴别中大规模、多分类、快速建模等问题,因此采用一种基于波形叠加极限学习机(SWELM(CS))分类方法对光谱数据进行鉴别。通过选用极限学习机(ELM)作为光谱药品分类器,使得分类模型具有快速学习能力以及对训练样本不敏感的特点;由于极限学习机的连接权值和隐层神经元阈值是随机生成导致网络稳定性差,因此结合布谷鸟搜索算法优化分类模型参数;采用反双曲线正弦函数与Morlet小波函数叠加的激励函数代替ELM原有的单一激励函数改善了分类模型的收敛速度和稳健性。通过上述改进方法使得SWELM(CS)具有对训练样本不敏感性,布谷鸟参数优化的分类稳定性、波形叠加函数的强收敛性与信号特征提取能力。该方法为核函数提供的信号特征提取及拟合的思想,可推广到其他学习算法中以获取更高的分类准确度及稳定性。该实验选定西安杨森制药厂生产的249个近红外光谱药品样本作为研究的主要对象,重点研究光谱药品的二分类和多分类实验,实验证明SWELM(CS)分类器相比BP神经网络、标准ELM以及粒子群优化ELM等传统分类器算法具有更高的分类准确度、分类稳定性及更小的训练样本敏感性。  相似文献   

6.
卷积神经网络(CNN)在图像分类识别领域应用广泛,但其在近红外光谱分类中的研究还未见报道,对基于CNN的近红外光谱分类建模方法进行了研究。针对近红外光谱数据的特点,提出了一种改进的卷积神经网络建模方法,对CNN经典模型LeNet-5所做改进:①将方形矩阵卷积核改为适用于一维近红外光谱的向量卷积核;②简化网络结构,将LeNet-5结构中C5,F6及输出层改为单层感知机。同时,采用隔点采样的方法对近红外光谱降维,加快收敛速度;并对卷积核尺寸对建模结果的影响进行了研究。以我国东北、黄淮、西南三大烤烟产区的600个中部烟叶样本的近红外光谱为实验对象,建立烟叶产区分类NIR-CNN模型。该模型对训练集和测试集的判别准确率为98.2%和95%。实验结果表明,应用卷积神经网络可对近红外光谱数据准确、可靠地判别分类;烟叶产区NIR-CNN建模方法可为卷烟企业烟叶原料科学合理利用提供指导,为维护卷烟产品的质量稳定有重要意义;基于卷积神经网络的近红外光谱判别方法也可推广到其他农产品的分类应用中。  相似文献   

7.
近红外光谱结合化学计量学方法对癌症的辅助诊断已有了文献报道.该文测定了77例不同生理阶段的子官内膜组织病理切片的近红外光谱,对其分别进行多元散射校正(MSC)、正交信号校正(OSC)以及二者联用的预处理方法,采用拉丁配分法选择3/4样本作为训练集,1/4样本作测试集,建立支持向量机(SVM)模型进行分类,并与基于同样预处理方法建立的偏最小二乘(PLS)模型分类结果进行了比较.SVM对正常、增生和癌变三类不同的组织样品分类结果较好,总分类正确率约92%,好于PLS模型的结果(最高正确率90%).研究结果表明,光谱数据的预处理和建模方法对分类结果有重要影响,SVM结合子宫内膜组织的近红外光谱有望发展成为一种新型的肿瘤诊断方法.  相似文献   

8.
大量废弃的塑料制品给生态环境造成严重破坏,当务之急是要对塑料进行分类回收。传统的分类方法普遍存在成本高,效率低,操作复杂等问题,不能满足工业生产的需要。激光诱导击穿光谱技术由于具备简单灵活,快速灵敏等优点,在物质鉴别领域有广泛应用。采用激光诱导击穿光谱技术结合主成分分析(PCA)和支持向量机(SVM)算法对20种塑料进行分类识别研究。由于目前有关塑料分类识别速率的研究报道较少,该实验在保证识别准确率的前提下,进一步研究和分析实验过程耗费的时间,满足工业生产中快速分类的要求。每种塑料采集100组光谱数据,随机选取50组数据作为训练集建立模型,余下50组作为测试集测试模型的分类识别效果,所以训练集和测试集各有1 000组光谱数据。将训练集的数据不加处理地输入SVM中进行训练,并采用5折交叉验证建立最佳模型,此时测试集的识别准确率为99.90%,建模时间为1小时58分41.13秒,预测时间为11.96 s。由此可见,单纯使用SVM算法可以得到很高的准确率,但是需要耗费大量时间。为了提高实验效率,引入主成分分析算法,将原来的高维数据变换成低维数据,并用降维后的数据训练模型。针对不同的主成分个数,均采用随机训练十次再取平均值的方法获得相关数值。实验表明,当选取主成分个数为13时,得到相应的识别准确率为99.80%,而PCA处理时间为1.44 s,建模时间为12.16 s,预测时间仅为0.02 s。虽然PCA算法结合SVM算法在对20种塑料进行分类识别时准确率有轻微下降,但是大大减少了模型训练的时间,实验效率得到很大程度的提高。结果表明,结合两种算法辅助激光诱导击穿光谱可以对塑料进行快速准确的分类识别。  相似文献   

9.
针对传统光谱法检测鸡蛋新鲜度存在的效率低、准确率不够高等问题,提出采用可见-近红外光谱结合极度提升树(XGBoost)等算法对鸡蛋新鲜度分类进行研究,以期在保证足够高准确度的同时大幅提高检测效率。将不同储存条件下的鸡蛋作为样本,并分别划分为训练集和测试集,采用训练集的综合评价指标(F-measure)和准确率(Accuracy)评估分类模型的性能。具体地,首先利用可见-近红外光谱系统采集鸡蛋的反射光谱,将所得的光谱数据经过不同预处理后再结合随机森林(random forest, RF)、偏最小二乘(partial least squares, PLS)、支持向量机(support vector machine, SVM)、多层感知机(muhi-layer perception, MLP)以及XGBoost等分类算法构建鸡蛋新鲜度分类评估模型,并对比各模型性能指标。分析结果发现,经Savitzky-Golay一阶导(Savitzky Golay first-order derivative, SG-1st-Der)预处理后的RF、 SVM、 XGBoost模型和经标...  相似文献   

10.
近红外光谱属微弱信号,其质量易受被测物体自身状态及各种外界因素干扰,具体而言,在近红外光谱定性分析中,影响光谱质量的因素主要有光谱仪状态改变、光谱采集人员错误操作、奇异样本干扰等。建模时若混入质量较差的光谱易影响所建模型的稳健性与适用性,因此光谱质量判定是确保模型预测能力的一项重要工作。目前用于定量分析的光谱质量判定研究较多,而用于定性分析的光谱质量判定研究较少,为此,提出一种基于支持向量机数据描述的近红外光谱定性分析光谱质量判定方法,采用自制漫透射近红外光谱装置采集单籽粒玉米光谱,以正常状况下采集的某品种玉米单籽粒漫透射光谱作为正常样本,而人为漏光、近红外探测器窗口覆盖玉米表皮碎屑、光源强度改变、光源与被测玉米籽粒距离改变、相近品种玉米籽粒混入等几种情况下所采集光谱作为异常样本,在此数据集基础上研究了基于支持向量机数据描述的定性分析光谱质量判定模型建立的原理与方法,其后将支持向量机数据描述方法与常用的马氏距离法、局部异常因子法等光谱质量判定方法进行了对比,并以正常样本正确识别率与异常样本正确拒识率的均值作为评价标准,对实验结果进行分析,由实验结果可以看出相比其他两种方法,基于支持向量机数据描述的光谱质量判定方法具有最优判定能力,建模集正常样本数目会影响光谱质量判定能力,在实际使用光谱质量判定方法时,建模集应包含足量样本。在近红外定性分析时可以将该方法作为剔除异常光谱的手段,在预处理、特征提取,模式分类等近红外光谱定性分析步骤前首先进行基于支持向量机的光谱质量判定步骤,并剔除异常光谱,可有效提高近红外光谱定性分析模型的可靠性,亦为近红外光谱定性分析光谱质量判定提供新的方法参考。  相似文献   

11.
近红外光谱中包含了物质中有机分子含氢基团的特征信息,具有维度高、冗余大等特点。传统的基于浅层校正模型,比如主成分回归、偏最小二乘回归、人工神经网络、支持向量回归等,无法提取近红外光谱数据深层的信息。提出一种基于堆叠监督自动编码器的近红外光谱建模方法,不仅可以拟合光谱数据与理化值之间复杂的非线性关系,还可以提取数据深层的特征信息。首先通过对比不同的光谱预处理对模型预测结果的影响,选择最优的预处理方法,然后再使用相关系数法提取特征波段。将处理好的近红外光谱数据作为堆叠监督自动编码器的输入信号,利用理化值对多个监督自动编码器进行有监督的预训练;将多个经过预训练的监督自动编码器进行堆叠,得到堆叠监督自动编码器;将预训练的参数作为堆叠监督自动编码器的初始化参数,然后再利用理化值对堆叠监督自动编码器进行有监督的微调,最后得到模型的最优参数。分别利用玉米含水量和黄酒总酸含量等近红外数据集进行验证,建立了偏最小二乘回归预测模型、人工神经网络预测模型、堆叠自动编码器预测模型和堆叠监督自动编码器预测模型,验证了堆叠监督自动编码器建模的可行性;以预测均方根误差和预测相对分析误差两个指标对比分析了偏最小二乘回归、反向传播人工神经网络、堆叠自动编码器及堆叠监督自动编码器四种建模方法的评价指标。分析结果表明,采用该方法建立的模型,模型预测效果更好,玉米含水量数据集的两个评价指标达到了0.060 4和4.313;黄酒总酸含量数据的两个评价指标达到了0.120和4.227,均优于另外三种方法。  相似文献   

12.
为了快速检测玉米品种类型,基于支持向量机(SVM)和近红外光谱联合建立玉米品种的分类模型。以郑单958、先玉335、京科968、登海605和德美亚等五个品种共计293个样本为研究对象,对采集的近红外光谱进行标准正态变量变换(SNV)处理后使用主成分分析法(PCA)对光谱数据进行降维处理。按照6∶1比例,随机选取251个样本为训练集,42个样本作为测试集,探讨贝叶斯优化算法(BO)对SVM模型性能的影响。分别使用网格搜索(GS)、遗传算法(GA)和BO算法等三种方法对SVM模型的两个重要参数惩罚因子C和径向基核函数参数γ进行寻优。选择各模型十折交叉验证识别准确率最高时对应的惩罚因子和核参数作为建模参数,建立SVM分类模型。将使用BO算法建立的SVM分类模型与使用GS和GA进行参数寻优后建立的模型性能进行比对。实验发现,使用BO优化的SVM分类模型相比于其他两种优化算法得到的SVM模型性能具有显著优势,测试集的识别准确率可达到100%。说明使用BO算法寻优的SVM模型参数是全局最优参数,其他两种优化算法寻优的参数可能陷入了局部最优,从而导致模型性能表现不佳。在进行PCA降维前后的光谱数据上分别建立BO-SVM模型,结果表明,BO算法对于高维数据优化效果不佳,更适用于低维数据。对于不同样本类别间数量不均衡导致模型性能表现不佳的问题,通过剔除郑丹958和先玉335两类数量较少的样本,使用剩余三个类别,共计248个样本重新建立SVM模型,实验发现,剔除两类小样本之后,各个模型在测试集上的性能均有提升,说明对于类间样本数量不均衡问题,某类样本数量越多,对于模型参数的修正就越细腻,模型对该类的拟合效果就越好。研究结果可用于玉米品种的快速鉴别,也可为基于近红外光谱的其他农产品分类和产地鉴别提供参考。  相似文献   

13.
The rock near-infrared spectrum contains information of its composition and structure. The interpretation of rock near-infrared spectrum is one of the important approaches in the qualitative and quantitative analyses of the alteration minerals in rock. The rock near-infrared spectra are classified using optimized fuzzy C-means clustering algorithm, and the main mineral composition is obtained for different rock samples through the analysis of cluster centers. The minimum Spectral Correlation Coefficient is used as the objective function to classify the simulation data. In this study, the classification method was first tested for parameter setting using simulation data, which was the mixture of several standard mineral spectra quantified in terms of reflectivity in the near-infrared band. Classification accuracies under different fuzzy index values are compared. When the fuzzy index value is 1.5, the classification accuracy of the simulation samples is 83%. The initial values of different cluster centers were shown to affect the classification result. In the practical application, the initial values of cluster centers need to be rationally chosen based on the knowledge of mineral spectroscopy. This method is applied in the clustering analysis of the rock near-infrared spectra, which were also quantified in terms of reflectivity in the near-infrared band. These actual rock near-infrared spectra were measured by a spectrometer, while the classification results were compared with X-ray diffraction analysis to show the effectiveness of our algorithm. Our study has shown that, with the optimized fuzzy C-means clustering algorithm, the interpretation of rock near-infrared spectra can help us obtain information of the mineral composition and structure more effectively in terms of accuracy and speed. This method is suitable for the rapid processing of massive rock near-infrared spectra and may become an important technology in geological survey and geological prospecting.  相似文献   

14.
基于光谱技术的杨梅汁品种快速鉴别方法的研究   总被引:6,自引:6,他引:0  
为了实现杨梅汁品种的快速无损鉴别,提出了一种用可见和近红外光谱技术快速鉴别杨梅汁品种的新方法。首先采用偏最小二乘法进行模式特征分析,经过交互验证法判别,确定最佳主成分数为9。完成特征提取后,将这9个主成分作为神经网络的输入变量,建立了三层BP神经网络,实现类别预测的同时也完成了数学建模与优化分析工作。3个品种的杨梅汁样本数均为20,共计60个样本。在神经网络学习中,将其分成训练集样本51个和预测集样本9个。对9个未知样本进行预测,准确率为100%。说明本文提出的基于光谱技术和模式识别的方法具有很好的分类和鉴别能力。  相似文献   

15.
基于LVQ与SVM算法的近红外光谱煤产地鉴别   总被引:1,自引:0,他引:1  
传统煤产地鉴别方法一般以发热量、挥发分、粘结指数、哈氏可磨指数和坩埚膨胀序数作为分类指标,过程复杂耗时较多、耗费巨大的人力、物力并且无法直接快速的得到煤样产地等问题,借助近红外光谱技术快速无损检测的优势,利用基于SVM的留一算法对光谱数据集进行异常样本剔除,得到包含正确光谱信息的煤样光谱数据集,构造基于SVM算法与LVQ算法的定性分析模型,完成基于近红外光谱分析技术的煤产地的快速鉴别,无需对煤样的各种指标进行汇总并且人为预测。针对SVM分析模型中存在随机参数优化问题,引入PSO算法对SVM模型中的损失参数C和核函数半径g进行改进,得到最优参数,最后引入计算准确率的方法对比以上模型并进行评价分析。实验一共收集了加拿大、俄罗斯、澳大利亚、印度尼西亚、中国内蒙等5个地区的煤样光谱数据集,数据集共计305组煤样样本,其中异常样本共计10组,分别选择各国煤炭光谱的前31组作为训练样本,后6组数据作为测试样本,结果表明各分类模型的分类准确率均能达到75%以上,其中基于PSO算法改进的SVM分析模型的准确率可达到96.67%,仅一个样本出现问题,可快速高效地实现基于近红外光谱分析技术的煤产地的鉴别。  相似文献   

16.
采用近红外透射光谱研究了汽车制动液品牌及新旧的鉴别。采集宝马(BMW),丰田(Toyota),沃尔沃(Volvo)以及嘉实多(Castrol)四种品牌的汽车制动液全新样本以及用过的样本的透射光谱。分别对每一种品牌下全新与用过汽车制动液样本的光谱数据进行主成分分析(PCA),主成分得分图表明不同品牌制动液以及该品牌下全新样本以及用过的样本能够被较好的区分,其光谱特性存在差异。基于主成分载荷(Loadings)进行特征波数选择,偏最小二乘判别分析(PLS-DA),线性判别分析(LDA),簇类独立软模式法(SIMCA),k最邻近分类算法(KNN),随机森林(RF),误差反向传播人工神经网络(BPNN),径向基神经网络(RBFNN),极限学习机(ELM),支持向量机(SVM),最小二乘支持向量机(LS-SVM)等判别分析方法用于建立基于特征波数的判别分析模型,判别模型的建模集和预测集判别正确率均略低于或达到了100%。与其他三种品牌汽车制动液相比,嘉实多全新样本与用过样本的差异较小,KNN与LS-SVM模型的建模集正确率均低于100%。结果表明,近红外透射光谱结合特征波长选择以及判别分析模型对不同品牌制动液以及同一品牌下全新样本以及用过的样本进行识别是可行的,为开发在线或便携式仪器提供理论支持。  相似文献   

17.
基于KPCA和近红外光谱的鉴别玉米单倍体方法研究   总被引:1,自引:0,他引:1  
玉米的单倍体鉴别技术对玉米单倍体育种技术非常重要。近红外光谱分析技术以其操作简便,可在线分析监测,速度快,无损,测试成本低等特点在农业领域备受关注,应用广泛。实验首先通过美国JDSU公司的近红外光谱仪采集由国家玉米改良中心提供的玉米种子单倍体、多倍体的近红外光谱数据,然后对获得的原始数据做平滑(smoothing)、一阶导(first derivative,FD)和矢量归一化(vector normalization,VN)预处理以消除其噪声影响,再采用核函数为高斯核函数(Gaussian kernel function)的核主成分分析(kernel principal components analysis, KPCA)的方法将玉米种子的近红外光谱数据映射到高维空间中,并对映射后的数据做非线性特征提取,然后应用支持向量机(support vector machines, SVM)对提取的玉米种子单倍体、多倍体光谱数据的非线性特征建立分类模型,最后输入测试数据进行玉米单倍体、多倍体的分类鉴别测试,预测玉米种子是否是单倍体。设计了两组对比试验,其正确识别率的平均值分别达到95%和93.57%。在该实验中, 基于KPCA的玉米单倍体识别算法的性能表现较好、识别率较高。通过两组对比实验,证明了玉米种子的近红外光谱数据更适于先将其映射于高维空间中进行特征提取,再对提取的特征进行建模、分类分析。该实验为玉米单倍体识别技术提供了新的思路和方法。  相似文献   

18.
目前我国蜂蜜市场掺假现象严重,研究一种快速、准确的方法用于市场流通领域掺假蜂蜜的鉴别具有重要的现实意义。采用近红外光谱(NIR)结合化学计量学方法对常见的天然蜂蜜以及掺假(掺杂常见糖浆)蜂蜜进行建模识别,并比较偏最小二乘-判别分析(PLS-DA)及支持向量机(SVM)对糖浆掺假蜂蜜鉴别模型的影响。首先,采集来自中国10个省份、20种常见蜂蜜的112个天然纯蜂蜜样品,以及6种常见糖浆样品按不同糖浆含量(10%,20%,30%,40%,50%,60%)配制的112个掺假蜂蜜样品,共计224个样品;通过近红外光仪器扫描获得所有样品的近红外光谱数据(波长范围400~2 500 nm);然后,分别采用一阶导数(FD)、二阶导数(SD)、多元散射校正(MSC)、标准正态变化(SNVT)四种方式对原始光谱进行预处理;再结合PLS-DA和SVM建立天然蜂蜜和糖浆掺假蜂蜜的鉴别模型,比较不同预处理方法对两种不同建模算法建立的蜂蜜掺假鉴别模型效果。其中SVM算法的惩罚参数c和核函数参数g通过网格搜索法(GS)、遗传算法(GA)、粒子群算法(PSO)三种寻优算法进行优化。分析结果表明:光谱数据进行预处理后所建立的模型准确率均有明显提升,而对于SVM模型,惩罚参数c和核函数参数g对模型准确率的提升效果要比光谱预处理带来的提升效果更明显。在PLS-DA算法中,经FD光谱预处理后建立的模型效果最好,最佳PLS-DA模型准确率为87.50%;在SVM算法中,经MSC预处理后,再通过GS寻优,获得惩罚参数c为3.0314,核函数参数g为0.3298的条件下所建立的模型效果最好,最佳SVM模型准确率为94.64%。由此可见,非线性的SVM算法结合NIR光谱数据所建立的天然蜂蜜与糖浆掺假蜂蜜鉴别模型要优于线性的PLS-DA模型,同时表明NIR光谱结合化学计量学方法对常见糖浆掺杂的中国蜂蜜鉴别是可行的。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号