首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 218 毫秒
1.
为了快速检测玉米品种类型,基于支持向量机(SVM)和近红外光谱联合建立玉米品种的分类模型。以郑单958、先玉335、京科968、登海605和德美亚等五个品种共计293个样本为研究对象,对采集的近红外光谱进行标准正态变量变换(SNV)处理后使用主成分分析法(PCA)对光谱数据进行降维处理。按照6∶1比例,随机选取251个样本为训练集,42个样本作为测试集,探讨贝叶斯优化算法(BO)对SVM模型性能的影响。分别使用网格搜索(GS)、遗传算法(GA)和BO算法等三种方法对SVM模型的两个重要参数惩罚因子C和径向基核函数参数γ进行寻优。选择各模型十折交叉验证识别准确率最高时对应的惩罚因子和核参数作为建模参数,建立SVM分类模型。将使用BO算法建立的SVM分类模型与使用GS和GA进行参数寻优后建立的模型性能进行比对。实验发现,使用BO优化的SVM分类模型相比于其他两种优化算法得到的SVM模型性能具有显著优势,测试集的识别准确率可达到100%。说明使用BO算法寻优的SVM模型参数是全局最优参数,其他两种优化算法寻优的参数可能陷入了局部最优,从而导致模型性能表现不佳。在进行PCA降维前后的光谱数据上分别建立BO-SVM模型,结果表明,BO算法对于高维数据优化效果不佳,更适用于低维数据。对于不同样本类别间数量不均衡导致模型性能表现不佳的问题,通过剔除郑丹958和先玉335两类数量较少的样本,使用剩余三个类别,共计248个样本重新建立SVM模型,实验发现,剔除两类小样本之后,各个模型在测试集上的性能均有提升,说明对于类间样本数量不均衡问题,某类样本数量越多,对于模型参数的修正就越细腻,模型对该类的拟合效果就越好。研究结果可用于玉米品种的快速鉴别,也可为基于近红外光谱的其他农产品分类和产地鉴别提供参考。  相似文献   

2.
烟草是一种成分复杂的天然植物,地理位置、生长条件等外界因素直接影响着烟叶的品质;我国烟叶种植范围十分广泛,每个产区种植的烟叶都有其独特的风格特征,不同产区的烟叶配比对卷烟的质量起着决定性的作用。为实现烟叶产地准确、快速判别,基于近红外光谱(NIRS),采用灰狼算法(GWO)优化的支持向量机(SVM)算法实现烟叶产地鉴别分类。以8个产地的824个烟叶样本为研究对象,基于x-y距离样本集划分(SPXY)方法得到校正集617个和验证集207个样品。首先应用最佳波长筛选方法,如竞争自适应加权采样(CARS)和随机青蛙(RF)算法减少光谱冗余信息,最终从1 609个变量中分别获得141和534个与产地相关的重要变量,并以此输入SVM作为建模数据,接下来在相同搜索范围内比较了粒子群优化算法(PSO)、遗传算法(GA)和GWO对SVM分类模型的优化效果。结果表明,经RF筛选后的光谱变量较CARS具有更好的产地建模性能,其中RF-GWO-SVM对8个产地烟叶的整体判别正确率达到了96.62%,相较于RF-PSO-SVM和RF-GA-SVM正确率更高。同时,RF-GWO-SVM的运行时间分别比RF-PSO-SVM和RF-GA-SVM的运行时间缩短156和131 min,RF-GWO-SVM具有精度更高、寻优速度更快等优点。GWO对于SVM模型参数具有更高效的优化能力,可用于烟叶产地快速鉴别模型的建立。  相似文献   

3.
三七粉是三七的主要消费和商品形式,市场上存在以次充好、甚至是掺假的现象,由于是粉状物料,难以用肉眼判别,为了实现对不同质量等级的三七粉进行无损鉴别。将30头、40头、60头和80头的三七主根研磨成粉,制备样本。采用可见近红外高光谱成像系统(400.68~1 001.61 nm)采集4种不同头数三七粉,共计384个样品的高光谱图像,提取高光谱图像感兴趣区域(ROI)的平均光谱值作为样本原始光谱。将384个三七粉样本按2∶1的比例划分训练集和测试集。采用卷积平滑(SG)、多元散射校正(MSC)和标准正态变量变换(SNV)3种预处理方法对三七粉样本光谱信息进行预处理并建立支持向量机(SVM)分类模型,通过比较基于3种预处理方法的SVM模型测试集分类准确率,确定SNV为最优预处理方法。采用迭代保留信息变量(IRIV)、变量组合集群分析(VCPA)和变量组合集群分析混合迭代保留信息变量(VCPA-IRIV)3种特征选择方法提取SNV预处理后光谱的特征波长并建立基于特征光谱和原始光谱的SVM分类模型,通过比较基于3种特征选择方法得到的特征波长建立的SVM模型测试集分类准确率,发现将VCPA与IRIV相结合的VCPA-IRIV为最优特征选择方法。VCPA-IRIV提取了18个特征波长代替全光谱数据参与建模,该算法在降低模型复杂度的同时保持了模型的分类精度。为了提高模型的分类精度,采用引力搜索算法(GSA)对SVM模型中惩罚因子c和核参数g进行寻优,并与网格搜索(GS)的结果进行比较,结果表明,VCPA-IRIV-GSA-SVM模型分类效果最好,测试集分类准确率达到100%。可见,利用可见近红外高光谱成像对三七粉进行质量等级无损鉴别是可行的,为市场上三七粉的质量等级鉴别提供了参考。  相似文献   

4.
采用近红外光谱结合化学计量学,对来源于不同产地的81个党参样本进行快速、无损的定性研究.将党参样本粉碎后,采用光纤漫反射采集近红外光谱,并结合随机森林建立党参的定性模型,同时对比分析了不同光谱预处理方法(未处理、变量标准化十一阶导数、偏移校正十一阶导数)对鉴别结果的影响.结果显示,样本可按产地区分开;光谱经偏移校正十一阶导数处理后,训练集准确率达100%,测试集准确率为94%.研究表明,近红外光谱结合随机森林原理简单,易操作,准确率高,为作为快速鉴别党参的参考方法.  相似文献   

5.
三叶青是我国珍稀中药材,具有多种疗效,但不同产地的三叶青有效成分含量差异悬殊,为防止三叶青以次充好,其产地鉴别尤为重要。以浙江、云南、安徽、广西和湖北五个产地的三叶青为研究对象,利用傅里叶变换近红外光谱分析仪(Fourier transform near infrared spectroscopy, FT-NIR)收集4 000~10 000 cm-1范围内的近红外光谱,由于三叶青近红外光谱数据还未完善,因此在其产地鉴别上,应对鉴别算法提出更高的要求,即在实现三叶产地鉴别的同时,还要能够有效地识别出其他或未知新产地的三叶青。针对这一问题,本文结合三叶青近红外光谱数据的特点,对算法共做了三方面改进:①从距离的角度估计样本的概率密度;②以训练样本可信度的方式计算带宽参数;③在未知新产地的识别上,提出一种基于训练集样本的概率密度函数的识别方法。结果表明,该算法对训练集样本的识别精度达到了100%,且在140组预测集样本中,只有3组样本识别出错,并能够100%地识别出未知新产地的三叶青,说明基于核密度估计的改进算法在三叶青产地鉴别上,不仅鉴别精度高,且能够有效识别出其他或未知新产地的三叶青。  相似文献   

6.
光谱技术与机器学习算法结合快速识别微塑料, 为微塑料的现场检测提供了极大的技术支持,是一个得到极大关注的新领域。近红外光谱检测技术具有检测速度快、灵敏度高、不损坏样品,且可以在不对样品进行预处理的情况下直接检测等特点,在化学分析、质量检测等领域广泛应用。本文基于近红外光谱检测技术,研究比较了结合Support Vector Machine(SVM)和Extreme Gradient Boosting(XGBoost)两种机器学习分类算法,构建微塑料的高速有效识别分类模型。采用微型近红外光谱仪采集了20种常见的微塑料标准样品的光谱数据,为了防止过拟合,对每种样品多次采样,共收集了1 260个微塑料样本,每个样本包含512个数据点。利用XGBoost算法进行特征重要性排序,共提取了对识别准确率影响较大的65个数据点。分别采用SVM算法和XGBoost算法对数据降维后提取的65个数据点建立微塑料快速识别模型,并运用网格搜索(GridSearchCV)对XGBoost算法影响较大的超参数进行选取,确定n_estimators,learning_rate,min_child_weigh,max_depth,gamma的最佳超参数分别为700,0.07,1,1,0.0。为了提高模型的稳定性,识别速率和泛化能力,对模型采用10折交叉验证和混淆矩阵评估;研究结果表明,XGBoost模型对微塑料的识别准确率为97%,而SVM模型对微塑料的识别准确率为95%;XGBoost模型对微塑料识别的正确率优于SVM模型。综上所述,XGBoost模型微塑料识别整体性能优于SVM模型,为实际微塑料快速识别提供技术支撑。  相似文献   

7.
稀疏降噪自编码算法用于近红外光谱鉴别真假药的研究   总被引:1,自引:0,他引:1  
近红外光谱分析技术作为一种快速、无损检测技术十分适用于真假药品现场鉴别。自编码网络作为当前机器学习领域研究的热点受到广泛关注,自编码网络是一种典型的深度学习网络模型,它比传统的潜层学习方法具有更强的模型表示能力。自编码网络使用贪婪逐层预训练算法,通过最小化各层网络的重构误差,依次训练网络的每一层,进而训练整个网络。通过对数据进行白化预处理并使用无监督算法对输入数据进行逐层重构,使网络更有效的学习到数据的内部结构特征。之后使用带标签数据通过监督学习算法对整个网络进行调优。首先对真假琥乙红霉素片的近红外光谱数据进行预处理以及白化预处理,通过白化处理降低数据特征之间的相关性,使数据各特征具有相同的方差。数据处理之后利用稀疏降噪自编码网络针对真假药品光谱数据建立分类模型,并将稀疏降噪自编码网络模型与BP神经网络以及SVM算法在分类准确率及算法稳定性方面进行对比。结果表明对光谱数据进行白化预处理能有效提升稀疏降噪自编码网络的分类准确率。并且自编码网络分类准确率在不同训练样本数量下均高于BP神经网络,SVM算法在少量训练样本的情况下更有优势,但在训练数据集样本数达到一定数量后,自编码网络的分类准确率将优于SVM算法。在算法稳定性方面,自编码网络较之BP神经网络和SVM算法也更稳定。使用稀疏降噪自编码网络对真假药品近红外光谱数据进行建模,能对真假药品进行有效的鉴别。  相似文献   

8.
目前我国蜂蜜市场掺假现象严重,研究一种快速、准确的方法用于市场流通领域掺假蜂蜜的鉴别具有重要的现实意义。采用近红外光谱(NIR)结合化学计量学方法对常见的天然蜂蜜以及掺假(掺杂常见糖浆)蜂蜜进行建模识别,并比较偏最小二乘-判别分析(PLS-DA)及支持向量机(SVM)对糖浆掺假蜂蜜鉴别模型的影响。首先,采集来自中国10个省份、20种常见蜂蜜的112个天然纯蜂蜜样品,以及6种常见糖浆样品按不同糖浆含量(10%,20%,30%,40%,50%,60%)配制的112个掺假蜂蜜样品,共计224个样品;通过近红外光仪器扫描获得所有样品的近红外光谱数据(波长范围400~2 500 nm);然后,分别采用一阶导数(FD)、二阶导数(SD)、多元散射校正(MSC)、标准正态变化(SNVT)四种方式对原始光谱进行预处理;再结合PLS-DA和SVM建立天然蜂蜜和糖浆掺假蜂蜜的鉴别模型,比较不同预处理方法对两种不同建模算法建立的蜂蜜掺假鉴别模型效果。其中SVM算法的惩罚参数c和核函数参数g通过网格搜索法(GS)、遗传算法(GA)、粒子群算法(PSO)三种寻优算法进行优化。分析结果表明:光谱数据进行预处理后所建立的模型准确率均有明显提升,而对于SVM模型,惩罚参数c和核函数参数g对模型准确率的提升效果要比光谱预处理带来的提升效果更明显。在PLS-DA算法中,经FD光谱预处理后建立的模型效果最好,最佳PLS-DA模型准确率为87.50%;在SVM算法中,经MSC预处理后,再通过GS寻优,获得惩罚参数c为3.0314,核函数参数g为0.3298的条件下所建立的模型效果最好,最佳SVM模型准确率为94.64%。由此可见,非线性的SVM算法结合NIR光谱数据所建立的天然蜂蜜与糖浆掺假蜂蜜鉴别模型要优于线性的PLS-DA模型,同时表明NIR光谱结合化学计量学方法对常见糖浆掺杂的中国蜂蜜鉴别是可行的。  相似文献   

9.
随着中药制剂存储时间的延长,其有效成分含量逐渐降低。化学检测手段损耗样品、检测时间长、成本高,利用近红外光谱对不同年份的经典名方安胎丸进行年份鉴别。为探讨这种无损、快速质量控制方式的可行性,采集了三年的105粒样本在1 000~1 799 nm波段近红外光谱吸光度数据,随机选择80个作为训练集, 25个作为测试集。首先采用连续投影算法(SPA),消除原始光谱数据中的冗余信息,对输入全光谱进行优化降维,根据测试集的内部交叉验证均方根误差值,从输入的800个波长中提取出11个特征波长,分别是:(1 692, 1 714, 1 405, 1 001, 1 114, 1 478, 1 514, 1 788, 1 202, 1 014, 1 164) nm;然后建立支持向量机(SVM)分类模型,由于SVM模型中的参数选取对分类正确率影响很大,利用粒子群优化(PSO)算法,对SVM模型中惩罚参数C和核函数参数进行寻优,形成PSOSVM分类模型;最后将SPA降维后的特征波长输入到PSOSVM分类算法中。用Matlab软件进行仿真测试,分别构建SVM, SPA-SVM和本文的SPA-PSOSVM三种方法分类模型,分类测试正确率分别达到了76%, 92%和100%。从仿真结果可以看出, SPA波长优选可有效地降低光谱信息中存在的冗余信息,减少建模所需的时间,结合PSOSVM分类模型降低了模型的复杂度,提高分类精度。结果证实,依照所建立的利用近红外算法,可以准确无损区分中药制剂安胎丸生产的年份,该研究可为中药制剂年份间差异评价提供一种思路。  相似文献   

10.
贮存时间是影响生菜品质的一项重要因素,传统的贮存时间鉴别方法主要依靠人工经验,但是这种方法的准确率和可信度并不高。研究的目标是建立一种基于模糊识别的模型进行生菜光谱分析以实现生菜贮存时间的鉴别,并与其他鉴别方法作比较。为此,在当地超市购买60份新鲜生菜样品,存放于冰箱中待用。首先,通过Antaris Ⅱ近红外光谱检测仪采集生菜样品的近红外光谱数据,每隔12小时检测一次,每个样本检测重复三次,并取三次平均值作为实验数据。其次,利用多元散射校正(MSC)减少近红外光谱中的冗余信息。为了进一步去除近红外光谱中的无用信息以及简化随后的数据分类过程,分别运用主成分分析(PCA)和排序主成分分析 (PCA Sort)。其中,PCA Sort通过改进对主成分的排序方法能提高分类准确率,同时便于模糊线性鉴别分析(FLDA)进一步提取特征。PCA和PCA Sort的计算仅运用了前15个主成分(能充分反映光谱的主要信息)。最后,利用模糊线性鉴别分析算法(FLDA)和K近邻算法(KNN)进一步分类所得的低维数据。基于PCA和KNN算法的模型鉴别准确率达到43%,而基于PCA,FLDA和KNN算法的模型鉴别准确率可达83%。上述结果说明基于PCA,FLDA和KNN算法的模型鉴别准确率已经得到较大程度提高。当用PCA Sort替代了模型中的PCA算法后,结合FLDA和KNN算法则鉴别准确率达到98.33%。实验结果表明PCA Sort结合FLDA和KNN所建立的模型是有效的生菜贮存时间鉴别模型。  相似文献   

11.
激光诱导击穿光谱技术具有微损、原位、快速分析的特点,在样品分类识别、成分分析等领域有广阔的应用前景。为探索该技术在天然地质样品识别应用的可行性,提出了一种自组织特征映射神经网络结合相关判别对天然地质样品LIBS光谱分类识别的方法。为减小全谱中背景噪声等不相关数据干扰、降低计算量,在元素谱线归属的基础上进行了特征谱线提取,实现了高维光谱数据的降维。以特征谱数据为输入建立网络训练模型,得到具有输入样本特征的权向量,通过权向量与待测样本进行相关分析可以实现样品分类。对16种天然地质样品的分类算法实验证明,在全谱、主成分降维和特征谱段三种数据处理方法中,特征谱的降维和提取LIBS数据主特征效果最优。改进的SOM网络结合相关判别算法比支持向量机方法和直接应用SOM网络方法的分类准确度更高,初步证实了该方法的有效性。  相似文献   

12.
常规的煤炭鉴别方法需进行繁琐的制样过程,且需结合多种化学参数指标进行综合判定,以得到较为准确的分析结果。提出一种基于500~2 350 nm的可见-近红外全谱段光谱分析技术与多层感知器(multilayer perceptron, MLP)分类方法相结合的块状商品煤鉴别方法。该方法具有非接触、无前期制样、无化学分析的优势,可快速高效的获取煤炭的分类信息。采用地物光谱仪采集煤炭原始光谱数据,对噪声过大、影响后续处理的谱段进行删除,剩余部分采用小波阈值去噪法进行噪声去除。将去噪后的数据分成三个数据集:可见-近红外光谱(500~900 nm)数据集、短波红外光谱(1 000~2 350 nm)数据集、全谱段光谱(500~2 350 nm)数据集。对以上三个数据集进行主成分分析,将提取出的25个主成分输入多层感知器分类模型。多层感知器模型由输入层、隐藏层(两层)、softmax分类器构成。对三个数据集进行分类精度的对比,并采用随机森林(random forest, RF)与支持向量机(support vector machine, SVM)两种分类算法进行进一步的验证分析。结果表明:对块状商品煤分类,全谱段光谱分析技术由于数据信息量丰富,能够得到更优的分类效果,在训练样本数为132时,采用MLP分类器的分类精度最高,为98.03%;随机森林与SVM的分类结果验证了全谱段数据集的优越性与普适性。该研究为煤炭的在线分析、便携式煤炭检测仪器的研发提供了可靠的技术支持。  相似文献   

13.
热值是煤质特性的重要参数之一,很大程度上影响着燃煤锅炉的运行。为了克服传统检测方法所存在的问题,将激光诱导击穿光谱(LIBS)应用于燃煤热值的定量分析。煤的结构复杂,所含的元素种类众多,包括了主量元素、次量元素和痕量元素,致使煤的LIBS光谱信息复杂。如何有效提取LIBS光谱信息,实现准确的定量化测量是LIBS在煤特性检测中发挥作用的前提和基础。近年来,随着人工智能技术的发展,相关的分析技术也开始应用于煤的工业指标分析和热值预测中。为实现煤样品中LIBS光谱信息的有效提取,同时为克服常规的分析方法易出现的过渡拟合、收敛性不好等问题,提出采用结合K-fold Cross Validation(K-CV)参数优化的支持向量机(SVM)回归方法,实现LIBS定量分析煤中的热值。SVM方法是结构风险最小化的近似实现,可用于模式分类和非线性回归。为了得到有效的LIBS分析模型,实验选用44种电厂常用的热值含量不同的煤样作为实验对象,选择其中33个作为训练集,剩余11个为测试集。利用搭建的LIBS实验系统获取所选煤样品的等离子体发射光谱数据,首先分析了SVM热值回归模型的参数-惩罚因子C、核函数参数g与模型精度的关联,确定Cg最佳取值范围,然后分别建立了基于LIBS全谱和某些元素(非金属元素和金属元素)特征光谱的SVM回归模型。利用训练集光谱数据,结合K-CV法得到热值SVM回归模型的最优参数Cg的值,建立基于SVM最优参数的煤热值定量分析模型。然后将测试集的光谱数据作为输入量用于测试所建立模型的可靠性,得到分别采用全谱、非金属元素特征光谱、非金属与金属元素特征谱相结合的热值定量分析模型,其决定系数R2均达到0.99以上,均方误差分别为0.12,0.17和0.06 (MJ·kg-1)2,预测平均相对偏差分别为1.2%,1.23%和0.69%。结果表明:基于K-CV参数优化SVM回归方法可用于LIBS技术实现燃煤热值的定量分析,且可得到较高的分析精确度和准确度;同时通过对比选用不同的光谱特征的定量分析模型可知,采用非金属与金属元素的特征光谱所建立的基于K-CV参数优化SVM的热值定量模型,能够有效提高LIBS应用于快速检测煤热值的精度和准确度,实现煤热值的准确预测。  相似文献   

14.
小麦是制作馒头的主要原料之一,小麦中水、蛋白质、淀粉会因产地以及烘干程度的差异而不同,进而影响到加工成馒头的品质。所以实现对小麦产地和烘干程度的快速鉴别就显得尤为重要。感官评定是鉴别小麦产地和烘干程度常用的方法,对比感官评定,光谱分析可以识别样品中的分子结构等信息。基于此,尝试利用近红外和中红外光谱融合技术实现对不同产地和不同烘干程度的小麦同时鉴别。首先选取了两个不同产地的小麦,再利用微波干燥法对两个不同产地的小麦做烘干预处理,使烘干的小麦水含量为12%±0.5%,原麦水含量为18%±0.5%。分别标记为原麦A,烘干A,原麦B,烘干B,再将小麦研磨成粉末,过100目筛网筛选后,置于自封袋中备用。随后分别采集四种小麦样品的近红外和中红外光谱信息,在Matlab 7.10的环境下使用标准正态变量变换(standard normal variable transformation, SNVT)对采集到的原始光谱数据进行预处理,利用主成分分析对预处理后的数据进行降维处理,再结合线性判别分析(linear discriminant analysis,LDA)和支持向量机(support vector machine, SVM)分别建立小麦近红外、中红外光谱数据识别模型。另外利用联合区间偏最小二乘法(synergy interval partial least square, SiPLS)筛选出利用标准正态变量变换(SNVT)预处理后的小麦近红外和中红外光谱数据特征光谱区间,将筛选出的近红外和中红外光谱数据特征光谱区间融合后再结合线性判别分析(LDA)和支持向量机(SVM)建立小麦融合光谱信息的识别模型。然后比较同种光谱数据下利用线性判别分析(LDA)和支持向量机(SVM)建立的小麦识别模型识别率、比较同种建模方法下近红外和中红外光谱数据建立小麦识别模型识别率、比较同种建模方法下光谱数据融合和单一光谱数据建立小麦识别模型识别率。结果表明,同种光谱分析方法,利用SVM建立的四种小麦识别模型识别率高于利用LDA建立的小麦识别模型识别率。同种建模方法,近红外光谱数据建立的小麦识别模型识别率优于中红外光谱数据建立的小麦识别模型识别率。而在同种建模方法下,利用SiPLS筛选出近红外和中红外光谱数据的特征光谱区间数据融合后建立小麦识别模型识别率最高,光谱数据融合后结合LDA建立的小麦识别模型校正集识别率为98.75%,预测集识别率为97.50%;而将此选择的变量结合SVM建立的小麦识别模型的校正集和预测集识别率都达到100.0%。对比利用单一光谱数据建立的小麦识别模型识别率,光谱数据融合之后建立的小麦识别模型识别率得到显著提高,该研究从纵向和横向上全面地比较了光谱数据建立的小麦模型识别率,结果可为更准确地运用光谱融合技术建立小麦产地以及烘干程度识别模型提供参考。  相似文献   

15.
药品质量关乎人民健康和国家命脉,随着社会经济的飞速发展对药品质量的快速、有效鉴别具有极其重要的作用。光谱分析技术具有较高的准确性、较快的分析速度且对样品不存在污染等突出优点,广泛应用在化工、石油以及医药等重要的领域。为了解决传统药品鉴别模型存在的鉴别精度低、鉴别速度不能满足实际需求且鉴别模型稳定性差的问题,采用光谱仪采集药品的近红外光谱数据达到对药品无污染鉴别的目的。结合随机森林和CatBoost对药品进行分类鉴别,以实现快速且准确的鉴别。首先采用随机森林(RF)对光谱仪采集的光谱数据进行有效特征波长的筛选,从而将药品光谱数据中的无关波长去除、筛选出最能表征样品属性的特征波长,然后以极限学习机(ELM)作为CatBoost的弱分类器分析筛选的特征波长对药品的属性鉴别。由于ELM仅只含有一个隐含层且无需多次迭代寻优保证了鉴别模型运行速度更快,CatBoost通过集成弱分类器以改善模型鉴别准确性。为对所提出的药品鉴别模型性能进行有效评估,采用随机抽取训练集的方式构造不同规模药品光谱数据并分别上进行独立实验且以10次运行结果的均值作为其最终结果,并通过与CatBoost、持向量机(SVM)、反向传播网络(BP)、ELM、波形叠加极限学习机(SWELM)和Boosting进行对比,进一步对模型的性能进行评估。从不同规模训练集的分类结果可看出,随着训练集样本的增加分类精度最高为100%且预测标准偏差趋于0。实验结果表明,所建立RF-CatBoost鉴别模型在不同规模的药品数据集上较对比方法具有更高的分类准确率、更快的速度且其鲁棒性更强,能够广泛应用于药品类别的准确鉴别,从而实现药品质量的有效监督。  相似文献   

16.
快速识别煤矿突水水源类型对于矿井水害防治意义非凡。鉴于传统水化学方法水源识别耗时较长等诸多不足,提出了将模糊C均值聚类(FCM)算法和多维标度分析(MDS)用于激光诱导荧光光谱识别煤矿突水水源这一新思路。由于FCM算法在光谱分析和模式识别等方面都有着成功的应用,况且激光光谱具有时间响应快、灵敏度高、干扰小等优点,通过实时采集水样的荧光光谱数据,利用FCM和MDS对光谱数据分析后就可以辨别水样类型。以华东地区某矿的老空水和奥灰水以及按比例混合得到水样共7种(每种水样各20个样本)为实验材料,利用405 nm激光打入被测水体,一共采集了140组荧光光谱数据,随后选择合适的波长区间进行分析。取每种水样各15组共105组光谱数据用作训练集,其余35组光谱数据用作测试集。使用MDS建立七种不同水样的模型,再利用FCM算法进行聚类分析得到七种水样的簇中心,最后使用得到的簇中心对测试集进行验证。实验结果表明,不同水样的光谱图有着较大差异,选取合适的波长区间下的光谱数据,在MDS下选择维度为2,利用FCM算法对水样进行分类,全部140组样本的准确率是100%。  相似文献   

17.
利用激光诱导击穿光谱技术结合机器学习算法,对东北5个产地(大兴安岭、集安、恒仁、石柱、抚松)的人参进行产地识别,建立了主成分分析算法分别结合反向传播(BP)神经网络和支持向量机算法的人参产地识别模型.实验采集了5个产地人参共657组在200-975 nm的激光诱导击穿光谱,经光谱数据预处理后,对C,Mg,Ca,Fe,H,N,O等元素的8条特征谱线进行主成分分析,原光谱数据的前3个主成分累积贡献率达到92.50%,且样品在主成分空间中呈现良好的聚集分类.降维后的前3个主成分以2∶1进行随机抽取,分别作为分类算法的训练集和测试集.实验结果表明主成分分析结合BP神经网络及支持向量机的平均识别率分别为99.08%和99.5%.发生误判的原因是集安和石柱两地地理环境的接近而导致的H,O两元素在Ca元素离子发射谱线下的归一化强度相似.本研究为激光诱导击穿光谱技术在人参产地的快速识别提供了方法和参考.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号