首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 468 毫秒
1.
基于FTIR-SVM的西洋参与籽播参的分类研究   总被引:2,自引:2,他引:0  
支持向量机(SVM)是根据统计理论提出的一种新的学习算法.文章以40个西洋参样品为实验材料,通过FTIR-SVM建立了西洋参样品与籽播参识别的模型.对学习训练集中的30个样品模型识别率为100%,对10个预测样品的识别准确率为90%.研究结果表明,FTIR-SVM可以用于中药西洋参与籽播参的区别.  相似文献   

2.
目前我国蜂蜜市场掺假现象严重,研究一种快速、准确的方法用于市场流通领域掺假蜂蜜的鉴别具有重要的现实意义。采用近红外光谱(NIR)结合化学计量学方法对常见的天然蜂蜜以及掺假(掺杂常见糖浆)蜂蜜进行建模识别,并比较偏最小二乘-判别分析(PLS-DA)及支持向量机(SVM)对糖浆掺假蜂蜜鉴别模型的影响。首先,采集来自中国10个省份、20种常见蜂蜜的112个天然纯蜂蜜样品,以及6种常见糖浆样品按不同糖浆含量(10%,20%,30%,40%,50%,60%)配制的112个掺假蜂蜜样品,共计224个样品;通过近红外光仪器扫描获得所有样品的近红外光谱数据(波长范围400~2 500 nm);然后,分别采用一阶导数(FD)、二阶导数(SD)、多元散射校正(MSC)、标准正态变化(SNVT)四种方式对原始光谱进行预处理;再结合PLS-DA和SVM建立天然蜂蜜和糖浆掺假蜂蜜的鉴别模型,比较不同预处理方法对两种不同建模算法建立的蜂蜜掺假鉴别模型效果。其中SVM算法的惩罚参数c和核函数参数g通过网格搜索法(GS)、遗传算法(GA)、粒子群算法(PSO)三种寻优算法进行优化。分析结果表明:光谱数据进行预处理后所建立的模型准确率均有明显提升,而对于SVM模型,惩罚参数c和核函数参数g对模型准确率的提升效果要比光谱预处理带来的提升效果更明显。在PLS-DA算法中,经FD光谱预处理后建立的模型效果最好,最佳PLS-DA模型准确率为87.50%;在SVM算法中,经MSC预处理后,再通过GS寻优,获得惩罚参数c为3.0314,核函数参数g为0.3298的条件下所建立的模型效果最好,最佳SVM模型准确率为94.64%。由此可见,非线性的SVM算法结合NIR光谱数据所建立的天然蜂蜜与糖浆掺假蜂蜜鉴别模型要优于线性的PLS-DA模型,同时表明NIR光谱结合化学计量学方法对常见糖浆掺杂的中国蜂蜜鉴别是可行的。  相似文献   

3.
SVM回归法在近红外光谱定量分析中的应用研究   总被引:15,自引:9,他引:6  
研究了基于统计学习理论的支持向量机(SVM)回归法在近红外光谱定量分析中的应用。以66个小麦样品为实验材料,由33个小麦样品作为校正样品,采用4种不同核函数方法对小麦样品蛋白质含量与小麦样品近红外光谱进行SVM回归建模。以所建4种不同SVM回归模型对33个小麦预测样品的蛋白质含量进行了预测;不同回归模型的预测结果与凯氏定氮法确定的蛋白质含量的标准化学值间的相关系数均在0.97以上,平均绝对误差小于0.32。为了考察SVM回归校正模型的预测效果,同所建PLS回归模型的预测结果进行了比较,表明所建预测小麦样品蛋白质含量的SVM回归模型亦可通过近红外光谱进行实际样品的定量分析,且有较好的分析效果。  相似文献   

4.
近红外光谱法对甲醇柴油中甲醇含量测定   总被引:1,自引:0,他引:1  
应用近红外光谱结合化学计量学方法实现了对甲醇柴油中的甲醇含量的定量分析。以实验室配制的32种不同浓度[浓度范围为2%~25.8%(φ)]的甲醇柴油溶液为研究对象,在4 500~7 000cm~(-1)光谱范围内,建立偏最小二乘(PLS)、支持向量机(SVM)和最小二乘支持向量机(LS-SVM)三种定量分析模型。在建立SVM模型时,经过比较分析,径向基函数(radial basis function,RBF)作为SVM模型的核函数时可以获得更高的预测精度。最终获得甲醇含量的PLS,SVM和LS-SVM三种模型的预测相关系数RP分别为0.985 9,0.990 3,0.998 9,预测均方根误差RMSEP分别为0.405 2,0.356 3,0.062 4,可以看出,三种预测模型都可以达到很好的效果,最优的预测模型是使用LS-SVM建模。研究结果表明,利用近红外光谱法结合化学计量学方法对甲醇柴油中甲醇含量的检测具有可行性,并可以达到很好的效果。采用近红外光谱技术结合化学计量方法对甲醇柴油中甲醇含量进行定量分析,也为近红外光谱技术快速无损检测甲醇柴油甲醇含量提供参考和应用价值。  相似文献   

5.
基于NIR分析和模式识别技术的玉米种子识别系统   总被引:4,自引:0,他引:4  
模式识别技术及数据挖掘方法已成为化学计量学的研究热点。近红外(NIR)光谱分析以其快速、简便、非破坏性等优势广泛应用于光谱信号的处理和分析模型的建立。文章基于五种不同的模式识别方法:局部线性嵌入(LLE),小波变换(WT),主成分分析(PCA),偏最小二乘(PLS)和支持向量机(SVM),利用NIR技术建立了玉米种子的模式识别系统,并将其应用于108玉米杂交种和母本178种子的近红外光谱样品。首先利用LLE,WT,PCA,PLS进行消噪或降维,然后运用SVM进行分类识别,而一模支持向量机(1-norm SVM)算法直接进行分类识别。三个不同NIR光谱范围的数值实验显示:PCA+SVM,LLE+SVM,PLS+SVM识别效果甚佳,而WT+SVM和1-norm SVM方法也有较高的分类精度。实验结果表明了本文提出方法的可行性和有效性,为利用近红外光谱和模式识别技术进行种子识别研究提供了理论依据和实用方法。  相似文献   

6.
提出一种将循环伏安电化学法和近红外光谱法联立,用PLS-DA的D-S证据理论融合二者信息进行葡萄酒品种溯源研究的方法。分别采集来自不同产区的三类不同品种的171个干红葡萄酒样品的循环伏安曲线和近红外透射光谱。用PLS-DA法分别建立循环伏安电化学法和近红外光谱法的判别模型,以此为证据;用两个证据的D-S合成规则实现近红外判别结果与循环伏安法判别结果的重新决策。融合后的结果为:多产区不同品种葡萄酒溯源模型的建模集准确率为95.69%,检验集准确率为94.12%;单一产区不同品种葡萄酒溯源模型的建模集准确率为99.46%,检验集准确率为100%;判别结果都比融合前单一循环伏安电化学法和近红外光谱法的判别准确率得到了提高。实验结果表明,该方法具有较高的溯源识别准确度,可以快速准确地对待测葡萄酒品种进行定性检测。  相似文献   

7.
光谱技术与机器学习算法结合快速识别微塑料, 为微塑料的现场检测提供了极大的技术支持,是一个得到极大关注的新领域。近红外光谱检测技术具有检测速度快、灵敏度高、不损坏样品,且可以在不对样品进行预处理的情况下直接检测等特点,在化学分析、质量检测等领域广泛应用。本文基于近红外光谱检测技术,研究比较了结合Support Vector Machine(SVM)和Extreme Gradient Boosting(XGBoost)两种机器学习分类算法,构建微塑料的高速有效识别分类模型。采用微型近红外光谱仪采集了20种常见的微塑料标准样品的光谱数据,为了防止过拟合,对每种样品多次采样,共收集了1 260个微塑料样本,每个样本包含512个数据点。利用XGBoost算法进行特征重要性排序,共提取了对识别准确率影响较大的65个数据点。分别采用SVM算法和XGBoost算法对数据降维后提取的65个数据点建立微塑料快速识别模型,并运用网格搜索(GridSearchCV)对XGBoost算法影响较大的超参数进行选取,确定n_estimators,learning_rate,min_child_weigh,max_depth,gamma的最佳超参数分别为700,0.07,1,1,0.0。为了提高模型的稳定性,识别速率和泛化能力,对模型采用10折交叉验证和混淆矩阵评估;研究结果表明,XGBoost模型对微塑料的识别准确率为97%,而SVM模型对微塑料的识别准确率为95%;XGBoost模型对微塑料识别的正确率优于SVM模型。综上所述,XGBoost模型微塑料识别整体性能优于SVM模型,为实际微塑料快速识别提供技术支撑。  相似文献   

8.
模式识别技术及数据挖掘方法已成为化学计量学的研究热点。近红外(NIR)光谱分析以其快速、简便、非破坏性等优势广泛应用于光谱信号的处理和分析模型的建立。基于五种不同的模式识别方法:局部线性嵌入(LLE),小波变换(WT),主成分分析(PCA),偏最小二乘(PLS)和支持向量机(SVM),利用NIR技术建立了玉米种子的模式识别系统,并将其应用于108玉米杂交种和母本178种子的近红外光谱样品。首先利用LLE,WT,PCA,PLS进行消噪或降维,然后运用SVM进行分类识别,而一模支持向量机(1-normSVM)算法直接进行分类识别。三个不同NIR光谱范围的数值实验显示:PCA+SVM,LLE+SVM和PLS+SVM识别效果甚佳,而WT+SVM和1-norm SVM方法也有较高的分类精度。实验结果表明了本文提出方法的可行性和有效性,为利用近红外光谱和模式识别技术进行种子识别研究提供了理论依据和实用方法。  相似文献   

9.
基于火箭煤油的近红外光谱数据和化学计量学方法,成功地对火箭煤油的密度、馏程、粘度、碘值等四种特性指标进行了测定.本文测定了70多个火箭煤油样品的近红外光谱,在适当的光谱区间内用偏最小二乘法(PLS)法建立模型,各参数的相关性R2在0.862~0.999之间.用该模型对10个未知样品进行测定,近红外光谱法预测的准确度均符合标准分析方法的要求.研究表明,该方法为火箭煤油分析检测提供了一种简便、快捷、准确的方法.  相似文献   

10.
特征根回归法近红外光谱定量分析研究   总被引:2,自引:0,他引:2  
本文以大豆样品为实验材料,研究了特征根回归法近红外光谱定量分析。用40个大豆样品的近红外光谱数据建立了测定大豆蛋白质含量的特征根回归模型,预测另外32个大豆样品的蛋白质含量,结果同PLS回归方法进行了比较,表明特征根回归模型可用于生物样品的近红外光谱定量分析。特征根回归法是对PCR建模方法改进的又一种化学计量学定量分析校正方法,该方法在对样品光谱提取主成份时考虑了待分析组分的作用,因此所建立的定量分析模型有好的分析效果。研究结果进一步表明,以样品近红外光谱建立定量分析模型,提取主成份时充分考虑被定量分析成份的作用是完全必要的。  相似文献   

11.
太赫兹时域光谱技术(THz-TDS)结合主成分分析-线性判别分析(PCA-LDA)和支持向量机(SVM)用于正品大黄样品的鉴定.在时域测量41个大黄样品的太赫兹时域透射光谱,然后将这些时域信号转换成频域的吸收系数系数.根据样本的吸收系数建立了主成分分析-线性判别分析和支持向量机的定性分类模型,并对正品和非正品大黄样本的分类模型进行了交叉验证.模型的预测能力和稳定性使用自助拉丁配分进行评价,使用50次自助拉丁配分,配分数为4.使用主成分分析-线性判别分析和支持向量机均得到了满意的结果.提出的方法证明是一种方便、无污染、准确和无需化学处理的鉴定大黄样本的方法.该文提出的步骤可以应用于其他中草药分类和生产的质量控制.  相似文献   

12.
中草药大黄的近红外光谱和人工神经网络鉴别研究   总被引:26,自引:1,他引:25  
大黄是我国最常用的中草药之一。对正品和非正品大黄的快速、准确鉴别对于大黄及其中草药产品的质量控制具有重要的意义。将近红外漫反射光谱分析技术与人工神经网络方法相结合,对52种大黄样品进行了测定和鉴别,正确率可达96%。并对神经网络的隐含层个数和动量因子的影响做了讨论。由于近红外光谱法具有样品前处理少,测定快速和非破坏性等特点,因而特别适合于中草药的鉴别。  相似文献   

13.
在聚合物加工过程中,如果在同一生产线上混用不同牌号的原材料,可能会影响产品性能,降低产品合格率。然而采用传统方法识别相同类型不同牌号的聚合物往往耗时长且具有滞后性,目前还缺乏一种快速实时的牌号识别方法。因此,以5种不同牌号的通用聚苯乙烯(GPPS)为研究对象,利用自主开发的安装于挤出机上的在线近红外光谱测量系统,将近红外光谱与化学计量学、机器学习算法相结合,实现对挤出过程中GPPS牌号的快速在线识别。首先利用在线近红外光谱测量系统实时采集5种不同牌号GPPS熔体的在线近红外光谱,波长范围为900~1 700 nm。经过谱图分析后,利用主成分分析结合K均值聚类算法验证在线近红外光谱数据对于不同牌号的可分性。最后采用偏最小二乘判别分析和随机森林两种算法分别建立GPPS牌号识别模型并进行对比。结果表明:①经过基线校正、最大最小归一化、7点移动平均平滑预处理后,在线近红外光谱在1 207,1 388,1 407和1 429 nm处的特征峰峰值会随着牌号的变化呈阶梯状改变,以前3个主成分得分作为K均值聚类的输入变量得到聚类正确率为88%,说明了不同牌号GPPS在线近红外光谱数据的可分性;②所建立的两种预测模型均能够对GPPS牌号有效识别,最佳主因子数为3的偏最小二乘判别分析模型对验证集的分类正确率为90.4%,以前5个主成分得分作为输入变量建立的随机森林模型对验证集的分类正确率达95.6%,所以随机森林模型的牌号识别性能更好。因此,在线近红外光谱测量系统结合化学计量学、机器学习算法可以实现GPPS牌号的快速在线识别,为在生产线上利用近红外光谱识别同种聚合物的不同牌号提供参考。  相似文献   

14.
基于支持向量机的近红外光谱鉴别茶叶的真伪   总被引:23,自引:0,他引:23  
快速准确地鉴别名优茶的真伪是当前茶叶行业亟待解决的一项重大课题。针对这一现状,提出了一种快速准确鉴别名优茶真伪的新思路。试验中,以碧螺春茶为研究对象,利用近红外光谱分析技术结合支持向量机(SVM)模式识别原理建立碧螺春茶真伪鉴别模型。试验结果显示,通过标准归一化(SNV)预处理,选取6500~5500 cm-1波长范围内的光谱经过主成分分析后,提取11个主成分,选用径向基函数(RBF)作为核函数建立的模型最佳。对训练集中的138个茶叶样本,模型的回判鉴别率达到93.48%;对90个独立样本进行预测时,模型的预测鉴别率达到84.44%。研究结果表明基于支持向量机的近红外光谱鉴别名优茶真伪的方法是可行的。  相似文献   

15.
偏最小二乘法和THz-TDS在正品大黄鉴别中的应用   总被引:1,自引:0,他引:1  
太赫兹技术的发展近年来受到广泛的关注并被应用于热点。中草药大黄的品质鉴定对于中药制剂的质量控制具有重要的意义。利用大黄的太赫兹时域光谱结合偏最小二乘法(PLS)模型对基于41个正品和非正品大黄的中草药鉴别模型进行了研究。首先采集大黄样品的太赫兹时域光谱(THz-TDS)信号,然后将化学计量学方法用于这些大黄样品太赫兹光谱的信号处理与建模,再建立基于太赫兹光谱的大黄品质鉴定的偏最小二乘模型方法。应用S-G一阶导数、去趋势、标准正态变换、自标度化、均值中心化等方法对原始时域谱预处理再与未经预处理的结果相比,偏最小二乘(PLS)模型的预测正确率从80%明显提高到90%。在模型建立和模型检验中,采用留一法(LOO)选取训练集和检验集样本。利用留一法交叉验证确定了PLS模型的最佳主因子数。结果表明,当采用均值中心化方法时,PLS模型的RMSECV和RMSEP的值均达到了最小,分别为0.076 6和0.169 0。研究结果表明,THz-TDS技术结合化学计量学方法能够快速、准确的对大黄的真伪进行鉴别,直接使用太赫兹时域光谱而不使用计算后的吸收谱有两个优点:(1)在分频测定和光谱信号处理时无需考虑样品的厚度;(2)使光谱信号处理过程得到简化。该技术也可以对其他中草药进行鉴别和质量控制。该法快速、简单、无污染、无需样品预处理,是一种有发展前景的中草药无损检测方法。  相似文献   

16.
菊花为菊科植物菊的头状花序,滁菊、贡菊、杭菊和亳菊是常见的几类药用品种菊花。不同品种菊花在外观上具有极大的相似性,非专业人员仅凭肉眼难以对其进行准确鉴别分析。常规仪器分析法检测成本较高,分析时间较长,且需要对样品进行破坏性处理,影响了产品的二次销售。近红外光谱技术作为近年来快速发展起来的一种绿色、简单、快速的新型检测技术,在中药鉴别领域取得了很大的进展。基于便携式近红外光谱仪结合化学计量学方法建立了一种菊花品种无损鉴别方法。利用便携式近红外光谱仪采集了滁菊、贡菊、杭菊和亳菊完整以及粉末状两种物理形态样品的光谱,采用单一以及组合光谱预处理方法消除光谱中存在的干扰,结合不同模式识别方法(主成分分析法、软独立模式分类法和Fisher线性判别分析法)分别构建了不同品种菊花的鉴别模型。结果表明:由于仪器的限制及样品物理性状的原因,光谱中存在较为明显的背景、基线漂移以及噪声的干扰,完整样品由于物理性状的原因,基线漂移干扰尤为严重;采用主成分分析法结合光谱预处理方法无法实现不同品种菊花的准确鉴别,完整样品最佳鉴别正确率仅为8.33%,粉末样品最佳鉴别正确率为52.38%;通过软独立模式分类法结合预处理方法可以得到较为准确的鉴别结果,完整样品光谱数据经一阶导数+多元散射校正优化后鉴别正确率为95%,粉末状样品数据采用原始数据的鉴别正确率为92.5%;Fisher线性判别分析方法结果最佳,完整样品数据经连续小波变换优化后可以得到97.5%的鉴别正确率,粉末状样品采用原始光谱便可得到100%鉴别正确率。以上结果表明,当采用合适的预处理和建模方法,完整样品和粉末状样品鉴别结果较为一致,基于便携式近红外光谱仪结合化学计量学可实现对不同品种菊花的准确无损鉴别分析,为食药同源产品的无损鉴别分析提供了新途径。  相似文献   

17.
近红外光谱结合化学计量学方法对癌症的辅助诊断已有了文献报道.该文测定了77例不同生理阶段的子官内膜组织病理切片的近红外光谱,对其分别进行多元散射校正(MSC)、正交信号校正(OSC)以及二者联用的预处理方法,采用拉丁配分法选择3/4样本作为训练集,1/4样本作测试集,建立支持向量机(SVM)模型进行分类,并与基于同样预...  相似文献   

18.
为了快速检测玉米品种类型,基于支持向量机(SVM)和近红外光谱联合建立玉米品种的分类模型。以郑单958、先玉335、京科968、登海605和德美亚等五个品种共计293个样本为研究对象,对采集的近红外光谱进行标准正态变量变换(SNV)处理后使用主成分分析法(PCA)对光谱数据进行降维处理。按照6∶1比例,随机选取251个样本为训练集,42个样本作为测试集,探讨贝叶斯优化算法(BO)对SVM模型性能的影响。分别使用网格搜索(GS)、遗传算法(GA)和BO算法等三种方法对SVM模型的两个重要参数惩罚因子C和径向基核函数参数γ进行寻优。选择各模型十折交叉验证识别准确率最高时对应的惩罚因子和核参数作为建模参数,建立SVM分类模型。将使用BO算法建立的SVM分类模型与使用GS和GA进行参数寻优后建立的模型性能进行比对。实验发现,使用BO优化的SVM分类模型相比于其他两种优化算法得到的SVM模型性能具有显著优势,测试集的识别准确率可达到100%。说明使用BO算法寻优的SVM模型参数是全局最优参数,其他两种优化算法寻优的参数可能陷入了局部最优,从而导致模型性能表现不佳。在进行PCA降维前后的光谱数据上分别建立BO-SVM模型,结果表明,BO算法对于高维数据优化效果不佳,更适用于低维数据。对于不同样本类别间数量不均衡导致模型性能表现不佳的问题,通过剔除郑丹958和先玉335两类数量较少的样本,使用剩余三个类别,共计248个样本重新建立SVM模型,实验发现,剔除两类小样本之后,各个模型在测试集上的性能均有提升,说明对于类间样本数量不均衡问题,某类样本数量越多,对于模型参数的修正就越细腻,模型对该类的拟合效果就越好。研究结果可用于玉米品种的快速鉴别,也可为基于近红外光谱的其他农产品分类和产地鉴别提供参考。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号