首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 171 毫秒
1.
基于支持向量机和马氏距离探索了中红外光谱分析识别进口的卢氏黑黄檀、风车木、微凹黄檀、燃料紫檀和东非黑黄檀的能力。应用中红外光谱仪采集了500组试验样本进行分析,对试验数据进行了预处理:首先,为了保证样本的有效性,对异常光谱进行了诊断。基于莱特检验法诊断出卢氏黑黄檀和微凹黄檀各有2组异常,风车木、燃料紫檀和东非黑黄檀各有1组异常。为使样本数量统一,五种树种分别剔除了包含异常光谱在内的5组数据;其次,分析了近红外光谱的树种识别研究,结果表明:对光谱数据进行一阶导数处理,可提高识别的精度。因此,对中红外光谱数据进行了平滑处理和一阶导数处理。采用主成分分析提取了光谱数据的特征值,测试集的第一和第二主成分得分的散点图显示,平滑加一阶导数处理的测试集的各自聚类性较平滑处理好。以主成分的得分为特征,基于支持向量机和马氏距离进行了识别研究。考虑到识别方法中主成分个数的选取会直接影响识别的精度,而通常主成分的选取仅参考累计贡献率,此处为使主成分的选取更科学,在支持向量机识别方法中利用粒子群算法进行参数寻优时,对主成分的个数(范围为[5, 30])与5折检验下的最佳判别准确率的关系进行了试验,结果表明:平滑处理和平滑加一阶导数处理的主成分个数在[7, 11]范围内的5折检验下的最佳判别准确率较高,结合对应的判别准确率,确定了最佳的主成分个数为8个。以前8个主成分作为输入变量,基于支持向量机和马氏距离对测试集进行了测试,结果得出:两种识别方法的正确识别率均较高,支持向量机的识别率略高于马氏距离,平滑加一阶导数处理的识别率均优于平滑处理,平滑加一阶导数处理的支持向量机正确识别率达到了98%,识别效果最好。因此,中红外光谱分析可以作为木材树种识别的一种有效手段。  相似文献   

2.
随着人口的增长和社会的迅速发展,水资源短缺和水污染问题日益严重。水质分类作为水质污染评估工作中的一项重要环节,其意义和作用也更加突出。基于太赫兹衰减全反射(THz-ATR)光谱和模式识别技术,提出了一种水质分析模型。利用太赫兹时域光谱系统和衰减全反射模块测量了纯净水、自来水、河水、海水A和海水B五种水样的太赫兹衰减全反射光谱,通过光学参数提取模型获得0.2~1.0 THz频率范围内五种水样的折射率、吸收系数、介电常数实部和介电常数虚部。利用主成分分析(PCA)对折射率进行降维和特征提取,分别作出样品在第一、二主成分上的二维得分图和前三个主成分上的三维得分图,结果显示,基于折射率的主成分得分图可以明显的区分不同的水样。为了进一步对不同水样进行准确分类,将降维之后的数据输入到支持向量机(SVM)中构建水样分类模型,每种水样随机选取其中的五分之三作为训练集,剩余的数据作为测试集,同时引入网格搜索(GridSearch)、遗传算法(GA)和粒子群(PSO)三种优化算法对支持向量机参数进行优化。结果显示,基于网格搜索算法的支持向量机最优参数c和g分别为1.414 2和2.0,准确率为99.0%;基于遗传算法的支持向量机最优参数c和g分别为1.675 4和5.966 5,准确率为99.5%;基于粒子群算法的支持向量机最优参数c和g分别为3.154 9和12.589,准确率为100%。可以看出,使用不同的优化算法得到的最优参数不同,所构建的支持向量机分类模型都可实现正确的分类,且分类准确率均高达99.0%以上。研究结果表明,利用粒子群优化算法基于折射率构建的PCA-SVM分类模型效果最优,可以准确识别不同水样,为水质分类奠定了基础。  相似文献   

3.
近红外光谱结合一类支持向量机算法检测鸡蛋的新鲜度   总被引:5,自引:0,他引:5  
研究利用近红外光谱技术结合模式识别方法识别鸡蛋的新鲜度,在识别模型建立过程中,引入一类支持向量机(OC-SVM)算法解决新鲜蛋和非新鲜蛋训练样本数量不平衡问题。首先获取鸡蛋在10 000~4 000 cm-1范围内的近红外漫反射光谱,通过主成分分析方法提取光谱数据中的特征信息,优选了3个主成分作为模型的输入向量,然后采用OC-SVM区分新鲜蛋和非新鲜蛋。在模型建立过程中,对相关参数进行了优化,试验结果显示在相同条件下,OC-SVM模型识别结果较传统的支持向量机模型好。最优OC-SVM模型对新鲜蛋和非新鲜蛋的识别率均为80%,传统的支持向量机对新鲜度的识别率为100%,对非新鲜度的识别率却为0%。研究结果表明利用近红外光谱快速识别鸡蛋新鲜度方法是可行的;OC-SVM算法为训练样本数量不平衡提供了一种有效的解决方法。  相似文献   

4.
提出了一种基于烟叶近红外光谱(NIR)和烟叶电子鼻(EN)融合数据的烟叶年份判别的支持向量机分类模型。在NIR和EN数据融合的基础上,利用遗传算法来进行变量选择,再建立烟叶年份判别支持向量机模型,所得到的烟叶判别模型在训练集和独立测试集上都具有较高的准确率。建立的烟叶判别NIR-E-SVM模型的建模准确率达到100%,留一法准确率达到98.55%,对未知样本的预报准确率为90%。  相似文献   

5.
提出了一种基于烟叶近红外光谱(NIR)和烟叶电子鼻(EN)融合数据的烟叶年份判别的支持向量机分类模型。在NIR和EN数据融合的基础上,利用遗传算法来进行变量选择,再建立烟叶年份判别支持向量机模型,所得到的烟叶判别模型在训练集和独立测试集上都具有较高的准确率。建立的烟叶判别NIR-ESVM模型的建模准确率达到100%,留一法准确率达到98.55%,对未知样本的预报准确率为90%。  相似文献   

6.
基于主成分分析和支持向量机的山羊绒原料品种鉴别分析   总被引:1,自引:0,他引:1  
提出了一种用近红外光谱技术快速无损鉴别羊绒原料品种的新方法。山羊绒的外观形态和品质特征随着山羊绒原料的品种不同有很大的区别,快速、有效、正确地鉴别山羊绒纤维,对山羊绒及其制品的生产与交易具有重要的意义。应用可见/近红外光谱漫反射技术测定各种山羊绒原料的光谱曲线,用主成分分析法对不同品种山羊绒原料进行聚类分析并获取山羊绒原料的近红外指纹图谱,再结合支持向量机技术进行品种鉴别。用主成分1,2和3对所有建模样本的得分值做出的得分图,分析聚类效果,将主成分分析得到的10个主成分作为支持向量机的输入,应用数据挖掘新方法—支持向量机对山羊绒原料品种进行鉴别。通过对5个山羊绒原料品种共100个样本的训练,对未知的75个样本进行鉴别,建立了山羊绒原料品种鉴别的支持向量机的分类模型,并对比了四种核函数的支持向量机的分类性能,结果表明,具有高斯核函数的支持向量机对山羊绒原料的鉴别准确率达到100%。说明文章提出主成分分析结合支持向量机的数据挖掘方法具有很好的分类和鉴别作用,为山羊绒原料的品种快速鉴别提供了一种新方法。  相似文献   

7.
高光谱成像技术鉴别菠菜叶片农药残留种类   总被引:2,自引:0,他引:2       下载免费PDF全文
吉海彦  任占奇  饶震红 《发光学报》2018,39(12):1778-1784
利用高光谱成像技术无损鉴别菠菜叶片农药残留种类。采用高光谱成像仪采集900~1 700 nm波段内的光谱数据,采用多元散射校正对光谱数据进行预处理。利用主成分分析对不同种类菠菜样品的光谱数据进行分析,结果表明主成分分析能在可视化层面对不同种类的农药残留菠菜样品进行有效判别。另外,将卡方检验特征选择算法分别与支持向量机、朴素贝叶斯、决策树和线性判别分析算法结合,并采用10-fold交叉验证评价方法,筛选出最佳波段和最优判别模型(线性判别模型)。筛选出的8个特征波长为1 439.3,1 442.5,1 445.8,1 449,1 452.3,1 455.5,1 458.7,1 462 nm,模型的预测准确率达到0.993且10次交叉验证的标准差为0.009。结果表明,基于高光谱成像技术能准确地识别菠菜叶片上的农药残留种类。  相似文献   

8.
采用近红外透射光谱研究了汽车制动液品牌及新旧的鉴别。采集宝马(BMW),丰田(Toyota),沃尔沃(Volvo)以及嘉实多(Castrol)四种品牌的汽车制动液全新样本以及用过的样本的透射光谱。分别对每一种品牌下全新与用过汽车制动液样本的光谱数据进行主成分分析(PCA),主成分得分图表明不同品牌制动液以及该品牌下全新样本以及用过的样本能够被较好的区分,其光谱特性存在差异。基于主成分载荷(Loadings)进行特征波数选择,偏最小二乘判别分析(PLS-DA),线性判别分析(LDA),簇类独立软模式法(SIMCA),k最邻近分类算法(KNN),随机森林(RF),误差反向传播人工神经网络(BPNN),径向基神经网络(RBFNN),极限学习机(ELM),支持向量机(SVM),最小二乘支持向量机(LS-SVM)等判别分析方法用于建立基于特征波数的判别分析模型,判别模型的建模集和预测集判别正确率均略低于或达到了100%。与其他三种品牌汽车制动液相比,嘉实多全新样本与用过样本的差异较小,KNN与LS-SVM模型的建模集正确率均低于100%。结果表明,近红外透射光谱结合特征波长选择以及判别分析模型对不同品牌制动液以及同一品牌下全新样本以及用过的样本进行识别是可行的,为开发在线或便携式仪器提供理论支持。  相似文献   

9.
以淮南矿区谢桥矿和潘二矿的煤和岩石样本为研究对象,通过地物光谱仪采集样本反射率光谱曲线,同时检测样本氧化物含量、水分、灰分及挥发分含量,将样本的反射率光谱曲线和样本成分含量分别作为自变量,样本类别“煤”和“岩石”两种矿物类型作为因变量,建立煤和岩石识别模型对煤和岩石进行二分类。该研究主要采用三种模型,分别为主成分分析结合支持向量机(PCA-SVM)、主成分分析结合BP神经网络(PCA-BP)模型和核主成分分析结合支持向量机(KPCA-SVM)模型。结果表明,基于可见光近红外光谱的三个模型中,核主成分分析结合支持向量机模型的识别精度最高,建模平均精度为95.5%,验证平均精度约为90.56%;基于样本成分的三个模型中,核主成分分析结合支持向量机模型的识别精度最高,建模平均精度为98.5%,验证平均精度约为95%。  相似文献   

10.
利用主成分分析方法结合支持向量机建立了太赫兹时域光谱冰片种类鉴别模型。冰片是一些常用中成药的重要成分,由于其来源多、真假易混淆,在制药和交易环节,迫切需要快速、简便、准确的检测、鉴别方法。太赫兹时域光谱技术是利用太赫兹脉冲表征物质性质的一种新兴光谱技术。实验使用透射式太赫兹时域光谱系统分别获得了艾片、合成冰片和梅片三种冰片在0.2~2 THz之间的吸收谱线。通过主成分分析,做出了第一、第二主成分二维得分图以及第一、二、三主成分三维得分图,两者对三种不同种类冰片都具有很好的聚类效果。用前十个主成分的得分值矩阵代替原光谱数据,通过对三种冰片的60组样本训练,对未知的60组样本鉴别,建立了四种不同核函数的支持向量机模型。对比结果表明,径向基核函数构建的支持向量机对三种冰片的分类鉴别准确率均为100%,由此我们确定选择具有径向基核函数的支持向量机建立冰片种类的鉴别模型。此外,在含噪情况下,四种核函数SVM获得的总分类准确率都在85%以上,说明支持向量机具有很强的泛化能力。主成分分析结合支持向量机方法对冰片太赫兹光谱具有很好的分类和鉴别效果,为冰片等中成药剂的种类鉴别提供了一种新思路。  相似文献   

11.
仿刺参是具有极高经济价值的水产资源,是海水养殖产业的重要组成部分,研发出一种灵活、稳定、高效的仿刺参产地溯源方法对于水产养殖产业具有极强的现实意义。仿刺参主要有三种养殖方式,分别是底播增殖、圈养养殖和筏式养殖。不同产地采用不同的养殖方式,仿刺参的营养价值、药用价值和经济价值都存在着明显差异。不同产地初级生产者的构成不同,作为初级生产者的不同藻类与浮游生物体内的脂肪酸特征也各不相同,通过食物链的传递,不同产地的仿刺参具有了不同的脂肪酸特征。气相色谱指纹图谱法是一种快速准确地食品产地溯源技术,碳稳定同位素质谱法不仅可以鉴别产地还可以区分出食品的营养价值。采集9个最具代表性产地的仿刺参样品,先利用Folch法对样品进行总脂提取,再通过气相色谱仪测定出各种脂肪酸的种类及其相对含量;最后使用稳定同位素质谱仪测定出每种脂肪酸各自的碳稳定同位素组成数据。使用单因素方差分析法对脂肪酸相对含量和脂肪酸碳稳定同位素组成数据进行显著性检验,各筛选出17种脂肪酸数据作为两个模型的输入。主成分分析(PCA)法可以降低数据的维度,聚合不同种脂肪酸数据的溯源特征,提高产地溯源的精度。支持向量机(SVM)是一种以结构化风险最小为目标的分类识别算法,具有优秀的泛化能力。研究结果表明,不同产地仿刺参的脂肪酸相对含量和脂肪酸碳稳定同位素组成数据存在明显差异。通过主成分变换后,脂肪酸数据的聚类特征更加明显,运用随机交叉验证法确定前6个主成分作为两个支持向量机分类器的输入。采用基于遗传交叉因子改进的粒子群优化算法(GPSO),以粒子不同K值各100次交叉验证的平均准确率作为其适应度,寻找支持向量机分类器模型的最优参数组合。最终计算得到脂肪酸相对含量产地溯源模型的最优参数组合为σ=6.247 599和C=14.313 042,平均准确率为79.49%;脂肪酸碳稳定同位素组成产地溯源模型的最优参数组合为σ=7.626 194和C=2.193 410,平均准确率为98.33%。对比交叉验证的结果,脂肪酸碳稳定同位素组成产地溯源模型具有更高的准确率和更强的泛化性能。在两个模型的识别结果不一致时,采用脂肪酸碳稳定同位素组成模型的识别结果。将实验室检测与互联网技术进行整合,构建了仿刺参产地溯源在线系统。实现了“互联网+产地溯源”的一体化溯源模式,为进一步开展食品产地溯源研究提供了科学依据和技术支撑。  相似文献   

12.
To obtain high-quality raw silk and improve the economic values of sericulture industry, sex needs to be discriminated first before cross-breeding. Much work has been reported about sex identification. However, to realize automatic separation of silkworm pupae, the species also needs to be classified, which no research has ever explored. Hence, this paper studied the feasibility of visible and near-infrared hyperspectral imaging technology to identify the species and sex of silkworm pupae. 288 hyperspectral images of silkworm pupae were collected and the average spectra were extracted from the region of interest, around the tail region of silkworm pupae. Successive projection algorithm was served as a variable selection method to choose the optimal wavelengths from the full spectra. At the same time, principal component analysis was used to choose the characteristic images. Then, the gray-level co-occurrence matrix was implemented on the first three principal component images (accounted for 99.05% of the total variances) to extract 48 textural features. Partial least squares discriminant analysis and support vector machine models were built, respectively, based on the spectral data, textural data and fusion data that included spectral and textural data, in which the support vector machine model based on the fusion data, gave the best species and sex identification result with an accuracy of 95.83%. It demonstrated that the hyperspectral imaging technology could be a new and nondestructive method to replace the manual work.  相似文献   

13.
不同产地对中药次生代谢产物有显著影响,产地鉴别有助于中药的科学合理利用;其次,有效成分含量检测是评价中药质量的主要手段。通过傅里叶变换红外光谱结合化学计量学建立快速鉴别三七产地及测定三七中四种主要皂苷的方法,为三七的科学、合理、规范使用以及对三七质量进行快速评价提供依据。采集5个区域12个产地117个三七样本的红外光谱。产地鉴别预处理数据采用离散小波变换除去噪音造成的部分高频信号,偏最小二乘判别对产地判别贡献率大于1的数据进行筛选,kennard-stone算法将117个个体分为70%训练集与30%预测集。训练集数据用于建立支持向量机判别模型,交叉验证法用于筛选支持向量机最优参数,预测集数据对支持向量机判别模型结果进行验证。皂苷含量预测预处理数据采用标准正态变量变换、离散小波变换处理;处理的红外数据设为X变量,三七样品中通过高效液相色谱法测得的四种皂苷总量设为Y变量,采用正交信号校正去除红外光谱中与四种皂苷总量无关的干扰数据。个体数据分为80%训练集与20%预测集,训练集建立偏最小二乘回归模型,预测集数据对偏最小二乘回归模型的预测结果进行验证。结果显示: (1)交叉验证法得到支持向量机判别模型的最优参数为c=2.828 43,g=0.062 5,训练集的产地判别最优正确率为91.463 4%;(2)支持向量机判别模型参数设置为最优参数,代入预测集数据,预测集的产地判别正确率为94.285 7%,判别正确率较高;(3)训练集建立偏最小二乘回归模型的相关系数R2=0.941 8,校正均方差RMSEE=4.530 7;(4)代入预测集数据,预测集的相关系数R2=0.962 3,外部检验均方差RMSEP=3.855 9,皂苷预测值与高效液相检测值接近,预测效果良好。傅里叶变换红外光谱结合支持向量机能对三七进行产地鉴别,正交信号校正结合偏最小二乘回归能对三七中四种主要皂苷总量进行准确预测,为三七质量控制提供一种快速简便、无损、高灵敏度的检测方法。  相似文献   

14.
激光诱导击穿光谱(LIBS)是一种高效快速的光谱采集手段,可应用于各类物质的元素分析工作中。线性判别分析(LDA)与支持向量机(SVM)是化学计量学中两种常用的有监督算法,均通过对已知不同种类的样本数据进行学习建模,进而实现对未知类别数据的归类。为了实现LIBS技术对有机物的高准确率识别,将这两种算法应用到LIBS光谱数据的分类中。实验利用波长为1 064 nm的纳秒激光烧蚀女贞、珊瑚树、竹子三种植物的叶片,并采集每种树叶220~432 nm波段的100组光谱数据。通过对300组样本的原始光谱数据进行主成分提取,由第一主成分(PC1)和第二主成分(PC2)的得分图得出三种植物光谱的相似度非常高。然后,利用每种叶片70组样本的光谱数据作为训练集建模,其余30组光谱数据作为测试集来进行树叶种类的预测识别。将PCA对原始光谱数据提取得到的前20个主成分作为LDA与SVM建模的属性值。对于LDA算法,将属性值分析后得到前两个判别函数值,通过聚类分析发现不同种类的植物叶片光谱数据在空间上的分离效果较好,同一种类基本聚集在一起。再借助马氏距离可得到测试集的平均分类正确率为96.67%。与此类似,使用SVM方法对训练集样本的数据进行学习得到分类超平面,对测试集的平均分类正确率达到98.9%。研究结果表明,经过PCA对数据的预处理,再结合LDA,SVM这两种方法可实现LIBS技术应用于复杂有机物的快速准确分类,并且PCA与SVM结合的分类正确率更高。该方法可在食品快速溯源、生物组织原位鉴别、有机爆炸物远程分析等领域应用。  相似文献   

15.
针对混合气体建模过程中最小二乘支持向量机参数难以确定及红外光谱数据计算量过大的问题,提出一种粒子群优化的最小二乘支持向量机方法,用于建立基于主成分分析特征提取的红外光谱多组分气体定量分析模型。首先对主吸收峰区域的550个红外光谱数据利用主成分分析技术进行了特征提取,将降维得到的7个特征值作为模型的输入变量从而有效地降低了计算量。混合气体主要由浓度范围分别是0.1%~1%的甲烷、乙烷及0.1%~1.5%的丙烷三种组分气体组成。采用最小二乘支持向量机技术分别建立了各组分气体的定量分析模型,利用粒子群优化算法对最小二乘支持向量机算法中的参数进行了优化选取,取代了传统的遍历优化方法,然后利用取得的最优参数重建定量分析模型。实验结果表明,采用此方法离线建模所用时间比采用遍历优化方法节省40倍以上,预测结果误差水平相当,满足实测要求。粒子群优化算法在全局优化及收敛速度方面具有较大优势。粒子群优化算法与最小二乘支持向量机技术相结合用于混合气体定量分析是切实可行的,具有一定的实际意义和应用价值。  相似文献   

16.
孙瑶琴 《应用声学》2017,25(3):48-50, 54
支持向量机(SVM)作为当前新型的机器学习方式,凭借解决小样本问题、高维问题和局部极值问题等方面的优越性,在当前故障诊断方面有突出的表现;文章根据对支持向量机的研究,发现其在分类模型参数选择上存在困难,为此,提出利用改进粒子群算法优化的办法,解决粒子群前期收敛速度过快导致后期容易优化不均的现象;通过粒子群算法优化与支持向量机分类模型结合,以轴承故障检测和诊断为例,分析次方法的优越性和提高支持向量机在故障诊断过程中的精准度;通过实际检测得出,这种算法优化的方法改进的支持向量机对于聚类性较差的故障分类具有很好的诊断功能。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号