首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 156 毫秒
1.
基于可见光光谱高效鉴别玉米单倍体籽粒   总被引:2,自引:0,他引:2  
单倍体技术已发展成为玉米遗传研究及现代玉米育种的重要技术之一,单倍体籽粒的鉴别筛选是其中的重要环节。目前单倍体籽粒主要是依赖于籽粒的R1-nj遗传标记通过人工肉眼观察颜色的有或无进行鉴别,费时费工。而且部分材料由于标记颜色很难从籽粒外部观察到,导致人工筛选准确率较低。基于可见光光谱分析建立玉米单倍体籽粒鉴别方法,探索利用可见光光谱鉴别玉米单倍体籽粒的可行性。同时,由于每季用于诱导单倍体的育种材料不尽相同,模型须能够鉴别未参加建模的材料的单倍体。本研究以9个遗传背景的单倍体和杂交籽粒共284粒作为试验材料,利用便携式紫外-可见光光纤光谱仪采集单个玉米籽粒的可见光漫透射光谱。光谱数据经平滑、矢量归一化预处理和主成分分析,基于支持向量机方法建立单倍体和杂交籽粒判别模型。每次选择1个背景的样本作为测试集,其余背景的样本作为建模集对模型进行交叉验证。模型交叉验证平均正确判别率达到92.06%。其中8次测试正确判别率在85%以上。结果表明利用可见光光谱分析建立玉米单倍体籽粒鉴别方法,并使模型可鉴别未参与建模材料的单倍体具有可行性。并且基于该方法有望建立玉米单倍体籽粒的自动化快速筛选系统,提高玉米单倍体育种效率。  相似文献   

2.
单倍体技术已发展成为玉米遗传研究及现代玉米育种的重要技术之一,单倍体籽粒的鉴别筛选是其中的重要环节。目前单倍体籽粒主要是依赖于籽粒的R1-nj遗传标记通过人工肉眼观察颜色的有或无进行鉴别,费时费工。而且部分材料由于标记颜色很难从籽粒外部观察到,导致人工筛选准确率较低。基于可见光光谱分析建立玉米单倍体籽粒鉴别方法,探索利用可见光光谱鉴别玉米单倍体籽粒的可行性。同时,由于每季用于诱导单倍体的育种材料不尽相同,模型须能够鉴别未参加建模的材料的单倍体。本研究以9个遗传背景的单倍体和杂交籽粒共284粒作为试验材料,利用便携式紫外-可见光光纤光谱仪采集单个玉米籽粒的可见光漫透射光谱。光谱数据经平滑、矢量归一化预处理和主成分分析,基于支持向量机方法建立单倍体和杂交籽粒判别模型。每次选择1个背景的样本作为测试集,其余背景的样本作为建模集对模型进行交叉验证。模型交叉验证平均正确判别率达到92.06%。其中8次测试正确判别率在85%以上。结果表明利用可见光光谱分析建立玉米单倍体籽粒鉴别方法,并使模型可鉴别未参与建模材料的单倍体具有可行性。并且基于该方法有望建立玉米单倍体籽粒的自动化快速筛选系统,提高玉米单倍体育种效率。  相似文献   

3.
使用JDSU公司的MicroNIR1700型微型近红外光谱仪,研究了适合进行单籽粒玉米单倍体鉴别的光谱测量方法。基于近红外光谱定性分析技术,比较了漫反射和漫透射两种情况下玉米单倍体鉴别的效果。光谱数据经过预处理后,采用PLS+OLDA特征提取算法,应用SVM建立玉米单倍体鉴别模型,分别统计漫反射和漫透射实验条件下,鉴别模型的正确识别率。在微型光谱仪内置光源漫反射的光谱测量方式下,不分胚面朝向,玉米单倍体籽粒平均识别率低于60%,不能有效鉴别玉米单倍体和多倍体。而采用外置光源对籽粒进行漫透射光谱测量方式,获得了平均正确识别率为93.2%的鉴别效果,并且模型稳定性好。实验结果表明,漫反射光谱仅能获得玉米籽粒表层信息,因此玉米籽粒胚面朝向严重影响漫反射光谱鉴别单倍体种子的效果;而漫透射光谱可以实现分析光程纵深信息全累加,能够得到样品内部的信息,因此对胚面朝向不敏感,能够有效地对随机摆放的玉米单倍体和多倍体进行识别。近红外方法能快速、无损地鉴别单倍体,并且微型光谱仪采集速度快,成本低,为实现实用化的自动鉴别提供了条件。  相似文献   

4.
针对近红外光谱定性分析中,增加新的品种进行建模时,原有模型识别效果不够稳定的问题,提出一种在建模样本的基础上添加同类物质的历史光谱数据的特征提取方法,首先采集建模样本的近红外光谱数据,然后添加同种物质样本的历史近红外光谱数据,再对所有近红外光谱数据进行预处理,其次对所有样本数据进行偏最小二乘(PLS)特征提取得到偏最小二乘空间,并只将建模样本数据向构建的偏最小二乘空间进行投影,最后将投影后的建模数据进行正交线性判别分析(OLDA)特征提取。以玉米种子近红外光谱为研究对象,分别对建模数据添加历史近红外光谱以及不添加历史近红外光谱两种情况进行特征提取,并通过仿生模式识别(BPR)方法构建模型进行验证,实验结果表明,添加历史近红外光谱构建偏最小二乘空间的特征提取方法相对于不添加历史近红外光谱的方法,首先在增加建模集品种数量时,原有的品种识别率基本不变;其次在相同PLS维数时,所建模型对不同时间采集的测试集识别效果基本一致,证明了该方法可以提高模型稳健性。在实际应用中就可以在品种鉴别软件中将特征提取维数设置为固定值,免除了品种鉴别软件的用户在增加建模集品种时为了保证最优识别效果重新选定最优PLS参数的麻烦。  相似文献   

5.
使用JDSU公司的MicroNIR1700型微型近红外光谱仪,研究了适合进行单籽粒玉米单倍体鉴别的光谱测量方法。基于近红外光谱定性分析技术,比较了漫反射和漫透射两种情况下玉米单倍体鉴别的效果。光谱数据经过预处理后,采用PLS+OLDA特征提取算法,应用SVM建立玉米单倍体鉴别模型,分别统计漫反射和漫透射实验条件下,鉴别模型的正确识别率。在微型光谱仪内置光源漫反射的光谱测量方式下,不分胚面朝向,玉米单倍体籽粒平均识别率低于60%,不能有效鉴别玉米单倍体和多倍体。而采用外置光源对籽粒进行漫透射光谱测量方式,获得了平均正确识别率为93.2%的鉴别效果,并且模型稳定性好。实验结果表明,漫反射光谱仅能获得玉米籽粒表层信息,因此玉米籽粒胚面朝向严重影响漫反射光谱鉴别单倍体种子的效果;而漫透射光谱可以实现分析光程纵深信息全累加,能够得到样品内部的信息,因此对胚面朝向不敏感,能够有效地对随机摆放的玉米单倍体和多倍体进行识别。近红外方法能快速、无损地鉴别单倍体,并且微型光谱仪采集速度快,成本低,为实现实用化的自动鉴别提供了条件。  相似文献   

6.
实现快速、精确地鉴别玉米单倍体籽粒对玉米单倍体育种技术十分重要。近红外光谱分析技术可在线分析、监测,且无损、分析速度快、操作简便、测试成本低,对实现自动化的大规模鉴定并分拣玉米单倍体非常有帮助。通过美国JDSU的近红外光谱仪进行玉米近红外光谱的数据采集,交叉采集玉米单倍体、多倍体数据。数据处理时,将数据分为训练集和测试集两部分。依次对数据做预处理以消除噪声影响,做核变换将其投射到更高维度空间中增强可分性并进行特征提取,最后建立分类模型鉴别分析。分别统计采用不同的特征提取算法并建立模型鉴别测试的正确识别率。实验结果表明,采用核局部保持投影(KLPP)的特征提取算法的正确识别率更高、稳定性更好,在两组测试集上的正确识别率的均值分别达到95.71%和96.43%。通过分析可以得出,玉米种子的近红外光谱数据经过非线性变换(为高斯核变换)投影到更高维度的空间后,表现出更易于分类的分布特点,保持数据的局部特性也更利于后续的分类。这为玉米单倍体鉴定进一步研究提供了新的方向。  相似文献   

7.
目前,在单倍体育种技术中,可先使用低场核磁共振方法定量测得玉米单倍体与二倍体的油分,再依据二者油分差异鉴别单倍体,该方法在实际育种工作中已取得初步应用,但核磁共振鉴别单倍体方法存在速度慢、价格贵、维护难等缺点,难以获得大范围应用。近红外光谱技术有诸多优点并在各领域取得广泛应用,相关研究也表明该技术可用于玉米单倍体的定性鉴别,但是目前该方法用于鉴别单倍体实验研究时涉及的玉米品种相对较少,对于某些品种识别效果较差,且内部机理类似于黑盒,难以指明单倍体、二倍体两类种子是依据何种物质的差别进行区分,有时难以获得农业领域专家认可。根据花粉直感效应的原理,玉米单倍体与二倍体存在明显的油分区别,通过油分鉴别单倍体原理直观明白,易于被业内专家接受。因此,提出了一种先定量得到油分,再依据定量分析所得油分进行分类的方法,即首先使用玉米单籽粒的近红外光谱定量回归分析得到各籽粒的油分含量,再利用定量分析所得的油分值,并使用最小平方误差方法对单倍体、二倍体混合籽粒进行定性分类。实验结果表明近红外定量分析方法的识别精度与核磁共振方法相当,与几种定性分析方法比较,在训练集规模相同时,近红外定量分析方法所得识别率优于几种定性分析方法,进一步表明近红外定量分析方法鉴别单倍体具有一定优势,可满足育种行业精度要求,能够为尽快实现单倍体工程化育种提供保障。  相似文献   

8.
棉花精量播种技术目前已经在新疆兵团全面推广,该技术能精确实现一穴一粒的农艺技术指标,但是也对高质量棉种的筛选提出了更高的要求。为了避免播种往年活力不足的棉种而导致发芽率降低的问题,结合机器学习和近红外(NIR)高光谱成像技术(HSI)进行棉种年份精确鉴别,实现棉种的快速无损筛选。采集2016年—2019年近四年外观无明显差异的棉种各360粒,共1 440粒棉种(按照3∶1∶1划分训练集、验证集和测试集)作为样本,按照每批60粒采集915~1 698 nm范围的棉种高光谱图像,去除首尾两端噪声大的光谱,保留1 002~1 602 nm范围的光谱为原始数据。利用Savitzky-Golay(SG)平滑算法对光谱进行预处理,采用主成分载荷方法(PCA-loading)选取13个特征波段,基于全部光谱数据和特征波段(±10 nm)数据建立逻辑回归(LR)、偏最小二乘判别分析(PLS-DA)、支持向量机(SVM)、循环神经网络(RNN)、长短记忆网络(LSTM)和卷积神经网络(CNN)六种分类模型。使用全光谱数据建模时,六种分类模型在测试集上的鉴别准确率分别为96.27%,98.98%,99.32%,96.95%,97.63%和100%,其中CNN和SVM模型取得了较好的结果;使用特征光谱数据建模时,六种分类模型在测试集上的鉴别精度分别为93.56%,97.29%,98.30%,95.25%,94.24%和99.66%,其中CNN和SVM模型仍有较好的分类结果。结果表明,使用全光谱数据建模时,六种分类模型都可以实现较高精度的棉种年份鉴别,使用特征光谱数据建模时CNN和SVM模型的鉴别精度仍可达到98%;其中深度学习方法优于传统机器学习方法,但是传统机器学习方法仍能保持较好的鉴别准确率。因此,结合近红外高光谱成像技术和机器学习方法能够实现棉种年份的高精度鉴别,为棉花精量播种过程中的优质棉种选种技术提供理论依据和方法。  相似文献   

9.
牛肝菌作为一种著名的野生食用菌,具有较高的食用价值和经济价值。牛肝菌种类繁多,不易区分,建立一种有效、快速、可信的种类鉴别技术,可为牛肝菌提高品质提供一种方法。本研究采集云南不同地区7种野生牛肝菌共计683株,获取样品中红外光谱和紫外光谱,分析不同种类牛肝菌平均光谱图特征。基于多种预处理组合(SNV+SG,2D+MSC+SNV,1D+MSC+SNV+SG,MSC+2D)的单一光谱数据结合两种特征值提取法(PCA,LVs)构建了偏最小二乘法判别分析与随机森林算法并结合数据融合策略对牛肝菌进行种类鉴别,有一定的创新性。结果表明:(1)中红外光谱和紫外光谱的不同种类牛肝菌平均光谱吸收峰差异较小,吸光度具有细微差异。(2)合适的预处理可提高光谱数据信息,偏最小二乘法判别分析和随机森林算法模型的中红外光谱数据和紫外光谱数据最佳预处理组合为2D+MSC+SNV,SNV+SG,2D+MSC+SNV,1D+MSC+SNV+SG。(3)单一光谱模型中,中红外光谱模型优于紫外光谱模型,中红外光谱最佳预处理组合2D+MSC+SNV的偏最小二乘法判别分析模型正确率训练集99.78%,验证集99.12%;随机森林模型正确率训练集93.20%,验证集99%。(4)数据融合策略提高了分类正确率,低级融合的偏最小二乘法判别分析模型训练集和验证集正确率为100%,99.12%。随机森林模型训练集和验证集正确率为92.32%,99.14%。(5)随机森林算法中级数据融合Latent variable(LVs)正确率为训练集92.76%,验证集96.04%;中级数据融合Principal components analysis(CPA)正确率为训练集97.15%,验证集100%。(6)偏最小二乘法判别分析中级数据融合(LVs)正确率为训练集100%,验证集99.56%;中级数据融合(CPA)训练集和验证集正确率均能达到100%。基于偏最小二乘法判别分析和随机森林算法结合数据融合策略对牛肝菌进行种类鉴别,鉴别效果理想。偏最小二乘法判别分析中级数据融合(CPA)可作为一种低成本高效率的牛肝菌种类鉴别技术。  相似文献   

10.
转基因技术在过去的几十年里快速发展, 然而此项技术对生态环境、伦理道德等可能带来的影响尚存争议,因此针对农作物的转基因成分检测和鉴别的相关技术研究十分重要。本研究以转双价基因(cry1Ab/cry2Aj-G10evo)玉米籽粒和玉米面粉为研究对象,采用近红外光谱仪采集900~1 700 nm波段范围的光谱,结合 Savitzky-Golay(SG)平滑算法对提取出的光谱数据进行去除噪声处理。基于全波段光谱和PCA主成分分别建立了偏最小二乘判别分析(PLS)和支持向量机判别模型(SVM)。试验结果表明,在转基因玉米籽粒全谱的判别分析模型中,SVM判别模型效果要优于PLS判别模型,SVM模型识别正确率达到90%以上,PLS的模型识别率只有85%左右。以PCA降维后建立的模型中,SVM模型也取得了最优的效果,建模集和预测集识别正确率达到100%。虽然转基因玉米在研磨加工后外源蛋白和DNA有所下降,但是转基因玉米粉末基于全波段光谱建立的SVM模型的建模集正确率仍有90.625%。结果表明应用近红外光谱技术集合化学计量学方法对转基因玉米的鉴别是可行的,为转基因玉米乃至其他转基因农产品的鉴别提供了技术支持,具有重要的理论意义和应用价值。  相似文献   

11.
Li Xing 《光谱学快报》2013,46(1):47-53
Data preprocessing and multivariate regression methods are two key factors influencing the model prediction ability of near-infrared (NIR) spectroscopy. The present paper evaluated the application of the combined stationary wavelet transform–support vector machine method for developing juice NIR models. The performance of this method has been compared with other methods, such as stand normal variate–partial least squares, stationary wavelet transform–partial least squares, and stand normal variate–stationary wavelet transform methods. The result showed that compared with other methods, the stationary wavelet transform–support vector machine method can provide good quantitative analysis on saccharose concentration in juice.  相似文献   

12.
高光谱成像的土壤剖面水分含量反演及制图   总被引:2,自引:0,他引:2  
传统土壤水分的获取方法仅可获得离散的土壤水分点位数据,难以获得剖面上精细且连续的水分含量分布图。研究了野外条件下利用近红外高光谱(882~1 709 nm)成像反演剖面土壤水分含量(SMC),并实现精细制图的可行性。研究剖面位于江苏省东台市,我们利用近红外高光谱成像仪对剖面进行了5天原位连续观测,共采集了280个土样用于烘干法测定SMC。原始高光谱图像经数字量化值(DN)校正、黑白校正、拼接、几何校正、剪切和掩膜等一系列预处理后,提取各采样点的平均光谱反射率。提取光谱(Raw)经吸光度[LOG10(1/R)],Savitzky-Golay平滑(SG)、一阶微分(FD)、二阶微分(SD)、多元散射校正(MSC)和标准正态变量(SNV)转换后,采用偏最小二乘回归(PLSR)和最小二乘支持向量机(LS-SVM)方法建立SMC预测模型,并对比分析不同光谱预处理方法与建模方法组合条件下SMC的预测精度。结果表明,光谱反射率随SMC增加逐渐降低,不同光谱预处理方法的预测精度有所差异,除MSC方法外,同一光谱预处理方法的LS-SVM模型预测精度均高于PLSR模型,并且基于LOG10(1/R)光谱的LS-SVM模型对SMC预测精度最高,其建模集的决定系数(R2c)和均方根误差(RMSEc)分别为0.96和0.65%,预测集的决定系数(R2p)、均方根误差(RMSEp)和相对分析误差(RPDp)分别为0.88,1.05%和2.88。利用最优模型进行剖面SMC的高空间分辨率精细制图,通过比较SMC反演图中提取的预测值与实测值关系发现预测精度较高(R2: 0.85~0.95, RMSE: 0.94%~1.02%),且两者在剖面中的变化趋势基本一致,说明SMC反演图不仅能很好地反映出土壤水分在整个剖面中毫米级的含量分布信息,也可反映出同一位置处不同天数间的含量差异。因此,利用近红外高光谱成像结合优化的预测模型,能够实现土壤剖面SMC的定量预测及精细制图,有助于快速、有效监测田间剖面土壤水分状况。  相似文献   

13.
近红外光谱技术快速识别针叶材和阔叶材的研究   总被引:1,自引:0,他引:1  
对一种针叶材和一种阔叶材的横切面采集波长范围为780~2 500 nm的近红外漫反射光谱,结合偏最小二乘判别分析法(PLS-DA)对针叶材杉木和阔叶材桉树快速识别的可行性进行了研究,结果表明:(1)利用近红外光谱结合PLS-DA法建立的识别模型对建模样品的识别正确率达到100%,识别模型预测的分类变量值与实际值之间相关系数r达到0.99,SEC为0.07;(2)即使采用短波区域780~1 100 nm的近红外光谱也可以获得理想的识别结果(识别正确率为100%),识别模型的r也达到0.99,SEC为0.07;(3)利用近红外光谱建立的识别模型对未知样本的识别正确率都为100%,说明近红外光谱技术可以快速、准确识别针叶材和阔叶材,这为木材识别提供了一种新方法和技术,也为开发低成本的近红外光谱识别仪器提供了科学依据。  相似文献   

14.
NIR光谱的Isomap-PLS非线性建模方法   总被引:6,自引:0,他引:6  
针对样品的近红外(NIR)光谱与其物理化学性质之间存在的非线性关系,提出了一种结合等距映射(Isomap)和偏最小二乘(PLS)的非线性建模新方法。Isomap是一种新的非线性降维方法,属于流形学习方法,能有效地发现高维数据中的本真低维结构。Isomap-PLS建模方法首先用Isomap对高维NIR光谱数据作非线性降维,再用PLS降维并建立校正模型。将Isomap-PLS建模方法分别应用于两个公开的NIR光谱标准数据集,并与PLS单独建模进行比较。结果表明,在两个数据集上,用Isomap-PLS方法建立的校正模型比单独用PLS算法建立的校正模型具有更小的交叉验证均方根误差(RMSECV);对某些性质数据,Isomap-PLS模型比PLS模型的RMSECV值要小2~5倍。因此,Isomap能够有效反映NIR光谱中存在的非线性结构,Isomap-PLS比PLS具有更好的建模与预测能力。  相似文献   

15.
为了提高铝合金定量分析的精度,将激光诱导击穿光谱技术与多变量线性回归、中值高斯核支持向量机回归及标准化偏最小二乘回归等方法相结合,建立铝合金中 Cu元素定量分析模型。对采集的LIBS光谱进行三阶极小值去背景和小波阈值降噪处理,从而提高LIBS光谱的信背比。将处理后数据筛选最佳训练集、预测集并用多变量线性回归、中值高斯核支持向量机回归法和标准化偏最小二乘拟合回归等建立定标模型。选用 Cu Ⅰ 324.80 nm,Cu Ⅰ 327.43 nm两条特征谱线以及323~329 nm范围内的LIBS光谱数据进行定量分析,对比分析三种LIBS定量分析模型的拟合系数(R2)、定标均方根误差(RMSEC)、预测均方根误差(RMSEP)和平均相对误差(ARE)等。结果表明,相对于多变量线性回归和中值高斯核支持向量机回归法两种LIBS定量分析模型,对于铝合金中的Cu元素定量分析,标准化PLSR模型的精度和准确度都有明显的提高,并且LIBS定标曲线的R2,RMSEC,RMSEP和ARE分别为0.997,0.014 Wt%,0.129 Wt%和3.053%。研究结果表明在提高定标模型精确度与泛化性方面,标准化PLSR方法更具有优势,能够有效地减小参数波动和自吸收效应对铝合金定量分析的影响。  相似文献   

16.
培育优质高产水稻品种是当前水稻育种的重要任务之一;胶稠度是稻米蒸煮食味品质最重要的指标之一。传统的化学法测定稻米胶稠度,前处理复杂、过程繁琐、试剂消耗多,难以满足大批量水稻品种(组合)胶稠度快速无损检测的需求。近红外光谱分析能快速、无损、无污染地分析检测。以137份南方稻区主栽或新育成的籼稻品种(组合)为供试材料,用传统化学法测定其稻米胶稠度并收集其近红外光谱,以建立南方籼稻米胶稠度近红外光谱分析模型,并对模型进行校正、检验。用偏最小二乘法(PLS)分别经20种数学预处理和6种波长段(或组合)建立各自的近红外分析模型。通过比较模型评价指标确定了平滑预处理为最佳预处理方式,波长段1 100~1 650 nm为最优建模波长段。平滑处理模型评价指标:校准相关系数(R)、检验相关系数(r)、相对百分比偏差(RPD)分别为0.970 0,0.964 2和3.780 5;波长段1 100~1 650 nm模型评价指标:R,r和RPD分别为0.969 4,0.963 8和3.758 6;经平滑处理后在1 100~1 650 nm波长段建立了稻米胶稠度最优近红外分析模型,其模型评价指标:R,r和RPD分别为0.979 0,0.974 1和4.419 4;再用30份验证集样本对所得的最优模型进行外部验证,结果表明:近红外检测值和化学值绝对误差在0.198 6~6.502 4 mm,对其进行配对T检验,p=0.726>0.05,表明该近红外模型的检测值与化学值无显著差异,即应用此近红外模型快速无损检测稻米胶稠度是可行的。本研究结果为优质水稻品种(组合)早世代材料的快速筛选及稻米胶稠度的批量快速分析检测提供了技术支持。  相似文献   

17.
由于国内外食品市场准入制度和溯源体系不完善,销售商乱用虚假标签等现象的发生,使得食品安全形势愈发严峻。为了保障野生食用菌的安全性,保护云南高原特色农业品牌战略,亟需建立快速准确的产地溯源方法。通过采集云南及其周边8个产地、79个绒柄牛肝菌子实体的紫外-可见吸收光谱(UV-Vis)与傅里叶变换红外光谱(FTIR),采用多元散射校正(MSC)、标准正态变换(SNV)、二阶导数(2D)、平滑(SG)等算法对原始光谱进行预处理。基于低级与中级数据融合策略,将预处理后的UV-Vis与FTIR光谱信息进行融合,结合偏最小二乘判别分析(PLS-DA)与支持向量机(SVM),建立牛肝菌产地鉴别模型,确定最佳产地溯源方法。对光谱融合数据进行系统聚类分析(HCA),探讨不同产地样品整体化学信息的差异性与相关性。结果显示:(1)采用MSC+2D和SNV+2D对UV-Vis与FTIR光谱进行预处理,R2Y与Q2最大,分别为61.58%,95.09%和50.85%,82.16%,表明MSC+2D与SNV+2D为UV-Vis与FTIR光谱的最佳预处理方法;(2)基于UV-Vis,FTIR,低级与中级数据融合建立的PLS-DA与SVM模型,样品分类错误总数分别为24,6,2,2和6,1,1,0,表明数据融合模型分类效果优于单一UV-Vis与FTIR模型;(3)中级数据融合模型中,SVM对所有样品的分类全部正确,PLS-DA的分类错误总数为2,表明基于SVM的中级数据融合策略分类效果优于PLS-DA;(4)低级和中级数据融合HCA模型,分别有4和1个样品不能与同一类区域样品聚为一类,表明中级数据融合优于低级数据融合;由中级数据融合HCA图可知,同一产地样品聚类距离小于不同产地之间聚类距离,表明同一产地样品整体化学成分类较相似,且同一产地不同采集地点的差异小于不同产地之间的差异。采用UV-Vis与FTIR光谱中级数据融合策略结合SVM,能够对不同产地来源牛肝菌样品进行准确鉴别,为野生食用菌产地溯源研究提供一种新方法。  相似文献   

18.
提出了一种结合自编码网络(AN)流形学习和偏最小二乘(PLS)法的红外光谱建模方法AN-PLS。AN-PLS方法首先用AN算法对红外光谱数据进行非线性降维,再结合PLS建立回归模型。利用该方法建立了毛竹笋中不溶性膳食纤维含量的近红外光谱和中红外光谱回归模型。结果表明,用AN-PLS方法建立的回归模型,比用其他常用光谱数据预处理方法结合PLS及用单独PLS算法建立的模型具有更小的预测均方根误差RMSEP和更高的决定系数R2,因此,AN-PLS具有较优的建模与预测能力,利用近红外光谱和中红外光谱技术结合AN-PLS建模,可实现毛竹笋中不溶性膳食纤维含量的准确测量。  相似文献   

19.
利用自编码网络(autoencoder network, AN)流形学习和稀疏表示(sparse representation, SR)方法对汽车变速箱油进行近红外光谱品种识别研究。以壳牌、美孚、嘉实多、上海大众和上海通用五种变速箱油为对象,利用AN方法对600~1800 nm近红外光谱数据进行非线性降维,获取10个特征变量。每种变速箱油选取30个样本(共150个样本)作为训练样本,每种30个样本(共150个样本)作为测试样本。所有训练样本的特征变量组成了稀疏表示方法的整体训练样本矩阵,将变速箱油品种分类识别问题转化为一个求解待识别测试样本对于整体训练样本矩阵的稀疏表示问题,通过求解L-1范数意义下的最优化问题来实现。经过主成分分析(principal component analysis,PCA)和AN降维后,分别利用线性判断分析法(linear discriminant analysis,LDA)、偏最小二乘支持向量机法(least squares-support vector machine,LS-SVM)和本文提出的稀疏表示分类算法进行分类比较。结果表明,结合自编码网络和稀疏表示方法对五种汽车变速箱油品种的平均识别准确率达97.33%,为汽车变速箱油品种近红外光谱快速准确识别提供了有效的新途径。  相似文献   

20.
研究集成学习方法在有机物红外光谱定量分析中的应用及特征波长选取方法对红外光谱集成学习建模效率和预测精度的影响。以柴油红外光谱的十六烷和总芳香烃含量为研究对象,首先采用极端随机森林(ERT)、线性核支持向量机(LinearSVM)、径向基核支持向量机(RBFSVM)和多项式核支持向量机(polySVM)作为基学习器,LinearSVM作为元学习器建立两层Stacking集成学习框架,分析比较单个基学习器与集成学习对柴油红外光谱的定量回归预测精度,与偏最小二乘(PLS)定量回归模型相比,Stacking集成学习模型对柴油光谱的两种有机物含量的预测精度均有提升,其中十六烷含量的ERT模型预测结果最优(r=0.848, RMSEP=1.603, RDP=2.627),总芳香烃含量的Stacking模型预测结果最优(r=0.991, RMSEP=0.526, RDP=9.243);进一步利用组合偏最小二乘(SiPLS)和连续投影算法(SPA)对红外光谱进行特征波长选取,利用优选出的红外光谱特征波长建立集成学习定量回归模型,其中十六烷含量的SiPLS-ERT模型预测结果最优(r=0.893, RMSEP=1.013, RDP=3.051),芳香烃含量的SiPLS-Stacking模型预测结果最优(r=0.998, RMSEP=0.354, RDP=11.475),且模型平均训练时间较全光谱训练时间减少50%以上,建模速度明显提高。研究结果表明,特征波长结合集成学习定量回归建模能够用于有机物红外光谱的定量分析中,与传统定量回归方法相比,该方法的建模效率和预测精度均有较大提高,为进一步研究机器学习在光谱定量分析中的应用提供相关方法支持。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号