首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 234 毫秒
1.
由于国内外食品市场准入制度和溯源体系不完善,销售商乱用虚假标签等现象的发生,使得食品安全形势愈发严峻。为了保障野生食用菌的安全性,保护云南高原特色农业品牌战略,亟需建立快速准确的产地溯源方法。通过采集云南及其周边8个产地、79个绒柄牛肝菌子实体的紫外-可见吸收光谱(UV-Vis)与傅里叶变换红外光谱(FTIR),采用多元散射校正(MSC)、标准正态变换(SNV)、二阶导数(2D)、平滑(SG)等算法对原始光谱进行预处理。基于低级与中级数据融合策略,将预处理后的UV-Vis与FTIR光谱信息进行融合,结合偏最小二乘判别分析(PLS-DA)与支持向量机(SVM),建立牛肝菌产地鉴别模型,确定最佳产地溯源方法。对光谱融合数据进行系统聚类分析(HCA),探讨不同产地样品整体化学信息的差异性与相关性。结果显示:(1)采用MSC+2D和SNV+2D对UV-Vis与FTIR光谱进行预处理,R2Y与Q2最大,分别为61.58%,95.09%和50.85%,82.16%,表明MSC+2D与SNV+2D为UV-Vis与FTIR光谱的最佳预处理方法;(2)基于UV-Vis,FTIR,低级与中级数据融合建立的PLS-DA与SVM模型,样品分类错误总数分别为24,6,2,2和6,1,1,0,表明数据融合模型分类效果优于单一UV-Vis与FTIR模型;(3)中级数据融合模型中,SVM对所有样品的分类全部正确,PLS-DA的分类错误总数为2,表明基于SVM的中级数据融合策略分类效果优于PLS-DA;(4)低级和中级数据融合HCA模型,分别有4和1个样品不能与同一类区域样品聚为一类,表明中级数据融合优于低级数据融合;由中级数据融合HCA图可知,同一产地样品聚类距离小于不同产地之间聚类距离,表明同一产地样品整体化学成分类较相似,且同一产地不同采集地点的差异小于不同产地之间的差异。采用UV-Vis与FTIR光谱中级数据融合策略结合SVM,能够对不同产地来源牛肝菌样品进行准确鉴别,为野生食用菌产地溯源研究提供一种新方法。  相似文献   

2.
由于部分毒菌与野生食用菌形态和生物学特征相似,农民仅凭经验采集,难免将两者混淆,从而导致严重的食品安全事故。云南省作为国内野生食用菌产量最高、出口量最大的省份,野生食用菌产业发展为云南农村经济发展做出了突出贡献,对不同种类野生食用菌进行快速鉴别,有利于野生食用菌产业的健康发展;分析食用菌亲缘关系,对食用菌育种工作具有积极作用。七种牛肝菌样品,采自云南及周边七个产地,利用FTIR光谱仪分别采集菌柄和菌盖红外指纹图谱,基于低级与中级数据融合策略,将预处理后的菌柄和菌盖FTIR光谱数据进行融合,结合Decision Trees,Discriminant Analysis,Logistic Regression Classifiers,Support Vector Machines,Nearest Neighbor Classifiers和Ensemble Classifiers中的17种算法,分别建立菌柄、菌盖、低级数据融合和中级数据融合模型,每个分类模型连续进行10次运算,通过比较训练集分类正确率平均值,确定牛肝菌种类鉴别最佳分类算法。中级数据融合数据集进行系统聚类分析(HCA),对推测不同种类牛肝菌样品的亲缘关系进行鉴定。结果显示:(1)菌柄、菌盖和低级数据融合模型最佳分类算法均为Linear Discriminant,训练集分类正确率分别为92.8%,96.4%和97.6%。中级数据融合模型最佳分类算法为Subspace Discriminant,训练集分类正确率为100%;(2)菌柄、菌盖、低级数据融合和中级数据融合最佳分类模型,全部样品分类正确率平均值分别为93.61%,95.54%,96.99%和99.88%,中级数据融合模型优于其他三种模型,表明中级数据模型可以将相似度较高的样品区分开,且减少了产地对种类鉴别的影响;(3)中级数据融合模型数据集进行HCA,华丽牛肝菌和美味牛肝菌聚类距离最小,表明这两种牛肝菌化学信息较相似,亲缘关系较近;(4)华丽牛肝菌与皱盖疣柄牛肝菌聚类临界值距离最大,表明样品化学信息差异较大,亲缘关系较远。综上表明,基于中级融合策略将不同部位FTIR光谱数据融合,结合Subspace Discriminant与HCA,可以准确鉴别不同种类牛肝菌和快速推测样品亲缘关系,可作为野生食用菌种类鉴别与亲缘关系推测的一种新方法。  相似文献   

3.
牛肝菌营养丰富,味道鲜美,备受各国消费者青睐。因种间差异和环境因素的多层次影响,不同种类及产地牛肝菌品质参差不齐。目前,利益驱动导致商家在牛肝菌销售过程中以次充好、以假乱真的行为扰乱了食用菌市场,不仅给消费者带来健康风险,也制约了牛肝菌的国际化贸易。采用多源异构信息融合策略对牛肝菌种类与产地进行鉴别,以期为追溯食用菌来源以及正确评价其品质提供一种快速有效的解决方法。试验样品灰褐牛肝菌(Boletus griseus)、栗色牛肝菌(B. umbriniporus)、美味牛肝菌(B. edulis)、皱盖疣柄牛肝菌(Leccinum rugosicepes)和绒柄牛肝菌(B. tomentipes)五种牛肝菌科(Boletaceae)真菌子实体采于云南省保山市、昆明市、玉溪市与红河州。采用傅里叶变换红外光谱仪(FTIR)和紫外可见分光光度计(UV-Vis)采集样品信息。Kennard-Stone算法将样品原始数据分为校正集和验证集。校正集基于FTIR、UV-Vis、低级、中级与高级数据融合建立偏最小二乘判别分析(PLS-DA)模型,其中决定系数(R2cal)、预测能力Q2、校正均方根误差(RMSEE)和交叉验证均方差(RMSECV)用来评价模型鲁棒性。研究结果显示:(1)不同种类及产地牛肝菌FTIR和UV-Vis吸收峰的峰位置、峰形和峰数相似,而吸收强度存有差异,表明牛肝菌所含化学成分相似,但含量有一定差别;(2)PLS-DA模型二维散点图可以看出,中级融合比低级融合能更好的鉴别样品种类及产地;(3)各模型中,中级融合模型具有更大的Q2和最小RMSECV,模型鲁棒性最强;(4)验证集样本用来验证模型泛化能力,FTIR、UV-Vis、低级融合、中级融合及高级融合模型样品种类鉴别正确率分别为92.86%,35.71%,97.62%,100%和95.23%;产地鉴别正确率分别为71.43%,61.90%,61.90%,97.62%和76.19%。表明多源异构信息融合在一定程度上优于独立模型,其中,中级数据融合种类鉴别正确率100%,产地鉴别正确率97.62%,模型具有更优的鉴别效果和泛化能力。FTIR和UV-Vis结合中级数据融合策略能实现牛肝菌种类快速精确鉴别,产地快速有效鉴别,可作为食用菌来源追溯以及品质评价的一种新方法。  相似文献   

4.
近年来食品安全问题频发,消费者愈加重视食品原产地的环境安全,导致地理标志产品的需求增加。美味牛肝菌(Boletus edulis)作为一种健康食品,其产品品质受原产地环境影响较大,为保护消费者的身体健康,防止假冒伪劣产品进入市场,急需一种高效、廉价的美味牛肝菌产地鉴别技术。采用数据融合策略结合偏最小二乘判别(PLS-DA)模型对美味牛肝菌的产地进行鉴别。扫描来自8个产地(昆明、楚雄、玉溪、迪庆、大理、保山、文山和曲靖)141个样品的傅里叶变换近红外光谱和傅里叶变换中红外光谱。使用Kennard-Stone算法将所有样品划分为2/3的训练集和1/3的预测集,利用三种融合策略(低级、中级和高级)对4个单一光谱矩阵:近红外的菌柄(N-b)、近红外的菌盖(N-g)、中红外的菌柄(M-b)、中红外的菌盖(M-g),建立偏最小二乘判别(PLS-DA)模型。用交叉验证均方根误差(RMSECV)和预测均方根误差(RMSEP)评价模型稳定性,非错误率(NER)、训练集正确率和预测集正确率评价模型分类性能,综合多种评价指标,找出美味牛肝菌产地鉴别的最佳方法。结果表明:(1)近红外和中红外光谱均能鉴别美味牛肝菌产地;(2)中红外光谱所建立的模型优于近红外光谱所建立的模型;(3)三种融合策略均可提高美味牛肝菌的产地鉴别效果,产地鉴别效果优劣依次为中级融合、高级融合、低级融合、单一光谱模型。通过融合近红外和中红外光谱使用PLS-DA进行基于特征值LV的中级融合策略,建立不同产地美味牛肝菌鉴别模型,有最少的变量数(49),最高的产地训练集正确率(100%),最高的产地预测集正确率(100%),最低的RMSEP(0.133),实现了美味牛肝菌产地的快速、准确鉴别,可以作为美味牛肝菌产地溯源的一种可靠方法。  相似文献   

5.
青叶胆(Swertia leducii)为獐牙菜属(Swertia)一年生草本植物,在肝炎病治疗方面效果显著。其与同属近似种外观极其相似,加之常以干燥全草入药,仅从形态难以正确鉴别。不同物种有效成分存在明显差异,其药效也有所不同。基于光谱和色谱数据融合建立青叶胆及近似种的鉴别方法,为青叶胆药用真实性与安全性提供科学依据。采集青叶胆及其近似种植物共102份样品的傅里叶变换红外光谱(FTIR)和超高效液相色谱(UPLC)指纹图谱;利用标准正态变量(SNV)、多元散射校正(MSC)、 Savitzky-Golay平滑(SG)、一阶导数(1D)、二阶导数(2D)等方法对原始红外光谱数据进行预处理,通过系统聚类分析(HCA)探讨獐牙菜属不同种类样品化学信息相似性与差异性; Kennard-Stone算法将所有样品按2∶1比例划分为训练集和预测集,训练集基于FTIR, UPLC,低级与中级数据融合建立随机森林(RF)判别模型,预测集用于验证模型预测能力,其中灵敏性(sensitivity)、特异性(specificity)、精密度(precision)和正确率(accuracy)用来评价模型性能。结果显示:(1)采用SNV+SG+2D组合对FTIR数据进行预处理,R~2Y和Q~2最大,分别为91.2%和84.1%,所有类别被正确区分,为最佳预处理。(2)HCA反映了5种獐牙菜属植物样品分类情况与亲缘关系,除紫红獐牙菜外,其余4种獐牙菜植物均分类正确,准确率为93.1%;青叶胆、川东獐牙菜、紫红獐牙菜与西南獐牙菜亲缘关系较近。(3)基于FTIR、 UPLC、低级和中级数据融合策略建立RF判别模型,样品错判总数分别为1, 5, 1和0,中级数据融合效果最佳,所有样品均正确分类,所建模型性能良好。FTIR与UPLC通过中级数据融合策略结合RF判别分析能正确鉴别不同种类獐牙菜属植物,结合HCA分析能够明确青叶胆及其近似种之间的亲缘关系,为獐牙菜属植物资源开发与质量控制提供理论基础。  相似文献   

6.
采收是中药生产的重要环节,采收时间直接影响中药质量和产量,是中医临床安全有效用药的前提,开展中药适时采收期的研究具有重要意义和应用价值。采用傅里叶变换红外光谱法对72份不同采收期的滇龙胆进行鉴别研究,用TQ8.0软件对原始光谱进行一阶导数(first derivative,FD)、二阶导数(second derivative,SD)、标准正态变量(standard normal variate,SNV)、多元散射校正(multiplicative scatter correction,MSC)和平滑(savitaky-golay filter,SG)预处理,样品按3∶1分为校正集和预测集,同时建立主成分分析(principal component analysis,PCA)和偏最小二乘判别分析(partial least square discriminant analysis,PLS-DA)模型。结果显示,选取1 800~600cm~(-1)波段范围的光谱,去除光谱噪音;SNV结合二阶导数光谱和SG(15,3)平滑,预处理结果满意。主成分分析表明,前三个主成分方差贡献率为92.47%,5月、9月和10月份采收的样品差异较小。偏最小二乘判别分析建立判别模型,决定系数R2和校正均方根误差(RMSEE)分别为0.967 8和0.086 0,可对18个预测集样品进行准确分类。红外光谱法结合主成分分析、偏最小二乘判别分析对不同采收期滇龙胆的分类和判别效果较好,为不同采收期的中药鉴别提供理论依据。  相似文献   

7.
傅里叶变换红外光谱结合化学计量学建立快速鉴别牛肝菌种类及测定牛肝菌中总Hg含量的方法。采集15种共48份云南常见牛肝菌的红外光谱信息并用冷原子吸收光谱-直接测汞仪测定牛肝菌的总Hg含量,根据FAO/WHO规定的每周Hg允许摄入量(provisional tolerable weekly intake, PTWI)评价牛肝菌的食用安全性;采用Norris平滑、多元散射校正、二阶导数、正交信号校正-微波压缩等方法对牛肝菌的红外光谱进行优化处理,优化处理后的数据进行主成分分析、偏最小二乘判别分析建立快速鉴别牛肝菌种类及牛肝菌总Hg含量的预测模型。结果显示:(1)主成分分析的前三个主成分累积贡献率为77.1%,不同种类牛肝菌在主成分得分图中能够明显区分开,表明不同种类牛肝菌的化学组分或含量具有差异;(2)不同产地、种类牛肝菌总Hg含量差异明显,其总Hg含量在0.17~15.2 mg·kg-1 dw之间;若成年人(60 kg)每周食用300 g新鲜牛肝菌则少数牛肝菌摄入的Hg超过PTWI的限量标准,食用有一定风险;(3)牛肝菌红外光谱数据与总Hg含量拟合,进行偏最小二乘判别分析,能快速区分总Hg含量低(≤1.95 mg·kg-1 dw)、中(2.05~3.9 mg·kg-1 dw)、高(≥4.1 mg·kg-1 dw)的牛肝菌样品,并且Hg含量差异越大,越易于区分;进一步建立牛肝菌总Hg含量预测模型,训练集的R2为0.911 4,RMSEE为1.09,验证集的R2和RMSEP分别为0.949 7和0.669 5,牛肝菌总Hg含量预测值与测定值比较接近,模型预测效果良好。红外光谱结合化学计量学方法能快速鉴别牛肝菌种类,区分不同总Hg含量的牛肝菌样品并对Hg含量进行准确预测,为野生牛肝菌的质量控制和食用安全评估提供快速、简便的方法。  相似文献   

8.
黄精药材品质优劣与基原植物产地环境因子密切相关,建立简单、快速且能够准确鉴别药材产地的方法对保证其质量可控及用药安全具有重要的理论意义和应用前景。研究中以云南、四川和广西9个产地的133份滇黄精Polygonatum kingianum coll. et Hemsl根茎为试验材料,采集衰减全反射-傅里叶变换红外光谱(ATR-FTIR)和紫外-可见光光谱(UV-Vis)数据预处理后分别建立单一光谱随机森林(Random forest, RF)模型;将ATR-FTIR与UV-Vis数据直接串联完成低级融合,提取两种光谱的主成分数(PCs)和潜在变量(LVs)以实现中级(中级融合PCs和中级融合LVs)和高级数据融合(高级融合PCs和高级融合LVs),基于不同数据融合策略分别建立RF模型;比较不同模型的正确率(ACC)、灵敏度(SEN)和特异性(SPE),筛选产地鉴别最佳模型。结果显示,不同产地滇黄精ATR-FTIR和UV-Vis峰型相似,吸光度略有差异,ATR-FTIR显示14个共有峰,与糖类、甾体皂苷、黄酮类和生物碱类物质有关,其UV-Vis共有峰主要位于272及327 nm处,与黄酮类物质有关;ATR-FTIR、UV-Vis和低级融合的RF模型,训练集和预测集ACC分别为(76.34%,95.00%),(80.65%,95.00%)和(83.87%,100.00%),但SEN和SPE值较低,故不宜采用;中级融合PCs和中级融合LVs的RF模型的SEN和SPE分别为大于0.91和0.98,训练集ACC分别为91.40%和97.85%,预测集ACC均为97.50%;高级融合PCs和高级融合LVs的RF训练集ACC分别为77.42%和97.85%,预测集ACC均为95.00%,高级融合PCs的RF模型鉴别效果较差,高级融合LVs的RF模型存在过拟合现象;模型鉴别能力为中级融合LVs>中级融合PCs>低级融合> UV-Vis>ATR-FTIR>高级融合PCs;提取LVs对产地鉴别的方法优于PCs;中级融合LVs建立的RF模型鉴别ACC最高,SEN和SPE大于0.98,模型性能最佳。该方法可为黄精药用资源的科学评价提供理论依据和技术支撑。  相似文献   

9.
柑橘叶片水分亏缺是影响柑橘生长发育的重要因素之一,为研究水分胁迫对柑橘含水率的影响,利用高光谱快速无损检测柑橘叶片含水率,并应用伪彩色处理实现含水率可视化。收集100片柑橘叶片,使用烘干法得到鲜叶和烘干叶片一共500个不同梯度含水率的数据样本,将样本按7∶3的比例划分为训练集(350个样本)和测试集(150个样本),使用决定系数(R2)和均方根误差(RMSE)来评估模型预测的好坏。采用卷积神经网络(CNN)对高光谱数据进行预测,CNN模型使用一维卷积核,一共三层卷积池化层,使用RELU激活函数激活,输出层采用linear激活函数回归预测,使用nadam算法对模型进行优化更新,迭代次数为1 000次;将原始光谱数据和SG,MSC和SNV三种预处理后的光谱数据,与全波段、CARS筛选的特征波段、PCA提取的特征波段组合,导入CNN模型,确定最佳模型为原始光谱数据的CARS-CNN,训练集的R2c和RMSEC分别为0.967 9和0.016 3,测试集的R2v和RMSEV分别为0.947 0和0.021 4;原始光谱数据的全波段CNN模型效果其次,训练集的R2c和RMSEC分别为0.934 3和0.024 9,测试集的R2v和RMSEV分别为0.915 9和0.028 6。对比了不同预处理方式和特征波长选择的支持向量机回归模型(SVR)、偏最小二乘法回归模型(PLSR)、随机森林模型(RF)组合的最佳结果,将最佳组合模型(原始光谱数据+CARS+PLSR,SNV+PCA+RF,SNV+PCA+SVR)与原始光谱数据的CARS-CNN对比,结果表明,依然是原始光谱数据的CARS-CNN模型预测效果最佳。相较于其他的模型,CARS-CNN模型经过CARS筛选特征波段和卷积核进一步提取特征后,预测精度远高于SVR,PLSR和RF模型。选择训练好的CARS-CNN模型,将高光谱图片导入到模型中,计算每个像素点的含水率,得到伪彩色图像,能够可视化叶片的含水率分布情况。研究结果为柑橘叶片水分含量提供了更快速、更直观、更全面的评估,为研究柑橘叶片水分胁迫提供了依据,为智能灌溉决策的优化提供了参考。  相似文献   

10.
采用荧光高光谱成像技术对脐橙表面不同浓度毒死蜱和多菌灵进行判别。实验通过由氙灯光源激发的高光谱成像系统(392~998.2 nm)分别采集浓度为0,0.5,1,2 mg·kg-1的毒死蜱和0,1,3,5 mg·kg-1多菌灵的高光谱图像。使用ENVI软件获取样本的感兴趣区域(ROI);对原始光谱数据采用卷积平滑(SG)、标准正态标量变换(SNV)及一阶导数(FD)方法进行预处理;采用区间变量迭代空间收缩法(iVISSA)、无信息变量消除算法(UVE)和竞争性自适应加权算法(CARS)进行一次提取特征波长,二维相关光谱(2D-COS)方法进行二次提取特征波长。最后采用主成分分析与线性判别分析相结合算法(PCA-LDA)和偏最小二乘算法(PLS-DA)建立基于两次提取特征波长脐橙表面不同浓度毒死蜱和多菌灵残留的判别模型。将原始光谱数据与经过预处理的3种光谱数据进行建模分析,结果发现毒死蜱和多菌灵的光谱数据经过SG处理后模型效果最优。对经SG预处理后的毒死蜱光谱数据和多菌灵光谱数据进行特征波长一次提取,最佳特征波长分别为iVISSA法和CARS法,分别提取出26个和30个特征波长;再采用二维相关光谱(2D-COS)算法对这26个和30个特征波长进行二次提取,分别得到10个和12个特征波长。对一次提取特征波长和二次提取特征波长后的光谱数据分别建模。结果表明,对于不同浓度的毒死蜱,基于iVISSA-2D-COS建立的PCA-LDA模型判别效果最佳,其校正集与预测集判别正确率分别为98.61%和95.83%;对于不同浓度的多菌灵,基于CARS-2D-COS建立的PCA-LDA模型判别效果最佳,其校正集与预测集判别正确率分别为97.22%和95.83%,均高于全波段光谱数据模型和一次提取特征波长模型判别正确率,说明2D-COS可以捕捉可用的荧光光谱信息。该研究采用2D-COS对一次提取最优特征波长进行二次提取后建模,研究结果为脐橙表面不同浓度农药残留的快速无损判别提供了一定的参考。  相似文献   

11.
为探究一种快速、可靠的化橘红检测方法,本实验分别采用傅里叶变换衰减全反射红外光谱法和荧光光谱成像技术结合多层感知器(MLP)神经网络所构建的模式识别方法,对化橘红进行鉴别,并对两种方法进行了比较。实验以81个正毛化橘红,37个其他品种橘红共118个样品为研究对象,采集所有样品的红外光谱和荧光光谱图像。根据光谱曲线中不同样品间的差异,取红外光谱中550-1800 cm-1区段范围内的光谱数据和荧光光谱曲线中的400~720 nm区段的光谱数据进行分析,应用主成分分析法(PCA)对化橘红的光谱数据进行降维处理,再结合MLP神经网络对化橘红样品进行判别分析。实验中分别使用多元散射校正(MSC)、标准正态变量校正(SNV)、一阶导(FD)、二阶导(SD)以及Savitzky-Golay(SG)平滑数据预处理方法,并比较他们对鉴别模型的影响。分析结果表明:利用红外光谱法(FTIR/ATR),经由Savitzky-Golay(SG)平滑预处理得到的数据,通过隐层函数为sigmoid的三层MLP模型,能够得到最优正毛化橘红识别率,其结果训练集和测试集的识别率都为100%;利用荧光光谱成像技术,由多元散射(MSC)预处理的结果是最理想的。经过预处理的数据,通过隐层函数为sigmoid函数的三层MLP模型,训练集识别率达到100%,测试集识别率达到96.7%。由此可见,衰减全反射红外光谱法(FTIR/ATR)和荧光光谱成像技术分别与MLP神经网络构建的识别模式,均可对化橘红的判别达到快速、可靠的效果。  相似文献   

12.
近红外光谱技术鉴别花椒产地   总被引:1,自引:0,他引:1  
采集四川、重庆、云南、贵州、陕西五省市8个不同产地205个花椒样品的近红外光谱,使用主成分分析(principal component analysis, PCA)、判别偏最小二乘法(discriminant partial least squares, DPLS)分析了花椒产地的分类鉴别。结果表明:在12 500~3 800 cm-1波数范围内,采用不同的光谱预处理方法可以建立较为稳健的DPLS模式识别模型,对不同产地的花椒有较好的分类鉴别。其校正集交叉验证除了经一阶微分预处理的模型识别率为99.39%外,其他预处理方法识别率均为100%,独立验证集总体识别正确率在85.37%~97.56%之间,其中经标准正态变量变换(standard normal variate, SNV)、多元散射校正(multiplicative scatter correction, MSC)预处理后的DPLS判别模型效果最好,误判数仅分别为1个,表示该方法在花椒产地识别中具有可行性。  相似文献   

13.
矿井水害对煤矿安全生产存在巨大威胁,所以快速识别矿井突水水源,对煤矿水灾预警及灾后救援工作开展都有重大意义。激光诱导荧光(LIF)技术具有快速、高效、灵敏度高等特点,克服了传统水化学方法识别时间长的缺点。循环神经网络(RNN)在解决长序列训练过程中产生的梯度消失、梯度爆炸等问题上存在明显不足,而特殊变体RNN即长短期记忆(LSTM)神经网络很好地弥补了RNN的短板及缺陷。提出了将LIF技术与LSTM算法相结合,应用在矿井突水水源快速识别中。实验样本采自淮南矿区,以砂岩水和老空水为原始样本,并将砂岩水和老空水按照不同比例混合配置成5种混合水样,共7种待测水样进行实验。首先采用最大最小值归一化(MinMaxScaler)、平滑滤波(SG)以及标准正态变量变换(SNV)三种预处理方法对原始光谱数据进行预处理,减少原始光谱数据存在的噪声和干扰信息。之后为防止数据量过大,维度过高,将包括原始光谱数据在内的四组数据再进行LDA降维至3维。最后分别搭建LSTM识别模型,从测试集预测准确率、训练集准确率变化趋势以及训练集损失函数变化趋势三个方面进行比较,选择最优模型。其中SG+LDA+LSTM和Original+LDA+LSTM在测试集预测准确率上都能达到100%,MinMaxScaler+LDA+LSTM测试集预测准确率在98.57%,SNV+LDA+LSTM准确率最低,只有87.14%;在训练集准确率变化趋势表现上,SG+LDA+LSTM能够保持良好的学习,很快达到100%,Original+LDA+LSTM和MinMaxScaler+LDA+LSTM也能达到100%的准确率,但在前几次训练过程中会有准确率下降的情况出现,SNV+LDA+LSTM训练集准确率在训练次数内并未达到100%;SG+LDA+LSTM损失函数变化趋势也具有很好的收敛性和稳定性,Original+LDA+LSTM,MinMaxScaler+LDA+LSTM以及SNV+LDA+LSTM在损失函数变化趋势上表现并不出色。结果表明,4组模型中,SG+LDA+LSTM模型是最适合应用于矿井突水识别,该方法补充了矿井突水水源识别工作的内容,为矿井突水识别提供了新的思路。  相似文献   

14.
木材的种类识别是木材加工和贸易的一个重要环节,传统的木材种类识别方法主要有显微检测法和木材纹理识别法,其操作繁琐,耗时长,成本高,不能满足当前需求。本研究利用木材的近红外光谱(NIRS)结合模式识别方法,以期实现木材种类的快速准确识别。采用近红外光谱结合主成分分析法(PCA)、偏最小二乘判别分析法(PLSDA)和簇类独立软模式法(SIMCA)三种模式识别对58种木材进行种类鉴别研究;5点平滑、标准正态变量变换(SNV)、多元散射校正(MSC)、Savitzky-Golay一阶导数(SG 1st-Der)和小波导数(WD)五种光谱预处理方法用于木材光谱的预处理;校正集和测试集样品的正确识别率(CRR)用于模型的评价。采用PCA方法,通过样品的前三个主成分空间分布图分辨木材种类的聚类情况。在建立PLSDA模型,原始光谱的正确识别率最高,分别为88.2%和88.2%;5点平滑处理的光谱校正集和测试集的CRR分别为88.1%和88.2%;SNV处理的光谱校正集和测试集的CRR分别为84.4%和84.5%;MSC处理的光谱校正集和测试集的CRR分别为83.1%和84.2%;SG 1st-Der处理的光谱校正集和测试集的CRR分别为81.8%和82.7%;WD(小波基为“Haar”,分解尺度为80)处理的光谱校正集和测试集的CRR分别为87.3%和87.2%。可知,在PLSDA模型中,木材光谱未经预处理种类识别效果最后好。在建立SIMCA模型过程中,原始光谱的校正集和测试集的CRR分别为99.7%和99.4%;5点平滑处理的光谱校正集和测试集的CRR分别为100%和100%;SNV处理的光谱校正集和测试集的CRR分别为99.5%和99.1%;MSC处理的光谱校正集和测试集的CRR分别为99.0%和98.4%;SG 1st-Der的光谱校正集和测试集的CRR分别为81.8%和82.7%;WD处理的光谱校正集和测试集的CRR分别为100%和100%。可知,在SIMCA模型中,木材光谱经平滑和小波导数处理后的识别效果最好,且光谱的校正集和测试集CRR都为100%。采用三种模式结合五种不同的预处理方法对木材近红外光谱进行定性建模识别时,由于木材样本属性复杂,主成分分布图相互交织,PCA无法识别出58种木材;原始光谱的PLSDA模型可以得到较好的判别模型,但校正集和测试集的CRR只有88.2%和88.2%;木材光谱经过5点平滑或WD预处理后的SIMCA模型可达到最好的识别效果,校正集和测试集的CRR均为100%,且WD-SIMCA模型因子数比5点平滑SIMCA模型小,模型更为简化,故WD-SIMCA为58种木材种类识别的最优模型。研究表明光谱预处理方法可以有效的提高木材种类识别精度,有监督模式识别方法SIMCA可以用来建立有效的木材识别模型,近红外光谱结合模式识别可以为木材种类的识别提供一种快速简便的分析方法。  相似文献   

15.
为了实现兰州百合关键营养物质蛋白质和多糖的快速无损检测,在12 000~4 000 cm-1光谱范围内采集了59份兰州百合粉的近红外光谱(NIRS)。首先运用SG、Normalize、SNV、MSC、Detrend、OSC、SG+1D、SG+Normalize、SG+SNV和SG+Detrend十种预处理方法对原始光谱数据进行处理,确定蛋白质的最佳预处理方法为SG+Detrend、多糖的最佳预处理方法为Detrend;然后运用CARS、SPA和PCA三种算法对预处理的光谱数据进行特征波长筛选,确定蛋白质和多糖的最佳特征波长提取方法均为SPA算法;最后采用PLSR法建立了兰州百合关键营养物质蛋白质和多糖含量的预测模型,结果显示,经过SG+Detrend_SPA处理所建立的蛋白质PLSR模型中,预测集相关系数Rp为0.810 6,预测集均方根误差RMSEP为1.195 3;经过Detrend_SPA处理所建立的多糖PLSR模型中,预测集相关系数Rp为0.810 9,预测集均方根误差RMSEP为2.0946。考虑到经典PLSR无损预测模型精度的限制,在该研究中提出SOM-RBF神经网络无损预测模型。首先利用SOM网络对数据样本进行聚类,然后将得到的聚类类别数和聚类中心作为RBF网络的隐层节点个数和隐层节点数据中心,以此来优化RBF的结构参数。在建立的蛋白质SOM-RBF神经网络模型中,预测集相关系数Rp为0.866 6,预测集均方根误差RMSEP为1.038 5;建立的多糖SOM-RBF神经网络模型中,预测集相关系数Rp为0.868 1,预测集均方根误差RMSEP为1.799 4。比较PLSR和SOM-RBF两种模型对两种物质的预测结果,确定了SOM-RBF神经网络模型为最优建模方法,最终确定在蛋白质检测中,最优模型为基于SG+Detrend_SPA_SOM-RBF建立的模型,模型的预测集相关系数较PLSR高5.6%,预测集均方根误差较PLSR低0.156 8;在多糖检测中,确定的最优模型为基于Detrend_SPA_SOM-RBF建立的模型,模型的预测集相关系数较PLSR高5.72%,预测集均方根误差较PLSR低0.295 2。研究结果表明,运用NIR和SOM-RBF技术可以实现对兰州百合关键营养物质蛋白质和多糖的快速无损检测,为今后快速无损检测兰州百合营养物质提供理论依据。  相似文献   

16.
近红外光谱的水稻抗性淀粉含量测定研究   总被引:3,自引:0,他引:3  
用化学法测定水稻抗性淀粉含量耗时长、成本高,为此,探索了基于近红外光谱技术(NIRS)的水稻抗性淀粉含量测定新途径。首先,采集了62份抗性淀粉含量差异较大的水稻的光谱数据,将光谱数据和已测定的化学值数据导入化学计量学软件,采用偏最小二乘法(PLS)建立了抗性淀粉含量的近红外定标模型,对不同预处理得到的预测模型进行了内部验证和外部验证。结果如下:内部交叉验证方面,未处理、MSC+1thD预处理、1thD +SNV预处理的决定系数(R2)分别为0.920 2,0.967 0,0.976 7,预测均方根误差(RMSEP)分别为1.533 7,1.011 2,0.837 1。外部验证方面,未处理、MSC+1thD预处理和1thD +SNV预处理的决定系数(R2)分别为0.805,0.976,0.992,绝对误差平均值分别为1.456,0.818,0.515,预测值和化学值之间没有显著差异(Turkey法多重比较),说明以近红外光谱分析法代替化学测定法是有可能的。在不同预处理方法之中,1thD+SNV的预处理方法无论内部验证还是外部验证都具有较高的决定系数和较低的误差值,定标模型精度更高,误差更小。  相似文献   

17.
为探究一种快速、可靠的肉苁蓉属中药材检测方法,实验采用荧光光谱成像技术结合模式识别方法对肉苁蓉属三种中药材:荒漠肉苁蓉、管花肉苁蓉和沙苁蓉进行鉴别研究。实验中发现肉苁蓉样品存在较显著的荧光特性,采集来自不同产地、不同批次以及不同超市购买的三种肉苁蓉属药材的40个样品的荧光光谱图像,对图像进行去噪、二值化处理后,根据光谱立方体绘制每个样本的光谱曲线,将所得450~680 nm波段范围内的光谱数据作为鉴别分析的研究对象,应用主成分分析法(PCA)对三种肉苁蓉的光谱数据进行降维处理,再结合Fisher判别方法对三种肉苁蓉进行鉴别。分别比较多元散射校正(MSC)、标准正态变量校正变换(SNV)以及一阶微分(FD)三种数据预处理方法对鉴别模型的影响,并根据主成分的累积贡献率和主成分因子数对判别模型效果的影响对主成分因子数进行优化。分析结果表明:一阶微分预处理后提取前四个主成分进行Fisher判别的鉴别效果最佳,PCA结合Fisher判别建立肉苁蓉属三种药材的判别模型原始判别的准确率达到100%,交叉验证的准确率达到95%。由此可见,利用荧光光谱成像技术结合主成分分析及Fisher判别对肉苁蓉属三种药材的鉴别分析是可行的,而且具有操作简便、快速、可靠等优点。  相似文献   

18.
为提高全血血红蛋白浓度预测模型的预测精度,基于近红外光谱分析,首先对原始全血透射光谱数据分别进行均值中心化、标准化、标准正态变量变换(SNV)、多元散射校正(MSC)以及Savitzky-Golay(SG)卷积平滑结合MSC的预处理操作,最终选择预处理效果最好的SG-MSC方法作为数据预处理方法,其最大相关系数达到0.944 1。对SG平滑的平滑窗口宽度进行讨论,找出平滑效果最好的窗口宽度为27。数据预处理消除了全血吸收光谱的基线失真,提高了全血吸收光谱数据的信噪比。将190个样本(190个血红蛋白浓度对应的透射光谱数据)分为具有相近血红蛋白浓度分布的校正集和测试集,其中校正集为143个样本(对应血红蛋白浓度分布为10.6~17.3 g·dL-1),测试集为47个样本(对应血红蛋白浓度分布为10.3~17.3 g·dL-1),确保建立模型的适用性。对校正集数据预处理后利用蒙特卡洛无信息变量消除(MC-UVE)方法对其进行波长变量选择,剔除含信息量少的波长点,提高含信息量多的波长占比。设置蒙特卡洛迭代次数为1 000,最终从全血吸收光谱的700个波长变量中筛选出191个波长变量用于建立全血血红蛋白浓度偏最小二乘(PLS)回归模型。对比分析原始全血透射光谱全谱PLS模型、原始全血吸收光谱全谱PLS模型、预处理全血吸收光谱全谱PLS模型、SG-MSC-MC-UVE-PLS模型以及已有二阶导数PLS模型的模型效果,表明基于SG-MSC-MC-UVE-PLS算法的全血血红蛋白浓度预测模型效果较其他模型效果更优,预测相关系数由0.676 3提高到0.979 1,预测集均方根误差由0.898 1减小到0.220 3,最大绝对误差由2.426 1减小到0.411 2。同时,利用MC-UVE方法进行波长变量选择,在保证预测精度的前提下,筛选出建模的波长个数更少,有利于提高模型计算效率。研究结果表明,SG-MSC-MC-UVE-PLS方法能够提高全血吸收光谱信号的信噪比,简化模型结构,提高模型的预测精度和计算效率,对推动血红蛋白浓度检测技术的发展具有进步意义。  相似文献   

19.
由于猪瘟影响,鸡蛋作为动物性蛋白的需求大幅增加,蛋鸡养殖行业也在逐步发展与壮大以满足人们的需求。如何在幼雏阶段甚至胚胎发育阶段能够简单、准确与方便地判断出雌雄,对蛋鸡养殖行业的发展具有重要意义。对此,选用96个壳色相近、表面无裂纹的新鲜种鸡蛋,以其可见/近红外漫反射光谱为研究对象,探讨数据采集位置、光谱预处理方法对种蛋胚胎性别鉴定定性模型的影响。在样本表面钝端、锐端和赤道共三个不同位置分别采集漫反射光谱强度,经校正后选择(440.27~874.6) nm作为有效光谱波段进行分析,并按照2∶1的比例划分训练集和测试集,分析了采用归一化(Normalize),二阶导数(2nd Derivative),标准正态变量变换(SNV),多元散射校正(MSC),去趋势法(Detrend),光谱转换法(Spectroscopic)共六种方法预处理后的偏最小二乘法判别模型和线性判别分析模型的预测集准确率,与原始数据(Raw)的预测集准确率进行对比,得出准确率差异。通过对入孵后216,240,264,288和312 h不同位置所采光谱数据,与种蛋性别信息综合分析,发现胚胎发育288 h时的预处理效果最好,有效提高了35个模型的准确率;264 h时的预处理效果在分析时间内最差,其处理降低了19个模型的判别准确率;312 h的预处理降低了12个模型的判别准确率;Detrend和Spectroscopic两种预处理方法可显著提高判别效果,其中经Spectroscopic处理后的模型可能无法进行预测;SNV和MSC对模型具有相同作用效果,Normalize对模型的作用效果不能确定,经2nd Derivative处理后准确率不确定,有时与原始数据建模效果一致。综合实验结果发现,对种鸡蛋胚胎发育288 h的数据进行预处理可有效提高模型的判别准确率,其中对种蛋钝端处数据进行Detrend去趋势预处理并利用LDA模型分析较好。研究结果为建立种鸡蛋基于可见/近红外的性别信息早期、快速检测模型提供了参考。  相似文献   

20.
现在樱桃市场上存在着大量以次充好的不良现象,严重损害了名牌樱桃的品牌经济效益,所以亟需一种能对不同产地樱桃实现快速无损鉴别的技术。拉曼光谱溯源技术作为光谱溯源技术的一种,由于具有快速、高效、无污染、无损分析等优点,逐渐得到相关研究者的重视。长短期记忆(LSTM)网络是一种具有记忆性的反馈神经网络,它是循环神经网络的一种变体。LSTM网络克服了循环神经网络中梯度消失的缺点,适合处理序列敏感的问题和任务,目前被广泛应用在语音识别、图像识别和手写识别等领域,但LSTM网络在产地溯源方面的应用还有待研究。基于此,提出了一种LSTM网络与拉曼光谱技术结合的能对不同产地樱桃实现快速无损鉴别的技术。将来自美国、山东和四川的369个樱桃作为研究样本,用拉曼光谱仪在785 nm激光下获得了不同产地樱桃的光谱数据。并且以每条经过基线校正后的拉曼光谱数据作为网络输入数据,基于LSTM网络构建了能对不同产地樱桃实现快速鉴别的判别模型,并且以样本判别准确率A、样本精确率P、样本召回率R和样本F值作为评价指标,探究了不同预处理方法对LSTM网络判别模型性能的影响。结果表明:当样本训练集和测试集的比例为85∶38时,直接采用原始拉曼光谱数据的LSTM网络模型的产地鉴别能力不高,鉴别准确率为79.87%。但当使用预处理过后的拉曼光谱数据,模型的鉴别准确率维持在92%以上。并且光谱经过SG+MSC预处理后模型的鉴别准确度最好,鉴别准确率达99.12%。同时在采用SG+MSC预处理的方法下,LSTM网络鉴别模型的精确率、召回率、F值均较高,表明了所提出的LSTM网络模型有较好的性能可实现对不同产地樱桃的鉴别,为樱桃的产地溯源提供了一种新的思路。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号