首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 265 毫秒
1.
平菇是我国大宗食用菌品种之一,产量位居我国食用菌的第三位。平菇不仅味道鲜美,而且含有丰富优质的蛋白质及具有多种生物活性的平菇多糖,深受消费者喜爱。市场上的平菇产品众多,质量参差不齐,并且现有营养成分分析方法耗时长、成本高,难以满足平菇等大宗食用菌的营养成分检测需求。傅里叶变换红外光谱(FTIR)技术具有检测速度快、操作方便、可同时分析多种化合物、安全环保等特点,将其与化学计量学结合,构建数学模型,能满足对平菇等大宗农产品营养成分的快速检测、分析及评价。以平菇为研究对象,在全国范围内收集主栽平菇样品85份,分别进行红外光谱扫描,并运用多元散射校正(MSC)、标准正态变换(SNV)、正交信号校正(OSC)、光滑加一阶导数(F-G D)、光滑加二阶导数(S-G D)等5种光谱数据预处理方法,通过比较模型验证集回归系数,确定平菇蛋白质模型最佳预处理方式为OSC结合S-G D,平菇多糖模型最佳预处理方式为OSC结合F-G D。在最佳光谱预处理下,采用LASSO算法对7458个光谱波段进行特征波段提取,获得平菇蛋白质特征波数93个,平菇多糖特征波数92个,压缩率达到98%。将特征波数与化学方法检测...  相似文献   

2.
为探究一种快速、可靠的化橘红检测方法,本实验分别采用傅里叶变换衰减全反射红外光谱法和荧光光谱成像技术结合多层感知器(MLP)神经网络所构建的模式识别方法,对化橘红进行鉴别,并对两种方法进行了比较。实验以81个正毛化橘红,37个其他品种橘红共118个样品为研究对象,采集所有样品的红外光谱和荧光光谱图像。根据光谱曲线中不同样品间的差异,取红外光谱中550-1800 cm-1区段范围内的光谱数据和荧光光谱曲线中的400~720 nm区段的光谱数据进行分析,应用主成分分析法(PCA)对化橘红的光谱数据进行降维处理,再结合MLP神经网络对化橘红样品进行判别分析。实验中分别使用多元散射校正(MSC)、标准正态变量校正(SNV)、一阶导(FD)、二阶导(SD)以及Savitzky-Golay(SG)平滑数据预处理方法,并比较他们对鉴别模型的影响。分析结果表明:利用红外光谱法(FTIR/ATR),经由Savitzky-Golay(SG)平滑预处理得到的数据,通过隐层函数为sigmoid的三层MLP模型,能够得到最优正毛化橘红识别率,其结果训练集和测试集的识别率都为100%;利用荧光光谱成像技术,由多元散射(MSC)预处理的结果是最理想的。经过预处理的数据,通过隐层函数为sigmoid函数的三层MLP模型,训练集识别率达到100%,测试集识别率达到96.7%。由此可见,衰减全反射红外光谱法(FTIR/ATR)和荧光光谱成像技术分别与MLP神经网络构建的识别模式,均可对化橘红的判别达到快速、可靠的效果。  相似文献   

3.
红外光谱和逐步判别分析应用于金银花品种和产地的鉴别   总被引:1,自引:0,他引:1  
基于傅里叶变换红外光谱技术,利用逐步判别分析法对金银花品种和产地进行鉴别研究。采集、测试了5个产地9个品种150份金银花样本的红外光谱,并计算了各样品红外光谱的一阶导数光谱和二阶导数光谱。分别选用不同的样本组成训练集和检验集,以1800~900 cm~(-1)、1500~700 cm~(-1)和1200~700 cm~(-1)波数范围的红外光谱、一阶导数光谱和二阶导数光谱数据为判别变量建立判别模型对金银花的品种和产地进行鉴别。判别结果显示,以1800~900 cm~(-1)波数范围的二阶导数光谱数据为判别变量建立的模型鉴别效果相对较好,对品种和产地的鉴别正确率依次达93.20%和96.13%。研究结果表明,采用逐步判别模式识别可以很好地鉴别不同品种和产地的金银花,方法可行有效,可为金银花品种和产地朔源提供方法。  相似文献   

4.
不同年份和产地美味牛肝菌的红外光谱鉴别研究   总被引:2,自引:0,他引:2  
采用傅里叶变换红外光谱技术结合多元统计分析建立快速鉴别不同年份、不同产地美味牛肝菌的方法。采集2011年一2014年云南26个不同地区152个美味牛肝菌样品的红外光谱,使用正交信号校正(orthogonal signal correction,OSC)、微波压缩(wavelet compression)方法对原始光谱进行优化处理,OSCW校正前后的光谱数据进行偏最小二乘判别分析(partial least squares discriminant analysis,PLS-DA),比较光谱预处理前后PLS-DA的分类效果。将152个美味牛肝菌随机分为训练集(120个)和验证集(32个),建立OS--CW校正前后的PLS分类预测模型。结果显示,经OSCW处理后的PLS-DA分类效果明显优于处理前的结果,主成分得分图能准确区分不同年份、不同产地美味牛肝菌样品,表明OSCW处理能有效滤除光谱中的噪音及与因变量无关的干扰信息,提高光谱分析的准确性和计算速率。OSCW处理前PLS模型训练集的R~2和RMSEE分别为0.790 1和21.246 5,验证集的R~2和RMSEP分别为0.922 5和14.429 2;OSCW预处理后训练集的R~2和RMSEE分别为0.852 3和17.238 1,验证集的R~2和RMSEP分别为0.845 4和20.87,表明OSCW预处理提高了训练集的预测效果,但OSCW-PLS出现了过拟合现象降低验证集的预测能力,因此,OSCW不适宜与PLS结合建立模型。OSCW结合PLS-DA能滤除光谱中大量的干扰信息,准确区分不同年份、不同产地美味牛肝菌样品,为野生食用菌的鉴别分类提供可靠依据。  相似文献   

5.
采用近红外光谱结合化学计量学,对来源于不同产地的81个党参样本进行快速、无损的定性研究.将党参样本粉碎后,采用光纤漫反射采集近红外光谱,并结合随机森林建立党参的定性模型,同时对比分析了不同光谱预处理方法(未处理、变量标准化十一阶导数、偏移校正十一阶导数)对鉴别结果的影响.结果显示,样本可按产地区分开;光谱经偏移校正十一阶导数处理后,训练集准确率达100%,测试集准确率为94%.研究表明,近红外光谱结合随机森林原理简单,易操作,准确率高,为作为快速鉴别党参的参考方法.  相似文献   

6.
中药产地及生长环境的改变会对其次生代谢产物、质量产生整体性影响。近年来,三七产地从道地产地文山扩展到周边县市。为保证三七质量,中国药典以三种皂苷含量为指标对三七进行质量控制,指标较为单一,难以对三七质量进行整体性评价。通过紫外-可见分光光度法测定三七总黄酮含量,傅里叶变换红外光谱结合化学计量学建立三七总黄酮含量快速预测模型;为三七快速及整体性质量控制提供研究基础。采集云南省12个产地96个三七样品的紫外与红外光谱。记录样品紫外光谱268nm处吸光度,结合芦丁标准品线性方程计算样品中总黄酮含量。预处理红外光谱数据采用一阶(1D)、二阶导数(2D)结合SavitskyGolay平滑(7点、9点和11点)处理,Kennard-stone算法将96个个体分为2/3训练集与1/3预测集。训练集数据用于正交信号校正偏最小二乘回归(OSC-PLSR)模型的建立,1/7交叉验证用于筛选最佳主成分数,预测集数据对OSC-PLSR模型预测能力进行验证。结果显示:(1)标准品芦丁在268nm处吸光度与浓度相关系数r=0.999 7,线性浓度范围为5.6~72.0μg·mL~(-1),线性关系良好;(2)道地产区文山州3个产地以及曲靖市罗平、昆明市石林等产地三七总黄酮含量较高,平均含量高于7mg·g-1;(3)相同点数SavitskyGolay平滑之后,二阶导数模型预测能力优于一阶导数,不同处理模型预测能力具有较大差别;(4)预测模型中,2D+SG 7+OSC-PLSR(R2pre=0.976 1,RMSEP=0.325 2)与2D+SG 11+OSC-PLSR(R2pre=0.946 9,RMSEP=0.382 0)模型预测效果较好,RMSEP均小于0.4,预测值与检测值接近。傅里叶变换红外光谱结合OSC-PLSR能够对12个产地三七中总黄酮含量进行快速准确的预测,为三七整体性质量控制提供一种快速、简便、有效的检测方法。  相似文献   

7.
黑果腺肋花楸是继蓝莓后的又一小浆果,因其黄酮含量高于蓝莓受到关注,已获进入新资源食品名单,并在饮料行业中使用。黑果腺肋花楸黄酮、多糖是其果汁及果渣中的主要生物活性成分,也是影响其品质的重要因素。以中红外光谱技术结合化学计量学方法对黑果腺肋花楸黄酮、多糖含量进行预测,为建立简便、快捷的黑果腺肋花楸产品质量检测方法提供基础。采集15个产区共750份黑果腺肋花楸红外光谱数据,测量每份样品黄酮、多糖含量,采用K-S样本划分法按4∶1的比例将样本划分为校正集和验证集,并对分组后的光谱信息进行多元散射校正(MSC)、标准正态化(SNV)、平滑(SG)、一阶导数(FD)、二阶导数(SD)等光谱预处理,与原始光谱进行极限学习机(ELM)建模预测效果对比,确定最佳光谱预处理方法。采用竞争性自适应重加权算法(CARS)和连续投影算法(SPA)进行黑果腺肋花楸黄酮、多糖特征光谱波段选取,将2种方法选取的光谱数据结合偏最小二乘回归法(PLS)、极限学习机(ELM)、支持向量机(SVM)进行建模对比,选出预测效果最佳的算法模型。结果表明,7种光谱预处理方法中,MSC对原始光谱的处理效果最佳,在此处理下黄酮含量预...  相似文献   

8.
由于国内外食品市场准入制度和溯源体系不完善,销售商乱用虚假标签等现象的发生,使得食品安全形势愈发严峻。为了保障野生食用菌的安全性,保护云南高原特色农业品牌战略,亟需建立快速准确的产地溯源方法。通过采集云南及其周边8个产地、79个绒柄牛肝菌子实体的紫外-可见吸收光谱(UV-Vis)与傅里叶变换红外光谱(FTIR),采用多元散射校正(MSC)、标准正态变换(SNV)、二阶导数(2D)、平滑(SG)等算法对原始光谱进行预处理。基于低级与中级数据融合策略,将预处理后的UV-Vis与FTIR光谱信息进行融合,结合偏最小二乘判别分析(PLS-DA)与支持向量机(SVM),建立牛肝菌产地鉴别模型,确定最佳产地溯源方法。对光谱融合数据进行系统聚类分析(HCA),探讨不同产地样品整体化学信息的差异性与相关性。结果显示:(1)采用MSC+2D和SNV+2D对UV-Vis与FTIR光谱进行预处理,R2Y与Q2最大,分别为61.58%,95.09%和50.85%,82.16%,表明MSC+2D与SNV+2D为UV-Vis与FTIR光谱的最佳预处理方法;(2)基于UV-Vis,FTIR,低级与中级数据融合建立的PLS-DA与SVM模型,样品分类错误总数分别为24,6,2,2和6,1,1,0,表明数据融合模型分类效果优于单一UV-Vis与FTIR模型;(3)中级数据融合模型中,SVM对所有样品的分类全部正确,PLS-DA的分类错误总数为2,表明基于SVM的中级数据融合策略分类效果优于PLS-DA;(4)低级和中级数据融合HCA模型,分别有4和1个样品不能与同一类区域样品聚为一类,表明中级数据融合优于低级数据融合;由中级数据融合HCA图可知,同一产地样品聚类距离小于不同产地之间聚类距离,表明同一产地样品整体化学成分类较相似,且同一产地不同采集地点的差异小于不同产地之间的差异。采用UV-Vis与FTIR光谱中级数据融合策略结合SVM,能够对不同产地来源牛肝菌样品进行准确鉴别,为野生食用菌产地溯源研究提供一种新方法。  相似文献   

9.
以黑茶为研究对象,采集5种产地黑茶的红外光谱数据。通过降维,选最优红外光谱波段,再利用卷积平滑SG Smoothing、多元散射校正MSC、标准正态变量变换SNV、去趋势Detrending等4种方法预处理黑茶原始红外光谱,将预处理光谱数据及原始光谱结合黑茶产地建立偏最小二乘回归模型,分析4种不同预处理对建模的优劣;利用近红外光谱技术对黑茶原产地进行区分。研究结果表明:利用SNV预处理的光谱建模效果最优,其R_p~2最高为0.962 7,RMSEP最低为0.025 5。本研究可为区分黑茶的产地、保护黑茶品牌、强化品牌国家地理标志提供一定的参考。  相似文献   

10.
采用傅里叶变换红外光谱法(Fourier transform infrared spectroscopy,FTIR)、偏最小二乘判别分析(partial least square discriminant analysis,PLS-DA)和系统聚类分析(hierarchical cluster analysis,HCA)快速鉴别不同产地川东獐牙菜(Swertia davidi Franch)。采集4个不同地区70株样品不同部位的红外光谱数据,原始光谱数据经预处理(自动基线校正,自动平滑,一阶求导,二阶求导)后导入OMNIC 8.2,比较吸收峰的差异;用SIMCA-Pa+10.0进行偏最小二乘判别分析(PLS-DA),以前三个主成分三维得分图比较产地鉴别效果;红外光谱数据导入SPSS 19.0,进行系统聚类分析(HCA),通过树状图比较不同部位分类效果。结果显示,(1)不同产地根的光谱图在1 739,1 647,1 614,1 503,1 271,1 243,1 072cm~(-1)附近的吸收峰有差异,不同产地茎的光谱图在1 503,1 270,1 246cm~(-1)吸收峰附近有差异;(2)相同产地不同部位的光谱特征峰有差异;(3)PLS-DA分析结果显示自动基线校正+自动平滑+二阶求导这种预处理方式分类效果最好,根的红外光谱数据产地鉴别效果最佳;(4)HCA的树状图,显示根的聚类分析结果正确率83%,茎的聚类分析结果正确率49%,叶的聚类分析结果正确率70%。FTIR技术结合PLS-DA与HCA方法能够快速准确地鉴别不同产地川东獐牙菜,不同部位产地鉴别效果有差异,根的光谱数据产地鉴别效果最佳,二阶求导处理增强了样品的特异性,使PLS-DA的三维主成分得分图分类效果更明显。  相似文献   

11.
产地是影响中药材质量的重要因素,产地差异导致中药材质量参差不齐,为维护市场秩序,有必要建立中药材产地鉴别方法,以便更加精准地判别和分析中药材品质。以多产地临床大宗药材丹参为研究对象,收集不同产地丹参样品150份,采用显微聚焦拉曼光谱技术在无损条件下对每份丹参样品的每根药材表面随机扫描1~n次,求每份样品扫描1~n次的平均光谱。分析原始光谱数据发现丹参表面光谱信号同时包含了丹参酮类成分的拉曼光谱和杂质的荧光光谱,主要表现在特定波长范围内不同产地丹参存在各自的聚集区和丹参表面光谱信号强度明显弱于或强于丹参酮类对照品的拉曼光谱信号强度。对扫描1~n次的平均光谱数据进行预处理后运用偏最小二乘判别分析(PLS-DA)和随机森林分类算法[不筛选(RF)或筛选重要变量(RF-VS)]建立扫描1~n次的丹参产地分类模型。结果随机扫描1次所得最优模型训练集和测试集预测准确率分别为88%和87%,且对质量差和质量优的丹参样品区分准确率高达97%;随机扫描2次和3次所得最优模型训练集和测试集预测准确率均分别为89%和87%,结合模型运行效率和成本,选择随机扫描1次所得光谱,经一阶导数(1ST-D)预处理和RF-VS计算所得模型为丹参最终产地鉴别模型。综上,在无损伤条件下显微聚焦拉曼光谱技术能建立快速、准确的丹参产地鉴别预测模型,为该技术进一步用于贵细中药材的产地和真伪鉴别提供参考。  相似文献   

12.
PCA-BP模型在判别基于LIF技术煤矿突水水源的应用   总被引:1,自引:0,他引:1  
防治煤矿突水时需迅速精准地判别突水水源,激光诱导荧光(LIF)光谱技术具有灵敏度高、快速准确监测特点,为检测突水水源提供了一种新的方法。该研究引入该技术以获取突水荧光光谱数据。采用卷积(SG)平滑和多元散射校正(MSC)方法对光谱图进行预处理,以消除光谱采集过程中噪声干扰。采用主成分分析(PCA)方法提取特征信息,针对SG预处理后的数据,当主成分个数为3时,累积贡献率可达到99.76%,已基本保留原数据的全信息。选择3层结构BP神经网络建立分类判别模型,通过不同方式构造训练集和测试集,SG预处理数据构建的分类模型可以达到精准判别,而对于MSC预处理和原始数据出现很少的误判。实验结果表明SG预处理结果要优于MSC预处理。研究结果表明,将PCA和BP神经网络结合建立分类模型,能有效判别煤矿突水水源,且具有较强的自组织、自学习能力。  相似文献   

13.
市场上普遍存在“高蛋白”,“高乳脂”等特色牛奶。为了实现对特优优质奶、高蛋白特色奶、高乳脂特色奶和普通奶的无损快速分级,收集了河北省10个牧场不同月份(1月、3月—10月)的5 121份牛奶样本并采集中红外光谱数据,分别测定牛奶中的乳蛋白、乳脂和体细胞数,构建了牛奶品质分级模型。首先,分析牛奶光谱并去除冗余波段,最终选择925~1 597和1 712~3 024 cm-1的敏感波段组合作为全光谱用于建立模型。为了提高模型的性能,采用标准正态变量变换(SNV),多元散射校正(MSC),一阶导数,二阶导数,一阶差分和二阶差分6种算法对光谱进行预处理并建立朴素贝叶斯模型(NB)和随机森林模型(RF),确定二阶差分为最佳预处理方法,其测试集准确率分别为92.11%和96.87%。为了简化模型,利用无信息变量消除法(UVE)、竞争性自适应重加权算法(CARS)与稳定性竞争性自适应重加权采样算法(SCARS)以及UVE-CARS算法和UVE-SCARS算法对二阶差分后的光谱数据提取特征变量。然后,分别基于全光谱和所选特征变量数据,建立NB模型和RF模型。结果表明,SCARS算法为NB模型的最佳特征提取算法,模型的训练集准确率与测试集准确率分别为94.45%,93.94%;UVE-SCARS算法为RF模型的最佳特征提取算法,模型的训练集准确率与测试集准确率分别为99.86%,96.48%。综上,基于傅里叶变换中红外光谱技术建立的二阶差分-UVE-SCARS-RF模型,可以实现特优优质奶、高蛋白特色奶、高乳脂特色奶和普通奶的无损快速分级,通过建立中红外光谱模型,首次将乳蛋白、乳脂含量和体细胞数直接结合进行分级鉴定,这是以往未曾有过的。模型应用方便,只需将获得的牛奶红外光谱数据输入模型即可输出预测类别,在牛奶产业中具有实际应用价值。  相似文献   

14.
绒柄牛肝菌(Boletus tomentipes Earle)是一种健康食品,受广大消费者的青睐,其子实体营养物质积累量受生长环境(海拔、气候等)影响,不同产地间营养物质含量差异显著,为去劣存优,急需建立一种准确、快速、廉价的产地鉴别技术。采用数据融合策略结合随机森林算法(RF)对绒柄牛肝菌的产地进行鉴别,比较了多种特征值提取方法对RF模型分类效果的影响。扫描来自4个产地(北亚热带、北温带、南亚热带、中亚热带)87个样品不同部位的傅里叶变换近红外光谱和傅里叶变换中红外光谱,分析其光谱特征。通过Kennard-Stone算法将所有样品划分为2/3的训练集(58)和1/3的验证集(29),基于4种红外光谱(近红外的菌柄(N-b)、近红外的菌盖(N-g)、中红外的菌柄(M-b)、中红外的菌盖(M-g))与三种数据融合策略(低级融合、中级融合、高级融合)的数据,结合RF建立产地鉴别模型,比较了不同方法提取的特征值(投影重要性指标值、 Boruta、潜在变量)对模型分类效果的影响。其中,根据袋外错误率(oob)选择最优ntree和mtry;以特异性、灵敏度、训练集正确率和验证集正确率评价模型分类性能,综合多种评价指标,找出绒柄牛肝菌产地鉴别的最佳方法。结果表明:(1)近红外和中红外光谱均能反映不同产地绒柄牛肝菌间存在的细微差异。(2)单一光谱结合RF建立判别模型效果不理想。(3)三种融合策略均可提高绒柄牛肝菌的产地鉴定效果,产地鉴别效果优劣依次为高级融合、中级融合、低级融合。通过扫描绒柄牛肝菌近红外和中红外光谱,采用基于特征值LV的高级融合策略,结合RF建立不同产地绒柄牛肝菌鉴别模型,有高验证集正确率(99.6%),高灵敏度(0.969),高特异性(0.986),实现了绒柄牛肝菌产地的准确、快速、廉价鉴别,可以作为绒柄牛肝菌产地溯源的一种可靠方法。  相似文献   

15.
防治煤矿突水时需迅速精准地判别突水水源,激光诱导荧光(LIF)光谱技术具有灵敏度高、快速准确监测特点,为检测突水水源提供了一种新的方法。该研究引入该技术以获取突水荧光光谱数据。采用卷积(SG)平滑和多元散射校正(MSC)方法对光谱图进行预处理,以消除光谱采集过程中噪声干扰。采用主成分分析(PCA)方法提取特征信息,针对SG预处理后的数据,当主成分个数为3时,累积贡献率可达到99.76%,已基本保留原数据的全信息。选择3层结构BP神经网络建立分类判别模型,通过不同方式构造训练集和测试集,SG预处理数据构建的分类模型可以达到精准判别,而对于MSC预处理和原始数据出现很少的误判。实验结果表明SG预处理结果要优于MSC预处理。研究结果表明,将PCA和BP神经网络结合建立分类模型,能有效判别煤矿突水水源,且具有较强的自组织、自学习能力。  相似文献   

16.
不同产地对中药次生代谢产物有显著影响,产地鉴别有助于中药的科学合理利用;其次,有效成分含量检测是评价中药质量的主要手段。通过傅里叶变换红外光谱结合化学计量学建立快速鉴别三七产地及测定三七中四种主要皂苷的方法,为三七的科学、合理、规范使用以及对三七质量进行快速评价提供依据。采集5个区域12个产地117个三七样本的红外光谱。产地鉴别预处理数据采用离散小波变换除去噪音造成的部分高频信号,偏最小二乘判别对产地判别贡献率大于1的数据进行筛选,kennard-stone算法将117个个体分为70%训练集与30%预测集。训练集数据用于建立支持向量机判别模型,交叉验证法用于筛选支持向量机最优参数,预测集数据对支持向量机判别模型结果进行验证。皂苷含量预测预处理数据采用标准正态变量变换、离散小波变换处理;处理的红外数据设为X变量,三七样品中通过高效液相色谱法测得的四种皂苷总量设为Y变量,采用正交信号校正去除红外光谱中与四种皂苷总量无关的干扰数据。个体数据分为80%训练集与20%预测集,训练集建立偏最小二乘回归模型,预测集数据对偏最小二乘回归模型的预测结果进行验证。结果显示: (1)交叉验证法得到支持向量机判别模型的最优参数为c=2.828 43,g=0.062 5,训练集的产地判别最优正确率为91.463 4%;(2)支持向量机判别模型参数设置为最优参数,代入预测集数据,预测集的产地判别正确率为94.285 7%,判别正确率较高;(3)训练集建立偏最小二乘回归模型的相关系数R2=0.941 8,校正均方差RMSEE=4.530 7;(4)代入预测集数据,预测集的相关系数R2=0.962 3,外部检验均方差RMSEP=3.855 9,皂苷预测值与高效液相检测值接近,预测效果良好。傅里叶变换红外光谱结合支持向量机能对三七进行产地鉴别,正交信号校正结合偏最小二乘回归能对三七中四种主要皂苷总量进行准确预测,为三七质量控制提供一种快速简便、无损、高灵敏度的检测方法。  相似文献   

17.
近年来食品安全问题频发,消费者愈加重视食品原产地的环境安全,导致地理标志产品的需求增加。美味牛肝菌(Boletus edulis)作为一种健康食品,其产品品质受原产地环境影响较大,为保护消费者的身体健康,防止假冒伪劣产品进入市场,急需一种高效、廉价的美味牛肝菌产地鉴别技术。采用数据融合策略结合偏最小二乘判别(PLS-DA)模型对美味牛肝菌的产地进行鉴别。扫描来自8个产地(昆明、楚雄、玉溪、迪庆、大理、保山、文山和曲靖)141个样品的傅里叶变换近红外光谱和傅里叶变换中红外光谱。使用Kennard-Stone算法将所有样品划分为2/3的训练集和1/3的预测集,利用三种融合策略(低级、中级和高级)对4个单一光谱矩阵:近红外的菌柄(N-b)、近红外的菌盖(N-g)、中红外的菌柄(M-b)、中红外的菌盖(M-g),建立偏最小二乘判别(PLS-DA)模型。用交叉验证均方根误差(RMSECV)和预测均方根误差(RMSEP)评价模型稳定性,非错误率(NER)、训练集正确率和预测集正确率评价模型分类性能,综合多种评价指标,找出美味牛肝菌产地鉴别的最佳方法。结果表明:(1)近红外和中红外光谱均能鉴别美味牛肝菌产地;(2)中红外光谱所建立的模型优于近红外光谱所建立的模型;(3)三种融合策略均可提高美味牛肝菌的产地鉴别效果,产地鉴别效果优劣依次为中级融合、高级融合、低级融合、单一光谱模型。通过融合近红外和中红外光谱使用PLS-DA进行基于特征值LV的中级融合策略,建立不同产地美味牛肝菌鉴别模型,有最少的变量数(49),最高的产地训练集正确率(100%),最高的产地预测集正确率(100%),最低的RMSEP(0.133),实现了美味牛肝菌产地的快速、准确鉴别,可以作为美味牛肝菌产地溯源的一种可靠方法。  相似文献   

18.
为提高利用红外光谱数据鉴别中药材产地的预测模型效果,应该选用合适的数据预处理方法和合适的算法。针对具有3 448个特征(波长551~3 998 nm)的658条红外光谱中药材数据,借助于支持向量机(SVM)算法,研究了10种基于样本预处理方法(不做预处理、最大最小归一化、标准化、中心化、移动平均平滑、 SG平滑滤波、多元散射校正、正则化、一阶导数和二阶导数法)与5种基于特征波长预处理方法(不做预处理、中心化、最大最小归一化、标准化和正则化)的组合(共50种)对产地模型预测精度和稳定性的影响。结果表明:合适的数据预处理对提高模型精度是必要的;标准化和最大最小正则化方法光谱的预处理建模效果较好,其预测系数值约85%;基于特征的预处理对模型预测效果改进小。只做光谱预处理或基于特征预处理的预测稳定性值近似相等(两类方式的决定系数平均值都近64%);基于样本+特征的组合预处理方法中,二阶导数+标准化处理和二阶导数+正则化组合处理方法的模型预测效果好,其决定系数R2达到近94%;而中心化+正则化组合处理达不到直接采用原始数据(不做数据预处理)的建模效果,该方法预测效果最差。该...  相似文献   

19.
高光谱成像技术被广泛应用于农产品的检测。基于高光谱成像技术结合机器学习算法无损鉴别不同地区的小米样本。将来源7个省份共计23份样品的小米样本根据地理区域划分为东北地区、河北、陕西、山东和山西共5大类,其中东北地区共6份样品,山西地区5份样品,河北、陕西和山东各4份样品。将每份样品均分为10等份并利用高光谱成像仪采集900~1 700 nm波段内小米的高光谱数据。为了减少光照不均匀和暗电流对实验的影响,对采集到的高光谱数据进行黑白校正。利用ENVI软件选取小米高光谱图像的感兴趣区域(ROI),每份小米样品选取9个ROI。计算ROI内的平均光谱值,以此平均值作为该样本的一条光谱记录,最后共收集到2 070条光谱曲线,其中东北类540条,山西类450条,其他河北类、山东类、陕西类各360条。为了减少样品表面的不平整性引起的散射现象,进而影响小米的真实光谱信息,对收集到的原始光谱进行多元散射校正预处理(MSC)。采用随机划分法对校正过后的光谱数据划分训练集和测试集,测试集占的比例为0.3。利用线性判别分析(LDA)对不同产地小米的光谱数据进行可视化分析,将测试集代入训练好的LDA模型,做出预测结果的混淆矩阵(Confusion Matrix),结果表明LDA对于陕西和山西类的预测准确率为0.84和0.99,对于东北、河北和山东的预测准确率仅为0.68,0.68和0.40。进而采用递归特征消除(RFE)对小米的光谱信息进行特征选择,去除冗余的信息,提高模型的预测准确率。将RFE分别与支持向量机(SVM)和逻辑回归(LR)结合,对不同产地小米的判别进行对比分析。将小米光谱数据的训练集分别代入SVM-RFE和LR-RFE模型并结合3折交叉验证技术,以模型F值的微平均(Micro-averaging)最优选择出相应的特征子集。结果表明,LR-RFE选择的波长数为74个,其模型的Micro_F为0.59;SVM-RFE选择的波长数为220,其模型的Micro_F为0.66。将选择后的特征子集应用到测试集并将测试集分别代入SVM和LR模型,采用模型预测结果的混淆矩阵和模型的受试者工作特征曲线(ROC)作为评价方法。结果表明SVM-RFE对东北地区、河北、陕西、山东和山西的预测准确率分别为1,0.37,0.72,0和1,其ROC曲线下面积(AUC)分别为0.82,0.92,0.93,0.70和0.99。LR-RFE的预测准确率分别为0.92,0,0.97,0和0.80,其AUC分别为0.72,0.74,0.94,0.66和0.88。从预测结果可以看出SVM-RFE模型的综合分类性能优于LR-RFE,而对陕西类的判别LR-RFE要优于SVM-RFE,对于河北类和山东类两个模型都不能有效判别。这两个模型的预测准确率相比LDA有了一定的提升。  相似文献   

20.
采收是中药生产的重要环节,采收时间直接影响中药质量和产量,是中医临床安全有效用药的前提,开展中药适时采收期的研究具有重要意义和应用价值。采用傅里叶变换红外光谱法对72份不同采收期的滇龙胆进行鉴别研究,用TQ8.0软件对原始光谱进行一阶导数(first derivative,FD)、二阶导数(second derivative,SD)、标准正态变量(standard normal variate,SNV)、多元散射校正(multiplicative scatter correction,MSC)和平滑(savitaky-golay filter,SG)预处理,样品按3∶1分为校正集和预测集,同时建立主成分分析(principal component analysis,PCA)和偏最小二乘判别分析(partial least square discriminant analysis,PLS-DA)模型。结果显示,选取1 800~600cm~(-1)波段范围的光谱,去除光谱噪音;SNV结合二阶导数光谱和SG(15,3)平滑,预处理结果满意。主成分分析表明,前三个主成分方差贡献率为92.47%,5月、9月和10月份采收的样品差异较小。偏最小二乘判别分析建立判别模型,决定系数R2和校正均方根误差(RMSEE)分别为0.967 8和0.086 0,可对18个预测集样品进行准确分类。红外光谱法结合主成分分析、偏最小二乘判别分析对不同采收期滇龙胆的分类和判别效果较好,为不同采收期的中药鉴别提供理论依据。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号