首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 125 毫秒
1.
棉花精量播种技术目前已经在新疆兵团全面推广,该技术能精确实现一穴一粒的农艺技术指标,但是也对高质量棉种的筛选提出了更高的要求。为了避免播种往年活力不足的棉种而导致发芽率降低的问题,结合机器学习和近红外(NIR)高光谱成像技术(HSI)进行棉种年份精确鉴别,实现棉种的快速无损筛选。采集2016年—2019年近四年外观无明显差异的棉种各360粒,共1 440粒棉种(按照3∶1∶1划分训练集、验证集和测试集)作为样本,按照每批60粒采集915~1 698 nm范围的棉种高光谱图像,去除首尾两端噪声大的光谱,保留1 002~1 602 nm范围的光谱为原始数据。利用Savitzky-Golay(SG)平滑算法对光谱进行预处理,采用主成分载荷方法(PCA-loading)选取13个特征波段,基于全部光谱数据和特征波段(±10 nm)数据建立逻辑回归(LR)、偏最小二乘判别分析(PLS-DA)、支持向量机(SVM)、循环神经网络(RNN)、长短记忆网络(LSTM)和卷积神经网络(CNN)六种分类模型。使用全光谱数据建模时,六种分类模型在测试集上的鉴别准确率分别为96.27%,98.98%,99.32%,96.95%,97.63%和100%,其中CNN和SVM模型取得了较好的结果;使用特征光谱数据建模时,六种分类模型在测试集上的鉴别精度分别为93.56%,97.29%,98.30%,95.25%,94.24%和99.66%,其中CNN和SVM模型仍有较好的分类结果。结果表明,使用全光谱数据建模时,六种分类模型都可以实现较高精度的棉种年份鉴别,使用特征光谱数据建模时CNN和SVM模型的鉴别精度仍可达到98%;其中深度学习方法优于传统机器学习方法,但是传统机器学习方法仍能保持较好的鉴别准确率。因此,结合近红外高光谱成像技术和机器学习方法能够实现棉种年份的高精度鉴别,为棉花精量播种过程中的优质棉种选种技术提供理论依据和方法。  相似文献   

2.
针对哈密瓜表面农药残留化学检测方法成本高且具有破坏性等问题,探索了可见-近红外(Vis-NIR)光谱技术对农药残留定性判别的可行性。以哈密瓜为载体,百菌清和吡虫啉农药为研究对象,采集哈密瓜表面无残留、百菌清和吡虫啉残留的可见-近红外漫反射光谱,利用格拉姆角场(GAF)将一维光谱数据转换为二维彩色图像,构建GAF图像数据集。设计一种包含Inception结构的多尺度卷积神经网络模型用于哈密瓜表面农药残留种类判别,包括1层输入层、3层卷积层、1层融合层、1层平坦层、2层全连接层和1层输出层。模型测试混淆矩阵结果表明,格拉姆角差场(GADF)变换对哈密瓜表面农药残留的可见-近红外光谱表达能力较强。此外,构建AlexNet、VGG-16卷积神经网络(CNN)模型和支持向量机(SVM)、极限学习机(ELM)机器学习模型与提出的多尺度CNN模型进行性能对比。结果表明,3种CNN模型对哈密瓜表面有无农药残留的判别效果较好,综合判别准确率均高于SVM和ELM模型。对比3种CNN模型性能,多尺度CNN模型的性能最佳,训练耗时为14 s,综合判别准确率为98.33%。多尺度CNN模型结构利用多种小尺寸滤波器组合(1×1,3×3和5×5)和并行卷积模块,能够捕获不同层次和尺度的特征,通过级联融合模式进行深度特征融合,提高了模型的特征提取能力。与传统深度CNN模型相比,在保证计算复杂度不变的情况下,多尺度CNN模型的精度得到了有效提高。实验结果表明,GADF变换结合多尺度CNN模型可以有效进行光谱数据解析,利用可见-近红外光谱技术可以实现哈密瓜表面农药残留的定性判别。研究结果为大型瓜果表面农药残留的快速无损检测技术的研发提供了理论参考。  相似文献   

3.
利用近红外光谱技术对354个废旧涤/棉混纺织物进行研究,通过偏最小二乘法(partial least squares,PLS)和定性鉴别系数建立了不同光谱特征的涤/棉混纺织物近红外定性分析模型。染色涤/棉混纺织物NIR光谱主要有两大类,一类具有正常涤/棉光谱特征,另一类光谱由于样本中染料、颜料和消光剂等化学助剂的影响,使光谱谱线成斜线,失去其光谱特征。如以全部样本建模,模型识别率较低。故将样本分为两类:斜线光谱样本和正常光谱样本,分别建立NIR定性分析模型。NIR定性分析模型建立后,根据验证结果分别对建模的谱区、预处理方法和主因子数进行优化,以提高模型的稳健性和可靠性。结果表明,样本分别建模后,模型的识别率大大提高,用验证集样本进行内部验证,正常光谱和斜线光谱所建模型的识别率均达99%,其校正集相关系数RC均为0.991,验证集相关系数RP分别为0.983和0.984、校正标准差SEC分别为0.887和0.453、预测标准差SEP分别为1.131和0.573。用150个界外样本分别对正常光谱样本模型和斜线光谱样本模型进行外部预测检验,模型识别率分别达91.33%和88.00%,表明所建NIR定性分析模型能够较好地在回收现场进行涤/棉混纺织物的鉴别。  相似文献   

4.
利用近红外光谱技术对354个废旧涤/棉混纺织物进行研究,通过偏最小二乘法(partial least squares ,PLS )和定性鉴别系数建立了不同光谱特征的涤/棉混纺织物近红外定性分析模型。染色涤/棉混纺织物N IR光谱主要有两大类,一类具有正常涤/棉光谱特征,另一类光谱由于样本中染料、颜料和消光剂等化学助剂的影响,使光谱谱线成斜线,失去其光谱特征。如以全部样本建模,模型识别率较低。故将样本分为两类:斜线光谱样本和正常光谱样本,分别建立NIR定性分析模型。NIR定性分析模型建立后,根据验证结果分别对建模的谱区、预处理方法和主因子数进行优化,以提高模型的稳健性和可靠性。结果表明,样本分别建模后,模型的识别率大大提高,用验证集样本进行内部验证,正常光谱和斜线光谱所建模型的识别率均达99%,其校正集相关系数 RC 均为0.991,验证集相关系数 RP 分别为0.983和0.984、校正标准差S EC分别为0.887和0.453、预测标准差SEP分别为1.131和0.573。用150个界外样本分别对正常光谱样本模型和斜线光谱样本模型进行外部预测检验,模型识别率分别达91.33%和88.00%,表明所建NIR定性分析模型能够较好地在回收现场进行涤/棉混纺织物的鉴别。  相似文献   

5.
基于优选NIR光谱波数的绿豆产地无损检测方法   总被引:1,自引:0,他引:1  
产地是影响农作物生产的重要环境因素,产地溯源对于食品安全具有重要意义。针对传统农产品产地检测一般采用化学分析法,其操作繁琐且存在破坏性和耗时较长等不足的问题,以北方寒地绿豆为研究对象,分别在白城、杜蒙、泰来等优质绿豆主产区,获取绿豆的籽粒和粉末两种状态的近红外光谱数据(NIR),利用优选NIR光谱特征波数,建立了绿豆产地无损检测的新方法。首先在吸光度值较强的10 105.37~4 078.655 cm-1波数范围内,采用多元散射校正法(MSC),对不同产地的绿豆原始光谱数据进行预处理,以消除光谱干扰信息。应用竞争性自适应重加权采样算法(CARS),优选不同产地绿豆籽粒和粉末状态的光谱特征波数,以减少光谱曲线的特征向量维度。最后利用前馈神经网络(BP)自适应推理机制,建立了绿豆产地与其光谱特征波数之间非线性映射模型,并将网络输出的编码向量解析至产地名称,作为绿豆产地检测的输出结果。研究结果表明:(1)原始光谱经过多元散射校正预处理后,绿豆粉末光谱曲线的误差从12.87降到3.20,绿豆籽粒光谱曲线的误差从153.04降到27.73,提供有效可靠的光谱数据。(2)通过竞争性自适应重加权采样算法,提取绿豆光谱曲线的重要特征波数,从籽粒和粉末状态原始2 114个波数中,分别优化为61个和107个特征波数,波段总数目减少了94.94%以上,并将其作为绿豆产地识别的特征指标。(3)创新性提出了MSC-CARS-BP绿豆产地检测模型,以优选出的光谱特征波数为定量依据,分别对绿豆籽粒和粉末进行产地检测,预测集准确率为92.59%和98.63%,相关系数均达到0.99以上。该方法能够利用近红外光谱处理技术,实现绿豆产地无损检测的目标,为农产品产地自动快速溯源提供了技术支持和参考。  相似文献   

6.
产地是影响中药材质量的重要因素,产地差异导致中药材质量参差不齐,为维护市场秩序,有必要建立中药材产地鉴别方法,以便更加精准地判别和分析中药材品质。以多产地临床大宗药材丹参为研究对象,收集不同产地丹参样品150份,采用显微聚焦拉曼光谱技术在无损条件下对每份丹参样品的每根药材表面随机扫描1~n次,求每份样品扫描1~n次的平均光谱。分析原始光谱数据发现丹参表面光谱信号同时包含了丹参酮类成分的拉曼光谱和杂质的荧光光谱,主要表现在特定波长范围内不同产地丹参存在各自的聚集区和丹参表面光谱信号强度明显弱于或强于丹参酮类对照品的拉曼光谱信号强度。对扫描1~n次的平均光谱数据进行预处理后运用偏最小二乘判别分析(PLS-DA)和随机森林分类算法[不筛选(RF)或筛选重要变量(RF-VS)]建立扫描1~n次的丹参产地分类模型。结果随机扫描1次所得最优模型训练集和测试集预测准确率分别为88%和87%,且对质量差和质量优的丹参样品区分准确率高达97%;随机扫描2次和3次所得最优模型训练集和测试集预测准确率均分别为89%和87%,结合模型运行效率和成本,选择随机扫描1次所得光谱,经一阶导数(1ST-D)预处理和RF-VS计算所得模型为丹参最终产地鉴别模型。综上,在无损伤条件下显微聚焦拉曼光谱技术能建立快速、准确的丹参产地鉴别预测模型,为该技术进一步用于贵细中药材的产地和真伪鉴别提供参考。  相似文献   

7.
为了提高基于近红外光谱的土地覆盖分类模型的准确率,以欧盟统计局发布的土壤近红外光谱数据为研究对象,研究基于短时傅里叶变换(STFT)预处理方法和不同卷积尺度融合的土地覆盖分类模型,实现耕地、林地和草地的快速区分。为适应二维卷积要求,将一维光谱的400~2 500 nm波段的4 200个波长进行短时傅里叶变换,转换成二维图像同时提取光谱数据的频谱信息。将样本按6∶2∶2的比例随机划分为训练集、验证集和测试集。建立单一尺寸卷积核卷积神经网络(CNN)以及多尺寸卷积核融合的卷积神经网络土地覆盖分类模型,为了防止模型出现梯度消失现象,网络采用ReLU激活函数以及批标准化(BN)、 Dropout等方法。并采用早停法(early stopping)训练网络,防止模型出现过拟合风险。首先,探讨了不同STFT窗口长度(64, 100和128)、不同卷积核尺寸(3×3, 5×5和7×7)等对模型分类效果的影响规律。实验结果显示:当STFT窗口长度为100、窗口重叠长度为50%时,模型总体分类准确率均最高;模型的分类准确率随卷积核尺寸的增大而降低,较小尺寸卷积核模型准确率更高,卷积核尺寸为3×3的CNN...  相似文献   

8.
旨在探索感染不同等级赤霉病的小麦中主要成分含量变化引起的傅里叶中红外光谱信息响应,并结合模式识别方法实现基于傅里叶变换中红外光谱的小麦赤霉病等级无损检测。以感染不同等级赤霉病小麦为研究对象,在4 000~400 cm-1波数范围内采集95个小麦样本的傅里叶中红外光谱数据,利用载荷系数法(XLW)与随机森林算法(RF)分析选取小麦样本傅里叶中红外光谱中的敏感波长,利用稀疏表示分类(SRC)算法建模识别小麦感染赤霉病等级。结果表明:XLW算法和RF算法选择的特征波长作为定性分析模型的输入时模型鉴别准确率与全波段光谱数据作输入时均达90%以上,特征波长提取算法可以有效简化模型并提高效率。RF-SRC模型鉴别效果最好,建模集鉴别准确率达97%,测试集鉴别准确率达96%。小麦感染赤霉病等级的不同会引起小麦中水分、淀粉、纤维素、可溶性氮素、蛋白质、脂肪等物质含量的变化,采用RF算法选择的特征波长均反映了这些物质所对应的傅里叶中红外光谱透射光谱特征的差异,结合SRC模型进行小麦赤霉病等级鉴别可达到最好的鉴别效果。因此,利用傅里叶中红外光谱技术结合模式识别方法对小麦赤霉病等级鉴别是可行的,解释了傅里叶中红外光谱技术检测小麦赤霉病等级的机理。  相似文献   

9.
胚蛋雌雄识别一直是家禽业发展的瓶颈问题,在禽肉生产过程中倾向于养殖雄性个体,而禽蛋生产产业倾向于养殖雌性家禽。若能在孵化过程中较早鉴别出种蛋的雌雄,不仅能够降低家禽孵化产业的成本,还能够提高禽蛋和禽肉生产行业的经济效益。该文以种鸭蛋为研究对象,为了在种鸭蛋孵化早期实现对种蛋的雌雄识别,构建了可见/近红外透射光谱信息采集系统,在200~1 100 nm的波长范围内采集了345枚孵化了0~8 d的种鸭蛋光谱数据。搭建了适用于种鸭蛋光谱信息的6层卷积神经网络(convolutional neural network, CNN),其中包括输入层、3个卷积层、全连接层与输出分类层。卷积层可以提取光谱中的有效信息,全连接层通过对卷积层提取的局部特征进行整合供输出层分类决策。另外在卷积神经网络中引入局部响应归一化和dropout操作能够加快网络的收敛速度。利用该卷积神经网络构建鸭胚雌雄信息识别网络,通过对比与分析不同孵化天数的识别效果,发现孵化7d的识别效果最佳。随后将孵化7 d的种鸭蛋原始光谱数据进行噪声去除,选取500~900 nm波段用于后续的特征波长选取和建模。分别运用了竞争性自适应重加权算法(CARS)、连续投影算法( SPA)与遗传算法(GA)选择能够区分鸭胚性别的波长点,将选取的特征波长转换为二维的光谱信息矩阵,二维光谱信息矩阵保留了一维光谱的有效信息,同时极大地方便了与卷积神经网络的结合。利用二维光谱信息矩阵和卷积神经网络相结合,实现孵化早期阶段鸭胚的雌雄识别。经检验,基于 SPA算法和CNN网络建立的模型效果较佳,其中训练集、开发集及测试集的准确率分别为93.36%,93.12%和93.83%;基于GA算法和CNN网络建立的模型效果次之,训练集、开发集及测试集的准确率分别为90.87%,93.12%和86.42%;基于CARS算法和CNN网络建立的模型的训练集、开发集及测试集的准确率分别为84.65%,83.75%和77.78%。研究结果表明基于可见/近红外光谱技术和卷积神经网络可以实现孵化早期鸭胚胎雌雄的无损鉴别,为后续相关自动化检测装置的研发提供了技术支撑。  相似文献   

10.
拉曼光谱检测方法依赖于化学计量学算法,深度学习是当下最炙手可热的方向,可应用于拉曼光谱进行建模。但是深度学习需要大样本进行训练,而拉曼光谱采集受制于器材和人力成本,获取大批量的样本需要更大成本,且易受荧光等因素干扰,这些问题都制约了将深度学习应用于拉曼光谱。针对以上问题,通过引入深度卷积生成对抗网络(DCGAN)提取拉曼光谱内部特征,对抗生成新的拉曼光谱,从而达到扩充数据集目的。同时和另一个扩充数据集的方法--偏移法进行对比,证明DCGAN的可靠性。设计生成光谱选取标准,选取高相似性的光谱填充数据集,为深度学习在拉曼光谱中的应用奠定基础。为了验证生成的光谱比原始光谱有更好的适用性,设计四组实验:(1)使用原始拉曼光谱输入到SVM进行分类,得到51.92%的分类准确率;(2)使用原始拉曼光谱输入到CNN进行分类,得到75.00%的分类准确率;(3)采用偏移法生成光谱,输入到CNN里进行分类,得到91.85%的分类准确率;(4)使用DCGAN生成光谱,输入到CNN里进行分类,得到98.52%分类准确率。实验结果表明,DCGAN能在只有少量拉曼光谱的情况下,通过对抗学习得到较好的生成光谱,且生成的光谱相比原光谱更加清晰,减少了可能的干扰因素,具有光谱预处理效果。通过DCGAN对抗生成大量高质量的数据填充到原有拉曼光谱数据集,扩充数据集的样本量,使得深度学习模型能够得到更好的训练,从而提高模型的准确率。该研究为深度学习方法应用于拉曼光谱分析技术提出了一个可行的方案。  相似文献   

11.
可靠的原产地认证方法对于保护指定产地的高价值中药材(例如道地药材、地理标志产品等)至关重要。附子作为著名的传统中药和川产道地药材,疗效显著,临床应用广泛,在国内外市场需求量很大。不同产地的附子疗效和价格有所不同,大众很难通过传统经验进行准确鉴别,基于植物代谢组学模式下的质谱检测技术,测试样本制备过程繁琐冗长、操作复杂、检测时间长,且重现性偏低。近红外光谱作为一种成熟、快速、无损的检测技术,被机器学习集成后为中药材在线质量监管和控制带来新途径。基于近红外光谱技术结合随机森林算法建立了一种不同产地附子无损鉴别模型。在四川、陕西和云南等主要栽培区域共采集了255份附子样本,采用傅里叶变换近红外光谱获得所有样本的漫反射光谱信息。采用单一和组合光谱预处理方式以消除光谱中的多种干扰,并筛选出最佳预处理方式,以此为输入指标建立随机森林模型。采用灵敏度、特异度和平衡精度等指标评价了模型的综合性能。结果表明:Savitzky-Golay平滑+多元散射校正为最佳预处理方式;仅采用全波长数据,RF模型对3组省级的样本的预测准确率超过了90%,预处理后预测准确率达98.39%;对于市/县一级样本,RF模型同样具有优秀的判别能力,准确率大于75%。模型对道地产区周边栽培区域的样本,识别率达100%。过滤出前100个特征波数,重新优化模型,模型对各市/县级区域的识别精度超过85%,尤其是对一些产自高原样本的识别能力得到了明显提升。研究中采用了环境友好型溯源策略,分析速度更快,样品损失更少,精度更高,为不同产地附子快速、高效的鉴别提供了新模式,为后续附子及其相关炮制品的鉴别和溯源提供了参考。  相似文献   

12.
采用基于线性渐变滤光片分光原理的微型近红外光谱仪对2012年和2013年的西湖龙井和普通扁形茶建立真伪识别模型。分别对不同年份、不同保存期样品的近红外光谱数据进行PCA分解,并根据PCA得分分布的数学特征选取代表性样品,建立PLS-DA模型,从数学原理的角度对模型不适应性的原因加以分析,并对其进行修正,结合外部盲样的验证,有效地增强了模型适应性。研究结果表明,针对西湖龙井和普通扁形茶,采用不同年份样品近红外光谱数据共同建模可有效提高模型对不同年份样品的识别正确率;采用不同保存期样品近红外光谱数据建模结果表明,普通扁形茶在冷冻保存3个月后,理化性质发生了较大的变异,而西湖龙井的理化性质相对较为稳定。从光谱数据主成分特征的数学原理角度对不同年份以及不同保存期模型的适应性进行了研究,建立并验证了适合西湖龙井真伪识别的模型,有效提高了模型的预测准确度。不仅可为近红外光谱应用于农产品质量安全与品质分级方面提供一定的参考,而且对提高农产品近红外分级模型的预测准确度亦具有参考价值。  相似文献   

13.
由于红外光谱数据采集受仪器状态和实验环境的制约,影响对样品的正确识别。基于傅里叶变换红外光谱(FTIR)技术,用多种方法对两面针的红外光谱数据进行校正后,利用SIMCA法建立鉴别模型;分别对广西区内四个产地的两面针进行鉴别,通过比较分析以获得最适合建立两面针产地鉴别模型的光谱数据校正方法。结果显示,经多元散射校正和标准正态变换后,它们的PCA数据分布,以及产地分类模型之间的距离,都表明这两种校正方法在消除环境和人为因素的干扰的同时,能够很好的分离各个产地的样本,在对实际的样本识别中,其识别率和拒绝率均达到或接近100%。可见,多元散射校正和标准正态变换,均是两面针产地模型鉴别研究的理想校正方法。  相似文献   

14.
基于卷积神经网络与光谱特征的夏威夷果品质鉴定研究   总被引:1,自引:0,他引:1  
夏威夷果含油量高,在开缝之后容易发生变质,现有关于夏威夷果品质鉴定的方法多为传统的破坏性检验,很难满足无损检测的需求。卷积神经网络(CNN)作为应用最广泛的深度学习网络模型之一,具有比浅层学习方法更强的特征提取与模型表达能力,在光谱数据方面的应用拥有很大潜力。基于夏威夷果在可见-近红外的光谱特征分析,研究用于提取夏威夷果光谱特征的卷积神经网络模型,并提出一种高效无损鉴定夏威夷果品质的方法。首先以三种不同品质的夏威夷果(好籽、哈籽及霉籽)为研究对象,分析样本在500~2 100 nm的光谱信息;在光谱数据预处理中引入白化处理方法,用以增强数据的相关性差异;然后在模型训练过程中,将样本随机分为训练集和预测集,探讨不同CNN结构、卷积层数、卷积核大小及个数、池化层类型、全连接层神经元个数以及激活函数对分类结果的影响,并采用激活函数ReLU和Dropout方法,预防样本数据过少引起的过拟合现象;最后通过分析模型分类准确率和计算效率,确定了一个6层结构的CNN模型: 输入层-卷积层-池化层-全连接层(200神经元)-全连接层(100神经元)-输出层。实验结果表明: 上述网络模型对校正集和预测集的分类准确率均达到100%。因此,改进后的卷积神经网络模型可充分学习夏威夷果的光谱特征并有效分类,将深度学习理论与光谱分析相结合的方法能够实现对夏威夷果品质的准确鉴定,同时为夏威夷果等坚果类食品的高效、无损、实时在线检测提供了新思路。  相似文献   

15.
提出一种将循环伏安电化学法和近红外光谱法联立,用PLS-DA的D-S证据理论融合二者信息进行葡萄酒品种溯源研究的方法。分别采集来自不同产区的三类不同品种的171个干红葡萄酒样品的循环伏安曲线和近红外透射光谱。用PLS-DA法分别建立循环伏安电化学法和近红外光谱法的判别模型,以此为证据;用两个证据的D-S合成规则实现近红外判别结果与循环伏安法判别结果的重新决策。融合后的结果为:多产区不同品种葡萄酒溯源模型的建模集准确率为95.69%,检验集准确率为94.12%;单一产区不同品种葡萄酒溯源模型的建模集准确率为99.46%,检验集准确率为100%;判别结果都比融合前单一循环伏安电化学法和近红外光谱法的判别准确率得到了提高。实验结果表明, 该方法具有较高的溯源识别准确度, 可以快速准确地对待测葡萄酒品种进行定性检测。  相似文献   

16.
近红外漫反射光谱法和模式识别技术鉴别中药材产地   总被引:27,自引:8,他引:19  
采用近红外漫反射光谱法获得了来自不同产地的中药材的红外光谱,结合近邻法和多类支持向量机等模式识别技术,对来自四个不同产地的269个白芷样本和六个不同产地的350个野生和栽培丹参样本进行了产域鉴别,得到的交叉验证准确率分别达到99%和95%,为中药材产地的快速无损鉴别探索了一条有效的途径。  相似文献   

17.
近红外光谱技术是一种通过分析样本的特征光谱数据,实现定性或定量分析的无损检测方法,特征数据的完整性和代表性决定了所建模型的性能,而现有分析方法只能实现光谱子区间特征筛选,导致分析模型稳定性差、且难以再优化。为实现近红外光谱区间高维数特征提取,有效提高近红外光谱定性分析模型的精度和稳定性,提出一种基于最小绝对收缩和选择算法(LASSO)的光谱特征筛选方法,并以我国特色高值外贸产品云南松茸为分析对象进行聚类应用研究,讨论了该方法对于高维光谱特征筛选的有效性、分析对比了LASSO筛选特征变量及主元分析(PCA)降维算法所建松茸真伪甄别及食用菌分类模型的预测精度及稳定性。通过调研发现,云南产鲜松茸因其独特外形易于分辨,而片状的干松茸失去其独有的外形特征,导致国内干松茸掺假事件屡禁不止。选取云南产松茸、杏鲍菇、老人头、姬松茸四种干样共166样本数据进行分析,采用光谱范围为900~1 700 nm的NIRQuest512型近红外光谱仪获得166×512维原始光谱数据,剔除异常数据后采用标准正态变换对光谱数据进行预处理。在此基础上,利用LASSO筛选出全光谱区间的特征变量,再使用Kennard-Stone法并结合典型线性(KNN)和非线性建模(BP)算法,构建松茸真伪甄别模型和食用菌分类模型,对两种模型进行盲样测试,并分析了LASSO与PCA算法的不同点,最后使用蒙特卡罗方法检测两种模型的稳定性。实验结果表明基于LASSO光谱特征选择的松茸真伪甄别模型和食用菌分类模型预测精度和稳定性均高于PCA方法,其中基于原始光谱数据所建真伪甄别模型的预测准确率为69.57% (BP)和60.87% (KNN),食用菌分类模型准确率为67.39% (BP)和65.22% (KNN),基于LASSO特征筛选的真伪甄别模型预测准确率分别达到100% (BP)和78.26% (KNN),食用菌分类模型预测准确率分别达到89.13% (BP)和80.43% (KNN),对两种模型进行10次蒙特卡罗实验,其结果平均值分别为99.93%和97.22%,由此可知,与PCA等数据降维算法相比,LASSO可实现全光谱区间的光谱特征选择和数据降维,有效地提高了近红外定性分析模型的预测性能,为近红外分析提供了一种新的特征筛选方法。  相似文献   

18.
基于FTIR指纹光谱的牛肉产地溯源技术研究   总被引:13,自引:0,他引:13  
在中国牛肉4个产区吉林省榆树市、贵州省安顺市、宁夏自治区同心县、河北省张北县屠宰场采集了58个肉牛牛肉样品,进行脱脂、干燥、粉碎。利用近红外光谱分析技术,对牛肉样品的近红外光谱进行主成分分析、聚类分析、判别分析,建立了判别牛肉产地来源的傅里叶变换红外光谱定性分析模型。分析结果显示4个产区的牛肉的平均近红外光谱存在有差异,牛肉样品的主成分空间分布也位于不同的区域。根据光谱距离,对样品进行聚类分析,初步判定了牛肉的产区,其中贵州的牛肉光谱比较复杂,与河北牛肉样品的光谱距离很近,存在一定交叉。利用来源于4个产区的18个独立样品对模型进行了验证,正确识别率为100%。说明应用近红外光谱分析技术可准确、快速、低廉地追溯牛肉的产地来源。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号