首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 187 毫秒
1.
基于LVQ与SVM算法的近红外光谱煤产地鉴别   总被引:1,自引:0,他引:1  
传统煤产地鉴别方法一般以发热量、挥发分、粘结指数、哈氏可磨指数和坩埚膨胀序数作为分类指标,过程复杂耗时较多、耗费巨大的人力、物力并且无法直接快速的得到煤样产地等问题,借助近红外光谱技术快速无损检测的优势,利用基于SVM的留一算法对光谱数据集进行异常样本剔除,得到包含正确光谱信息的煤样光谱数据集,构造基于SVM算法与LVQ算法的定性分析模型,完成基于近红外光谱分析技术的煤产地的快速鉴别,无需对煤样的各种指标进行汇总并且人为预测。针对SVM分析模型中存在随机参数优化问题,引入PSO算法对SVM模型中的损失参数C和核函数半径g进行改进,得到最优参数,最后引入计算准确率的方法对比以上模型并进行评价分析。实验一共收集了加拿大、俄罗斯、澳大利亚、印度尼西亚、中国内蒙等5个地区的煤样光谱数据集,数据集共计305组煤样样本,其中异常样本共计10组,分别选择各国煤炭光谱的前31组作为训练样本,后6组数据作为测试样本,结果表明各分类模型的分类准确率均能达到75%以上,其中基于PSO算法改进的SVM分析模型的准确率可达到96.67%,仅一个样本出现问题,可快速高效地实现基于近红外光谱分析技术的煤产地的鉴别。  相似文献   

2.
可靠的原产地认证方法对于保护指定产地的高价值中药材(例如道地药材、地理标志产品等)至关重要。附子作为著名的传统中药和川产道地药材,疗效显著,临床应用广泛,在国内外市场需求量很大。不同产地的附子疗效和价格有所不同,大众很难通过传统经验进行准确鉴别,基于植物代谢组学模式下的质谱检测技术,测试样本制备过程繁琐冗长、操作复杂、检测时间长,且重现性偏低。近红外光谱作为一种成熟、快速、无损的检测技术,被机器学习集成后为中药材在线质量监管和控制带来新途径。基于近红外光谱技术结合随机森林算法建立了一种不同产地附子无损鉴别模型。在四川、陕西和云南等主要栽培区域共采集了255份附子样本,采用傅里叶变换近红外光谱获得所有样本的漫反射光谱信息。采用单一和组合光谱预处理方式以消除光谱中的多种干扰,并筛选出最佳预处理方式,以此为输入指标建立随机森林模型。采用灵敏度、特异度和平衡精度等指标评价了模型的综合性能。结果表明:Savitzky-Golay平滑+多元散射校正为最佳预处理方式;仅采用全波长数据,RF模型对3组省级的样本的预测准确率超过了90%,预处理后预测准确率达98.39%;对于市/县一级样本,RF模型同样具有优秀的判别能力,准确率大于75%。模型对道地产区周边栽培区域的样本,识别率达100%。过滤出前100个特征波数,重新优化模型,模型对各市/县级区域的识别精度超过85%,尤其是对一些产自高原样本的识别能力得到了明显提升。研究中采用了环境友好型溯源策略,分析速度更快,样品损失更少,精度更高,为不同产地附子快速、高效的鉴别提供了新模式,为后续附子及其相关炮制品的鉴别和溯源提供了参考。  相似文献   

3.
苹果产地溯源具有重要的应用价值和现实意义。为了探寻苹果产地溯源新方法,以红富士品种为研究对象,以新疆阿克苏、山东烟台、陕西洛川三个产地671个红富士苹果样本为试材,分别采集其590~1 250 nm的近红外透射光谱,然后基于分数阶微分(FD)及主成分分析(PCA)-谱回归判别分析(SRDA)进行多模型融合,构建红富士苹果产地溯源的集成学习模型。首先,将经过光谱校正后的光谱数据划分为训练集和测试集,并利用分数阶微分预处理训练集光谱,获取不同阶次(取0~2阶,步长为0.1)的分数阶微分光谱;结合不同阶次的分数阶微分光谱及PCA-SRDA算法构建基学习器,将基学习器预测结果构成一个新训练集,并通过决策树算法完成模型融合,得到最终分类预测模型;随后,采用对应阶次的分数阶微分预处理测试集光谱,并基于已建立的基学习器,获得测试集相应的预测结果;最后,将预测结果构成一个新测试集,并基于已建立的分类预测模型,输出最终的预测结果。按7∶3比例随机划分样本集,并进行200次重复实验。结果表明,结合不同阶次的分数阶微分预处理及线性判别分析(LDA)、SRDA、PCA-LDA、PCA-SRDA算法建立多模型融合集成学习模型,具有较好的鉴别效果和较强的鲁棒性,其中,FD-PCA-SRDA多模型融合集成学习模型为最优,其训练集的平均精度为97.33%,标准差为0.49%,测试集的平均精度为94.84%,标准差为1.48%。故,分数阶微分技术及PCA-SRDA算法结合近红外透射光谱可成功、有效地实现苹果产地溯源。  相似文献   

4.
采用便携式近红外光谱仪采集枸杞子表面不同部位的近红外漫反射光谱,结合多类支持向量机算法对枸杞子产地进行快速无损辨识。以识别率为评价指标进行光谱预处理方法的选择,为了消除样本划分偏性对结果的影响,本研究通过重复划分样本集多次建模与预测,利用识别率的统计结果考察各个光谱采集部位的建模结果。实验结果表明,原始数据经二阶导数加SG平滑处理后,所建模型具有良好的产地预测性能。除了枸杞子顶端部位外,其他部位模型的稳定性及准确性均较好,其外部验证识别率的中位数与平均值均大于97%。这表明利用枸杞子样品表面近红外光谱可实现产地的准确鉴别,便携式近红外光谱技术可作为中药材流通环节中的有效监控手段。  相似文献   

5.
基于遗传算法的近红外光谱橄榄油产地鉴别方法研究   总被引:10,自引:0,他引:10  
提出了一种应用近红外光谱技术快速无损鉴别橄榄油产地的新方法。采用近红外光谱仪获取三种不同产地的橄榄油各30个样本的光谱漫反射特征曲线,利用全局搜索算法-遗传算法提取特征波长,即从光谱751个波长数据提取9个特征波长数据,并将其作为主成分分析法的输入变量,运用主成分分析法建立分析校正模型。结果表明,主成分1和2累计可信度已达99.130%,对不同产地的橄榄油有很好的聚类作用,同时也说明遗传算法抽取特征波长方法正确。将提取到的六种主成分作为BP神经网络的输入变量,品种类型作为神经网络的输出变量,建立3层人工神经网络模型,对30个未知橄榄油产地进行预测,预测结果准确率达100%。该方法能快速无损地检测橄榄油产地,同时也为其他油类产地鉴别提供了一种新方法。  相似文献   

6.
采用近红外光谱结合化学计量学,对来源于不同产地的81个党参样本进行快速、无损的定性研究.将党参样本粉碎后,采用光纤漫反射采集近红外光谱,并结合随机森林建立党参的定性模型,同时对比分析了不同光谱预处理方法(未处理、变量标准化十一阶导数、偏移校正十一阶导数)对鉴别结果的影响.结果显示,样本可按产地区分开;光谱经偏移校正十一阶导数处理后,训练集准确率达100%,测试集准确率为94%.研究表明,近红外光谱结合随机森林原理简单,易操作,准确率高,为作为快速鉴别党参的参考方法.  相似文献   

7.
现在樱桃市场上存在着大量以次充好的不良现象,严重损害了名牌樱桃的品牌经济效益,所以亟需一种能对不同产地樱桃实现快速无损鉴别的技术。拉曼光谱溯源技术作为光谱溯源技术的一种,由于具有快速、高效、无污染、无损分析等优点,逐渐得到相关研究者的重视。长短期记忆(LSTM)网络是一种具有记忆性的反馈神经网络,它是循环神经网络的一种变体。LSTM网络克服了循环神经网络中梯度消失的缺点,适合处理序列敏感的问题和任务,目前被广泛应用在语音识别、图像识别和手写识别等领域,但LSTM网络在产地溯源方面的应用还有待研究。基于此,提出了一种LSTM网络与拉曼光谱技术结合的能对不同产地樱桃实现快速无损鉴别的技术。将来自美国、山东和四川的369个樱桃作为研究样本,用拉曼光谱仪在785 nm激光下获得了不同产地樱桃的光谱数据。并且以每条经过基线校正后的拉曼光谱数据作为网络输入数据,基于LSTM网络构建了能对不同产地樱桃实现快速鉴别的判别模型,并且以样本判别准确率A、样本精确率P、样本召回率R和样本F值作为评价指标,探究了不同预处理方法对LSTM网络判别模型性能的影响。结果表明:当样本训练集和测试集的比例为85∶38时,直接采用原始拉曼光谱数据的LSTM网络模型的产地鉴别能力不高,鉴别准确率为79.87%。但当使用预处理过后的拉曼光谱数据,模型的鉴别准确率维持在92%以上。并且光谱经过SG+MSC预处理后模型的鉴别准确度最好,鉴别准确率达99.12%。同时在采用SG+MSC预处理的方法下,LSTM网络鉴别模型的精确率、召回率、F值均较高,表明了所提出的LSTM网络模型有较好的性能可实现对不同产地樱桃的鉴别,为樱桃的产地溯源提供了一种新的思路。  相似文献   

8.
太平猴魁茶因其特有的“喉韵”深受广大消费者喜爱,不同产地太平猴魁茶市场价格相差较大,如何实现产地精准鉴别是目前促进绿茶产业发展的关键因素。依赖于人工经验的感官评审方法主观性强、稳定性差,无法应用于实际生产检测过程。作为目前主要的检测分析方法,化学分析方法周期长、检测成本高,而且目前没有用于茶叶产地鉴别的统一标准。近红外光谱(NIR)作为一种无损检测分析方法,具有快速、非破坏性、无污染等特点,但是不同产地太平猴魁茶主要内含成分及其含量基本相同,不同产地样本光谱特征峰分布相似,导致常规分析方法无法有效选择特征变量。卷积神经网络(CNN)作为经典深度学习网络模型之一,具有强特征提取和模型表达能力。采用太平猴魁茶产地光谱特征分析,利用一维卷积神经网络模型(1-D CNN)提取太平猴魁茶NIR特征,提出一种基于1-D CNN和NIR的太平猴魁茶产地鉴别分析方法。试验以6个不同产地共120个样本为研究对象,分析10 000~4 000 cm-1范围内的光谱信息;将样本随机划分为训练集(84,占70%)和测试集(36,占30%),分别讨论不同间隔采样、网络结构、卷积核大小及激活函数对产地鉴别结果的影响,并引入Dropout方法对比分析模型过拟合现象;最终建立一个具有9层结构的1-D CNN模型。蒙特卡罗试验结果表明,相比于基于原始光谱数据(40.57%,7.06)和PCA方法(31.93%,6.96)的太平猴魁茶产地预测模型准确率和标准差,基于1-D CNN的太平猴魁茶产地鉴别模型预测精度和稳定性更高,其测试集预测准确率平均值和标准差分别为97.73%和3.47。因此,1-D CNN可有效提取太平猴魁茶不同产地NIR特征,提高太平猴魁茶产地鉴别精度,为太平猴魁茶精准产地鉴别及溯源分析提供参考。  相似文献   

9.
为了快速检测玉米品种类型,基于支持向量机(SVM)和近红外光谱联合建立玉米品种的分类模型。以郑单958、先玉335、京科968、登海605和德美亚等五个品种共计293个样本为研究对象,对采集的近红外光谱进行标准正态变量变换(SNV)处理后使用主成分分析法(PCA)对光谱数据进行降维处理。按照6∶1比例,随机选取251个样本为训练集,42个样本作为测试集,探讨贝叶斯优化算法(BO)对SVM模型性能的影响。分别使用网格搜索(GS)、遗传算法(GA)和BO算法等三种方法对SVM模型的两个重要参数惩罚因子C和径向基核函数参数γ进行寻优。选择各模型十折交叉验证识别准确率最高时对应的惩罚因子和核参数作为建模参数,建立SVM分类模型。将使用BO算法建立的SVM分类模型与使用GS和GA进行参数寻优后建立的模型性能进行比对。实验发现,使用BO优化的SVM分类模型相比于其他两种优化算法得到的SVM模型性能具有显著优势,测试集的识别准确率可达到100%。说明使用BO算法寻优的SVM模型参数是全局最优参数,其他两种优化算法寻优的参数可能陷入了局部最优,从而导致模型性能表现不佳。在进行PCA降维前后的光谱数据上分别建立BO-SVM模型,结果表明,BO算法对于高维数据优化效果不佳,更适用于低维数据。对于不同样本类别间数量不均衡导致模型性能表现不佳的问题,通过剔除郑丹958和先玉335两类数量较少的样本,使用剩余三个类别,共计248个样本重新建立SVM模型,实验发现,剔除两类小样本之后,各个模型在测试集上的性能均有提升,说明对于类间样本数量不均衡问题,某类样本数量越多,对于模型参数的修正就越细腻,模型对该类的拟合效果就越好。研究结果可用于玉米品种的快速鉴别,也可为基于近红外光谱的其他农产品分类和产地鉴别提供参考。  相似文献   

10.
近年来食品安全问题频发,消费者愈加重视食品原产地的环境安全,导致地理标志产品的需求增加。美味牛肝菌(Boletus edulis)作为一种健康食品,其产品品质受原产地环境影响较大,为保护消费者的身体健康,防止假冒伪劣产品进入市场,急需一种高效、廉价的美味牛肝菌产地鉴别技术。采用数据融合策略结合偏最小二乘判别(PLS-DA)模型对美味牛肝菌的产地进行鉴别。扫描来自8个产地(昆明、楚雄、玉溪、迪庆、大理、保山、文山和曲靖)141个样品的傅里叶变换近红外光谱和傅里叶变换中红外光谱。使用Kennard-Stone算法将所有样品划分为2/3的训练集和1/3的预测集,利用三种融合策略(低级、中级和高级)对4个单一光谱矩阵:近红外的菌柄(N-b)、近红外的菌盖(N-g)、中红外的菌柄(M-b)、中红外的菌盖(M-g),建立偏最小二乘判别(PLS-DA)模型。用交叉验证均方根误差(RMSECV)和预测均方根误差(RMSEP)评价模型稳定性,非错误率(NER)、训练集正确率和预测集正确率评价模型分类性能,综合多种评价指标,找出美味牛肝菌产地鉴别的最佳方法。结果表明:(1)近红外和中红外光谱均能鉴别美味牛肝菌产地;(2)中红外光谱所建立的模型优于近红外光谱所建立的模型;(3)三种融合策略均可提高美味牛肝菌的产地鉴别效果,产地鉴别效果优劣依次为中级融合、高级融合、低级融合、单一光谱模型。通过融合近红外和中红外光谱使用PLS-DA进行基于特征值LV的中级融合策略,建立不同产地美味牛肝菌鉴别模型,有最少的变量数(49),最高的产地训练集正确率(100%),最高的产地预测集正确率(100%),最低的RMSEP(0.133),实现了美味牛肝菌产地的快速、准确鉴别,可以作为美味牛肝菌产地溯源的一种可靠方法。  相似文献   

11.
对感染黑斑病的刺五加叶片进行光谱特性研究,能为药用植物病害的早期筛选与精准治疗提供重要研究资料。实验目的,运用高光谱成像技术实现植物病害的自动监督分类与识别。实验过程,首先使用高光谱成像系统在可见光波段(380~960 nm)内采集刺五加黑斑病的叶片样本,光谱数据经过去除亮暗噪声和平滑预处理后,再经过主成分分析实现数据降维,继而运用基于不同核函数的支持向量机法建立分类模型,最后利用总体分类精度、Kappa系数等因子评价不同核函数对分类器性能的影响。根据叶片表面的特征将其分为四类样本:健康亮部、健康暗部、轻度病害和重度病害等。对比各类样本的光谱可知,刺五加的健康样本在540 nm波长存在一个明显峰值,在620~680 nm光谱曲线急剧上升;而病害样本的光谱反射率呈现缓慢且平稳的上升趋势,上述特征能够将图像空间上反射强度接近的健康亮部和严重病害完全区分开。经对比发现前四个主成分(PC1,PC2,PC3,PC4)在分类表达上存在差异,主要表现为PC1含有的信息多,能够较好地区分各类样本;PC2则出现健康亮部和严重病害的交叉混淆;PC3是对于PC2的补充,能基本完整地表达轻微病害;PC4的贡献率仅有0.19%,依然能够准确地识别严重病害。不同主成分分量在表达各类样本特征中存在的差异能够作为复杂样本分类的参考依据。对比四种核函数对支持向量机分类器性能的影响,结果显示线性核函数的识别过程受光强反射的影响较大,Sigmoid核函数的训练精度易受数据集大小的影响,在识别健康亮或暗,以及轻微病害上均存在一定的误差,多项式核函数与径向基核函数的效果较好,其中,多项式核函数的精度更高,为92.77%。研究表明,利用高光谱成像技术能够准确地识别刺五加的健康叶片和患病叶片,为实现自动诊断药用植物叶片病害提供新方法。  相似文献   

12.
中药产地是影响药材质量的重要因素,不同产地生长环境对中药的生长及代谢产物的累积具有直接影响,中药材素有道地产区分为非道地产区,在我国具有悠远历史,由于其产地的变迁以及现代主产地的增加,导致当今药材主产地与历史记录略有出入。傅里叶变换红外光谱技术具有快速无损的优点,红外光谱可完整地将不同产地地黄的信息表达,结合化学计量学将红外光谱所体现的信息数字化。该工作运用傅里叶变换红外光谱仪采集不同产地地黄红外光谱,对原始光谱进行基线校正、平滑点数6个、选取900~1 200 cm-1波段进行最高峰归一化等预处理,对每个产地红外光谱各主要特征峰的相对峰强度进行计算,采用正态分布、聚类(CA)和主成分分析(PCA)比较其质量差异,地黄的产地鉴别对中药的合理应用具有科学意义。结果表明采用傅里叶变换红外光谱法采集73批不同产地生地黄的红外图谱,73批不同产地地黄红外光谱指纹图谱峰形、峰位、峰高基本相似,不同产地地黄中含有相同的化学成分,其特征峰、形状基本一致,其中河南产地的地黄有个别特征峰的高度突出,指纹区存在一定差异,差异主要贡献波段为:1 639,1 424,1 354和1 260 cm-1,共标定13个共有峰。聚类分析可将73批地黄样品分为河南产的怀地黄和其他地黄两类,表明不同产地地黄存在内部质量差异;正态分布与聚类分析结果一致,在1 639 cm-1处,河南产的怀地黄与其他省份的正态分布曲线交叉依次为:山东省>山西省>河北省,此方法能有效将道地药材与非道地药材区分开;对所得的共有峰相对峰强度进行降维处理,并计算不同产地地黄的主成分综合得分,结果显示河南产怀地黄得到综合得分均高于其他产地的地黄,表明河南产的怀地黄质量最佳。傅里叶变换红外光谱结合多元统计分析方法可以无损、有效、快速的鉴别不同产地地黄。  相似文献   

13.
针对传统玉米品种抗倒性鉴别方法费时费力、时效滞后的问题,采用高光谱成像数据结合机器学习方法对9叶期的玉米品种抗倒性进行鉴别,并给出适于进行玉米品种抗倒性鉴别的种植密度和建模方法。试验设置了5 000,7 000和9 000株·亩-13个种植密度和6个典型的抗倒/不抗倒玉米品种,采集9叶期玉米顶叶的高光谱图像,使用目标区域分割的方式自动进行光谱图像反射率校正和目标光谱曲线提取。对采集的样本数据使用Kennard Stone算法划分样本训练集和测试集,用主成分分析法(PCA)和连续投影算法(SPA)提取光谱特征,建立了基于高斯核函数的支持向量机(SVM)模型并进行参数训练和优化。通过对不同种植密度下各特征提取方法的效果和各模型训练效果及其预测结果的对比,找到进行玉米抗倒性鉴别的最佳种植密度和建模方法。试验结果表明:在各种植密度下PCA方法对光谱特征的降维效果最为显著,而SPA算法选择的特征波长分布比较均匀、抗倒性分类特征比较明显;种植密度的增加对于玉米品种抗倒性的鉴别是有益的,在种植密度为7 000株·亩-1时,使用SPA-SVM方法建立的模型训练效果和预测结果最佳,此时模型对训练集数据的10折交叉验证正确率为97.40%,对测试集数据的预测正确率为98.33%。  相似文献   

14.
It is a common practice to evaluate probability density function or matter spatial density function from statistical samples. Kernel density estimation is a frequently used method, but to select an optimal bandwidth of kernel estimation, which is completely based on data samples, is a long-term issue that has not been well settled so far. There exist analytic formulae of optimal kernel bandwidth, but they cannot be applied directly to data samples, since they depend on the unknown underlying density functions from which the samples are drawn. In this work, we devise an approach to pick out the totally data-based optimal bandwidth. First, we derive correction formulae for the analytic formulae of optimal bandwidth to compute the roughness of the sample's density function. Then substitute the correction formulae into the analytic formulae for optimal bandwidth, and through iteration we obtain the sample's optimal bandwidth. Compared with analytic formulae, our approach gives very good results, with relative differences from the analytic formulae being only 2%~3% for sample size larger than 104. This approach can also be generalized easily to cases of variable kernel estimations.  相似文献   

15.
目前我国蜂蜜市场掺假现象严重,研究一种快速、准确的方法用于市场流通领域掺假蜂蜜的鉴别具有重要的现实意义。采用近红外光谱(NIR)结合化学计量学方法对常见的天然蜂蜜以及掺假(掺杂常见糖浆)蜂蜜进行建模识别,并比较偏最小二乘-判别分析(PLS-DA)及支持向量机(SVM)对糖浆掺假蜂蜜鉴别模型的影响。首先,采集来自中国10个省份、20种常见蜂蜜的112个天然纯蜂蜜样品,以及6种常见糖浆样品按不同糖浆含量(10%,20%,30%,40%,50%,60%)配制的112个掺假蜂蜜样品,共计224个样品;通过近红外光仪器扫描获得所有样品的近红外光谱数据(波长范围400~2 500 nm);然后,分别采用一阶导数(FD)、二阶导数(SD)、多元散射校正(MSC)、标准正态变化(SNVT)四种方式对原始光谱进行预处理;再结合PLS-DA和SVM建立天然蜂蜜和糖浆掺假蜂蜜的鉴别模型,比较不同预处理方法对两种不同建模算法建立的蜂蜜掺假鉴别模型效果。其中SVM算法的惩罚参数c和核函数参数g通过网格搜索法(GS)、遗传算法(GA)、粒子群算法(PSO)三种寻优算法进行优化。分析结果表明:光谱数据进行预处理后所建立的模型准确率均有明显提升,而对于SVM模型,惩罚参数c和核函数参数g对模型准确率的提升效果要比光谱预处理带来的提升效果更明显。在PLS-DA算法中,经FD光谱预处理后建立的模型效果最好,最佳PLS-DA模型准确率为87.50%;在SVM算法中,经MSC预处理后,再通过GS寻优,获得惩罚参数c为3.0314,核函数参数g为0.3298的条件下所建立的模型效果最好,最佳SVM模型准确率为94.64%。由此可见,非线性的SVM算法结合NIR光谱数据所建立的天然蜂蜜与糖浆掺假蜂蜜鉴别模型要优于线性的PLS-DA模型,同时表明NIR光谱结合化学计量学方法对常见糖浆掺杂的中国蜂蜜鉴别是可行的。  相似文献   

16.
评价药用植物质量的主要手段之一是有效成分含量检测,不同采收期对药用植物有效成分含量有明显影响。通过傅里叶变换红外光谱(FTIR)结合化学计量学建立快速预测不同采收期铁皮石斛中总黄酮含量的方法,以期为铁皮石斛质量快速预测评价提供研究基础。采收2014年1至12月的铁皮石斛样品干燥粉碎;以氯化铝显色法测定铁皮石斛中总黄酮含量,分析不同采收时间铁皮石斛总黄酮的累积规律;采集样品红外光谱信息,归属红外吸收峰,拟合红外光谱数据和总黄酮含量数据,结合一阶导数、二阶导数、多元散射校正、标准正态变量、正交信号校正等对数据进行预处理,建立偏最小二乘回归模型预测样品中总黄酮含量。结果显示:(1)样品和标准品芦丁均在270 nm附近有共有吸收峰,实验以270 nm为总黄酮定量波长,标准曲线为y=6.076 5x+0.055 8,相关系数r=0.996 6,线性关系良好;重现性、精密度和稳定性相对标准偏差分别为1.00%,0.37%和0.28%,该方法稳定可靠;(2)总黄酮含量随时间变化趋势为先升高后降低,6月-8月样品含量较高,平均含量大于64.10 mg·g-1;(3)铁皮石斛红外光谱数据与总黄酮含量拟合后进行一阶导数、二阶导数、多元散射校正、标准正态变量、正交信号校正等组合处理,用PLSR模型预测铁皮石斛的总黄酮含量,结果最佳预处理方式为2D+SG5+SNV+OSC-PLSR,训练集和验证集r分别为0.979 0和0.882 4,验证均方根误差(RMSEE)和预测均方根误差(RMSEP)分别为2.438 2和4.169 9,铁皮石斛中总黄酮含量预测值与测量值较接近,表明PLS模型可用于总黄酮含量的快速预测。傅里叶变换红外光谱结合化学计量学能实现铁皮石斛中总黄酮含量准确预测,为铁皮石斛质量评价提供快速、有效的方法。  相似文献   

17.
已有的土壤有机质含量估测模型大多以光谱特征波段、线性和非线性模型为基础,较少考虑通过拓展样本数据建模集来提高模型的估测能力。为进一步提高土壤有机质高光谱反演模型估测精度,提出利用生成式对抗网络(GAN)合成伪高光谱数据和有机质含量的动态估测模型。选取湖南省长沙市及周边区域的水稻田为研究对象,采集土样和实测高光谱数据(350~2 500 nm),室内化学测定有机质含量。以高光谱数据和有机质含量为基础,利用生成式对抗网络生成等量新数据, 结合原始数据建模集组成增强建模集。在GAN正式训练中,每轮训练完成后,设置4个观测点(对应增强建模集中含50,100,150和239个生成样本),动态构建交叉验证岭回归(RCV)、偏最小二乘回归(PLSR)和BP神经网络(BPNN)土壤有机质含量估测模型(分别简称GAN-RCV,GAN-PLSR和GAN-BPNN),并在相同测试集上实施模型评估。实验结果表明:(1)原始数据建模集上拟合的估测模型中,交叉验证岭回归表现最佳,决定系数(R2)和均方根误差(RMSE)分别为0.831 1和0.189 6;(2)GAN的150轮正式训练中,增强建模集上动态构建的GAN-RCV,GAN-PLSR和GAN-BPNN模型性能显著提高,具体表现为:GAN-RCV的R2取得最大值0.890 9(RMSE 0.153 7)、最小值0.850 5 (RMSE 0.18)与平均值0.868 7(RMSE 0.168 6),最大R2比建模集上拟合的RCV提高了7.2%(RMSE降低了18.9%),GAN-PLSR获得R2最大值0.855 4(RMSE 0.176 9)、最小值0.727 0 (RMSE 0.243 2)与平均值0.780 1 (RMSE 0.217 7),最大R2比建模集上拟合的PLSR提高了20.6%(RMSE降低了29.5%),GAN-BPNN表现最佳,R2取得最大值0.905 2(RMSE 0.143 3)、最小值0.801 7(RMSE 0.207 3)与平均值0.868 1(RMSE 0.168 6),最大R2比建模集上拟合的BPNN提高了30.8%(RMSE降低了44.5%);(3)随着增强建模集中生成样本数量增加,模型精度提升效果呈先升后降趋势,4个观测点中第3个观测点的模型性能提升最显著。充分的实验表明:基于GAN动态构建的有机质含量估测模型显著改善了模型预测性能。依据测试集上的评估结果,可择优使用最佳模型进行后续土壤有机质含量估测。  相似文献   

18.
针对土壤定量分析受基体效应影响大,LIBS定量分析精度不佳等问题,采用粒子群算法对LSSVM进行优化,提高模型的精确度。选取Pb Ⅰ 405.78 nm和Cr Ⅰ 425.44 nm作为分析谱线进行分析。采集十二个不同浓度样品的特征光谱,每个浓度样品在不同点采集20组数据,将其中17组数据设为训练集,3组数据设为预测集,用LSSVM和PSO-LSSVM两种方法建立定标模型。对比两种模型的拟合相关系数(R2)、训练集均方根误差(RMSEC)和预测集均方根误差(RMSEP)。由于自吸收效应的影响,随着浓度的增加,预测值逐渐低于实际值,LSSVM定标模型的拟合程度较低,无法达到实验要求,模型性能有待提高。利用粒子群算法对LSSVM的模型参数惩罚系数和核函数参数进行优化,得到最佳的参数组合,Pb元素为(8 096.8, 138.865 7),Cr元素为(4 908.6, 393.563 5),用最佳的参数组合构建LSSVM的定标模型。相比于LSSVM,PSO-LSSVM定标模型的精确度更高,Pb和Cr元素的R2提高到了0.982 8和0.985 0,拟合效果明显提升。Pb和Cr元素的训练集均方根误差由0.026 0 Wt%和0.027 2 Wt%下降到0.022 4 Wt%和0.019 1 Wt%,预测集均方根误差由0.101 8 Wt%和0.078 8 Wt% 下降到0.045 8 Wt%和0.042 0 Wt%,模型的稳定性进一步提高。说明PSO-LSSVM算法能够更好地降低土壤基体效应和自吸收效应带来的影响,提高分析结果的精确度与稳定性。  相似文献   

19.
当今中药市场上掺假现象屡见不鲜,不良商贩利用三七须根粉末假冒主根和剪口粉末,严重影响三七的质量与药效。通过傅里叶变换红外光谱(FTIR)结合化学计量学建立三七主根、剪口和须根粉末鉴别及四种皂苷含量快速预测模型,为快速三七质量控制提供基础。采集三七主根、剪口和须根红外光谱,超高效液相色谱(UPLC)测量样品中三七皂苷R1、人参皂苷Rg1、人参皂苷Rb1和人参皂苷Rd含量。采用纵坐标归一化及二阶导数对原始红外光谱进行预处理;Kennard-stone算法将60个样本分为2/3训练集与1/3预测集。训练集数据结合支持向量机(SVM)判别建立三七主根、剪口和须根粉末鉴别模型,最佳核函数cg采用交叉验证进行网格式搜索,预测集数据用于对判别模型进行外部验证。正交信号校正偏最小二乘回归(OSC-PLSR)建立三七中四种皂苷含量预测模型,红外光谱采用一阶、二阶导数及Savitsky-Golay平滑5点、7点、9点、11点预处理。60个样本分为2/3训练集与1/3预测集,训练集数据建立OSC-PLSR模型,预测集数据对OSC-PLSR模型的预测结果进行外部验证。结果显示: (1)二阶导数可有效的分离原始谱图的叠合隐蔽谱峰,并提高谱图的分辨率;(2)交叉验证网格式搜索计算出最佳核函数c=2.828 43,g=4.882 81×10-4,此时训练集判别正确率为100%;(3)SVM判别模型核函数设置为最佳核函数,预测集数据外部验证正确率为100%,所有样本均被正确鉴别;(4)三七皂苷R1、人参皂苷Rg1、人参皂苷Rb1和人参皂苷Rd最优含量预测模型预测值与UPLC检测值接近,预测效果良好。FTIR结合SVM判别能对三七主根、剪口和须根粉末快速鉴别,结合OSC-PLSR能对四种皂苷含量进行准确预测。该方法准确可靠,可为中药材三七提供快速有效的质量控制。  相似文献   

20.
提出一种基于核密度估计的时-空域滤波算法,用于红外搜索跟踪系统图像的背景抑制。算法分为空域滤波和时域滤波两部分。在空域滤波中,采用核密度估计算法对背景进行平滑;在时域滤波中,采用核密度估计算法对经过空域滤波后的图像灰度值进行概率计算,判别属于背景残差的灰度值,然后做进一步的滤除。核方法对背景有很好的光滑性且易于计算机实现,实验表明,这种非参方法设计的时-空域滤波算法对背景杂波有非常良好的抑制效果,信噪比也得到明显提高。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号