首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 9 毫秒
1.
食药植物玛咖富含多种营养成分,极具药用价值。采用近红外漫反射光谱,对采自秘鲁及云南共139份玛咖样品进行产地鉴别。采用多元信号校正结合二阶导数和Norris平滑预处理光谱,利用光谱标准偏差初步选择光谱波段(7 500~4 061 cm-1),结合主成分-马氏距离(principal component analysis-mahalanobis distance,PCA-MD)筛选出适宜的主成分数为5。基于所筛选的光谱波段及主成分数,利用“模群迭代奇异样本诊断”方法剔除2个异常样品后,分别采用竞争自适应重加权法(competitive adaptive reweighted sampling,CARS)、蒙特卡洛-无信息变量消除法(monte carlo-uninformative variable elimination,MC-UVE)、遗传算法(genetic algorithm,GA)和子窗口重排(subwindow permutation analysis,SPA)四种方法筛选光谱变量信息,利用模型集群分析(model population analysis,MPA)思想对所筛选的光谱变量信息进行评价。结果显示,RMSECV(SPA)>RMSECV(CARS)>RMSECV(MC-UVE)>RMSECV(GA),分别为2.14,2.05,2.02,1.98,光谱变量数分别为250,240,250和70。采用偏最小二乘判别分析法(partial least squares discriminant analysis,PLS-DA)对四种方法筛选的光谱变量建立判别模型,随机选择97份样品作为建模集,其余40份样品作为验证集。通过R2,RMSEC和RMSEP分析可知,R2: GA>MC-UVE>CARS>SPA,RMSEC和RMSEP: GA相似文献   

2.
基于逐步回归法的近红外光谱信息提取及模型的研究   总被引:9,自引:3,他引:9  
基于多元线性回归的逐步分析算法 ,依据小麦粉的近红外吸收特性机理 ,对小麦粉的近红外光谱(10 0 0~ 2 5 0 0nm)划分三波段 (Ⅰ :10 0 0~ 14 0 0nm ;Ⅱ :14 0 0~ 186 0nm ;Ⅲ :186 0~ 2 5 0 0nm) ,并进行了各波段的光谱信息提取 ,确定了回归特征波长 ,对不同波段建立的回归模型进行了比较 ,给出了各段回归的最佳数学模型。通过对小麦粉近红外谱的信息提取及蛋白质成分的定量分析 ,比较和讨论了不同波段所建模型对小麦粉蛋白质含量的近红外分析结果 ,在应用中有一定的参考价值。  相似文献   

3.
近红外漫反射光谱信息分解的数量分析   总被引:1,自引:0,他引:1  
近红外漫反射光谱分析中,一直认为近红外光可获取样品内部的物质信息,但近红外漫反射光谱包含样品内部信息量究竟是多少,一直未给出准确的数量描述。该研究以烤烟样品为实验材料设计样品,每个实验样品分别由表层片状烤烟与内部烤烟粉末两部分组合而成,测定样品近红外漫反射光谱,提取光谱主成分信息(principal component, PC),将所提取的各主成分的不同组合作为统计指标,对样品进行聚类分析,结合各主成分方差贡献率,初步给出了样品不同深度光谱信息分解量的描述。实验结果表明,近红外漫反射光谱第1和第2主成分包含的信息量约占总信息的98%,反映样品表层信息;第3和第4主成分约占1.5%,表征样品内部信息。这一结果将有助于我们对近红外光谱定性定量分析时主成分信息的选择有一个更深刻的理解。  相似文献   

4.
为建立快速近红外光谱定量分析模型,特征波长筛选是提高定量分析预测精度较为有效的方法之一。它能够筛选出有效波长信息,减少数据冗余、提高数据有效性。随机森林(RF)作为一种集成算法,可根据计算特征重要性进行特征筛选。RF将基于袋外数据(OOB)的平均精度下降(MDA)方法计算均方误差平均值作为特征重要性结果,通过设置特征重要性阈值筛选特征变量构成特征波长子集,但该阈值范围的设定无理论依据,因此需要对特征重要性阈值范围进行探究。另一方面,由于RF的随机特性,特征波长子集中可能包含无效甚至是干扰变量,并不能保证所选变量的有效性。故而进一步提出RF-iPLS波长筛选方法。区间偏最小二乘法(iPLS)筛选出的特征波长多为连续特征波段的特性,对特征波长子集划分区间,弥补RF因自身随机性造成的无效变量问题;同时,RF筛选的离散特征波长解决了iPLS筛选的连续波段中含冗余信息的问题。为了说明RF-iPLS算法的合理性,特征子集经过蒙特卡洛(MC)方法500次样本特征采样后,构建RF-MC-iPLS算法。虽然RF-iPLS与RF-MC-iPLS算法结构接近,但运行时间缩短了11.12%,结果说明RF-iP...  相似文献   

5.
LSSVM模型下的近红外光谱联合区间波长筛选方法   总被引:2,自引:0,他引:2  
针对传统近红外光谱波长选择方法忽略模型中非线性因素的缺陷,采用具有非线性处理能力的最小二乘支持向量机,结合间隔策略的波长选择方法和联合区间的思想,提出了一种非线性模型下的波长筛选算法—联合区间最小二乘支持向量机(synergy interval least squares support vector machines, siLSSVM)。以苹果糖度近红外光谱数据为例,与传统siPLS波长筛选方法相比,新算法的预测集均方根误差(RMSEP)在PLS模型和LSSVM模型预测时分别提高了37.43%和47.88%,预测集相关系数(RP)在PLS模型和LSSVM模型预测时分别增加了6.04%和7.31%。实例表明,对于存在非线性因素较强的光谱数据,siLSSVM算法能够有效的挑选最优波长区间与提高模型的预测精度和鲁棒性,为近红外光谱在非线性因素下筛选波长提供了新前景。  相似文献   

6.
傅里叶变换近红外光谱信息资源共享的基础研究   总被引:1,自引:0,他引:1  
为了实现农产品傅里叶变换近红外光谱库信息资源的共享 ,使光谱库的信息资源达到充分利用 ,首先研究了仪器间光谱信息的准确表达 ,即仪器到仪器光谱信息间的映射 ;并以映射光谱研究了用于不同仪器上进行定量分析的无标样建模方法。对于 2 2个小麦样品蛋白质含量 ,无标样建模模型预测值与凯氏定氮结果的相关系数r =0 94 1,平均相对误差为 3 2 8% ;为了考察无标样建模模型定量分析的使用性 ,同时亦对 2 2个小麦样品的蛋白质含量采用有标样建模定量分析 ,模型预测值与凯氏定氮结果的相关系数r =0 96 3,平均相对误差为 2 4 %。有标样建模与无标样建模的模型分析结果的比较 ,为不同仪器间光谱信息的可共享性提供了依据。由此根据不同仪器建立的光谱信息库的库信息即可转化为另一仪器的映射光谱信息 ,保证了光谱库信息资源在不同仪器上的共享利用  相似文献   

7.
有用信息提取是复杂体系近红外检测的重点和难点之一。由于复杂体系光谱中存在各种噪声、基线漂移、谱带重叠及复杂背景的干扰,常规方法不能准确地从光谱中获得有用信息。为此,将小波包变换(DWPT)和信息熵理论相结合--小波包熵(EWPIE)提取复杂体系光谱中的有用信息。思路是采用小波包变换对光谱信号进行多频带分解,根据有用信号与噪声的频带分布特点,基于信息熵理论滤除干扰的频率分量,采用正交校正法(OSC)剔除与被测组分无关的信息,然后对处理后的频率分量进行重构,从而实现复杂体系有用信息的准确提取。通过对复杂体系光谱数据建立多元校正模型来验证该方法的效果。采用牛奶的近红外光谱数据,以牛奶中脂肪和蛋白质浓度为研究对象,建立了偏最小二乘法(PLS)模型。结果显示,牛奶中脂肪和蛋白质的预测均方根误差(RMSEP)分别为0.132%和0.121%,与单纯的DWPT和OSC相比,EWPIE能够有效地提取有用信息,避免了无用信息的干扰,明显提高了模型的预测精度,对复杂体系的准确检测具有一定的理论意义和实际应用价值。  相似文献   

8.
木材不同切面的近红外光谱信息与密度快速预测   总被引:9,自引:3,他引:9  
用近红外光谱对木材密度进行了研究。发现木材三个不同切面(横切面、径切面、弦切面)的近红外光谱有较大的差异;结合偏最小二乘法(PLS),根据三个切面采集到的光谱数据与木材密度建立了校正模型,横切面预测集的相关系数r为0.94,径切面和弦切面分别为0.85和0.81。结果表明,从横切面采集到的光谱建立的预测模型效果最好。用该模型对随机抽取、未参与建模的15个样品的密度进行了预测,r2=0.977, 标准偏差:STDEV=0.006。  相似文献   

9.
多尺度边缘检测方法提取近红外光谱信息特征的研究   总被引:1,自引:1,他引:1  
利用小波变换中的多尺度边缘检测方法对甲硝唑药片近红外光谱进行了信息特征的提取。通过偏最小二乘法建立所提取的特征与甲硝唑浓度之间的数学模型,并进行精度分析。结果表明,小波变换多尺度边缘检测能够有效分离并提取光谱信息特征,降低噪声,为一种有效的光谱信息特征提取方法,为解决近红外光谱中光谱叠加严重和信息率低等难题提供了一种思路。  相似文献   

10.
紫外、近红外、多源复合光谱信息的银杏叶质量快速分析   总被引:2,自引:0,他引:2  
为考察不同类型光谱信息用于银杏叶质量快速分析的适应性,收集了58个银杏叶样品,采用高效液相色谱方法(HPLC)测定其黄酮及内酯类活性成分的含量作为定标和检验样本的因变量(y)值,测定各样品的紫外、近红外光谱及包含紫外、可见及近红外信号的多源复合光谱信息作为样本的自变量(x)值;分别采用偏最小二乘回归(PLSR),以及根据待测样本在自变量空间最近邻K个样本与待测样本间的相互关系去预测其因变量值的KNN保形映射(KNN-KSR)方法,建立银杏叶活性成分的光谱定量分析模型,比较各光谱模型下检验集样本实测值与模型值的相关系数(R)、均方根偏差(RMSEP)、平均相对误差(MRE)。结果表明PLSR方法所建立的三类光谱模型的各项指标均不及KNN-KSR方法、且其紫外光谱模型的结果极差;而采用KNN-KSR方法根据三类光谱信息预测银杏叶中黄酮、内酯类成分时,R基本能达到0.8、RMSEP分别小于0.05与0.025且其平均相对误差均在8%以下。采用KNN-KSR方法根据紫外、近红外及多源光谱信息均可实现对银杏叶中四类黄酮醇苷成分及三类内酯成分含量的快速分析,突破了现有工作只是基于PLSR方法、根据近红外光谱信息对银杏叶总黄酮醇苷进行定量分析的局限;利用紫外和多源复合光谱信息及KNN-KSR方法进行银杏叶中黄酮醇苷及内酯类成分的快速检测,为银杏叶质量分析提供了更多的方法和选择。多源复合光谱仪具有体积小、成本低,便携的优点,非常适合银杏叶药材现场采购的快速检测及后续产品的质量分析与监控。  相似文献   

11.
基于近红外光谱和子窗口重排分析的山茶油掺假检测   总被引:1,自引:0,他引:1  
为打击山茶油掺假,保障消费者的合法利益,利用近红外光谱和子窗口重排分析(SPA)对山茶油的复杂掺假(掺入大豆油、菜籽油、花生油及混合油)进行检测。采集85个纯山茶油和315个掺假山茶油样本的近红外光谱,利用SPA变量选择方法对样本光谱的波长变量进行筛选,再由偏最小二乘-线性判别分析(PLS-LDA)建立山茶油掺假检测模型,并与竞争性自适应重加权算法(CARS)和无信息变量消除(UVE)变量选择方法的结果进行比较。研究结果表明,近红外光谱联合SPA方法可以用于山茶油的复杂掺假检测,预测集样本的分类错误率、灵敏度及特异性分别为0、1和1。SPA方法优于UVE方法,与CARS方法相当,是一种有效的变量选择方法,能简化模型并提高模型的预测精度和稳定性。  相似文献   

12.
基于子波变换的光谱信息数据压缩方法   总被引:6,自引:1,他引:5  
本文介绍一种基于子波变换的光谱信息数据压缩方法,利用子波变换的多尺度分析原理,将原始光谱数据分解成集中源信号绝大部分能量的模糊信号和反映源信号变化特性的锐化信号。由于锐化信号只有源信号变化梯度大的区域系数值才较大,其他区域都接近零,只需保存少量的系数,就可以实现数据压缩,用本文方法,对21种典型地物光谱数据进行了数据压缩实验,在1.0~1.7均方根误差情况下,若压缩结果不编码,压缩比一般为4:1~  相似文献   

13.
用遗传区间偏最小二乘法建立苹果糖度近红外光谱模型   总被引:6,自引:2,他引:4  
为了简化苹果糖度预测模型和提高模型的精度,用遗传区间偏最小二乘法(GA-iPLS)建立苹果近红外光谱预测模型。应用结果表明,整个光谱划分为40个子区间, GA-iPLS选择其中的第4,6,8,11,18号共5个子区间联合建立苹果糖度模型。遗传区间偏最小二乘法所建的模型,其校正时的相关系数rc和交互验证均方根误差RMSECV分别为0.962和0.334 6,预测时的相关系数rp和预测均方根误差RMSEP分别为0.932和0.384 2。与全光谱模型相比,该方法建立的模型不论对校正集还是预测集,模型的预测能力都提高了许多,且模型得到了很大的简化:其实际采用的波数点个数比全光谱模型采用的波数点个数大大减少,主因子数也比全光谱少,由此建立的模型更加简洁、数据运算量也更少。  相似文献   

14.
针对农作物病、虫、草害化学防治时对靶变量施药以减少农药使用量、提高农药利用率的需求,本文研究了基于荧光光谱信息和主动光源方法在不同环境下探测绿色植物的方法.通过白色、蓝色和红色L ED主动光源照射样本,采集了白天室内自然光照、白天太阳直射、白天无太阳直射和夜晚黑暗环境四种场景下的绿色植物和非绿色植物样本光谱.首先基于多...  相似文献   

15.
16.
光谱信息数据压缩方法—二真值线性预测法   总被引:1,自引:1,他引:0  
本文针对线性预测压缩存在的游长短、压缩比低、恢复精度差等问题,提出了一种新的压缩方法—“二真值线性预测法”,其特点是恢复精度高、压缩比大、算法简捷、实时性好,适用于可由线性逼近表示的测量过程的实时压缩。经对典型光谱数据压缩实验表明,平均游长一般比线性预测压缩高1倍,在压缩恢复过程中可保留光谱特征信息,在1%恢复精度时,压缩后数据未编码的情况下一般可获得大于2:1的压缩比,编码后可获得4:1~5:1的压缩比。  相似文献   

17.
太阳光谱观测是研究太阳大气活动现象有效手段之一。提出了一种基于主成分分析的太阳光谱特征信息提取和重构方法,分析了重构数据噪声抑制程度和主成分阶数的关系,计算了不同主成分阶数下重构数据的谱线信噪比以及多普勒速度测量精度。结果显示特征信息提取后,重构数据较大程度保留了原始光谱数据信息,光谱数据信噪比明显提高,谱线多普勒速度测量精度也显著提高,并且三维光谱数据存储和传输量大幅缩减。该方法能够满足一米新真空太阳望远镜当前数据规范发布需求和科学目标要求,为中国在建的光纤阵列太阳望远镜以及未来的巨型太阳望远镜光谱数据处理提供参考。  相似文献   

18.
在观测空间目标时,往往会受到地基观测仪器等因素的制约,导致无法利用目标图像信息从外形上进行识别。根据不同空间目标表面组成材料不同,其产生的反射光谱会存在差异这一特性,可利用空间目标特有的光谱信息进行识别分类。基于此,从光谱学角度对空间目标识别算法进行研究,在K最近邻算法(KNN)的基础上,采用了一种自适应权重局部超平面方法(AWKH),算法主要在计算预测样本与超平面距离时加入对特征权重的考虑,构建了以样本特征组间差与组内差的比值作为特征权重值的超平面模型,从而提高了分类效果和分类效率。为验证算法的分类效果,本文进行了四组验证实验,第一组实验将美国地质勘探局数据库中提取出的九种常用材料光谱随机选出三种混合成多类进行识别;第二、三组实验将四种常用空间目标材料的光谱作为纯物质光谱,分别从可见光和近红外波段对其混合物质进行分类;第四组实验通过实测四个方形模型样本六个面的光谱对其进行识别分类。实验过程中将实验结果与目前常用的支持向量机(SVM)进行对比,对比结果表明改进后的AWKH算法在识别精度和样本适用范围上具有更高的优越性。  相似文献   

19.
基于抽取和连续投影算法的可见近红外光谱变量筛选   总被引:1,自引:0,他引:1  
大多数短波CCD硅检测器为2 048或3 648像元,相邻波长间隔小,预处理算法对其适用性差.本文在600.09~980.47 nm光谱范围内,采用等间隔抽取方法重构光谱矩阵.经不同光谱预处理后,分别采用遗传算法(GA)和连续投影算法(SPA),筛选偏最小二乘法(PLS)建模变量.采用留一法交叉验证评价模型的预测能力,...  相似文献   

20.
为满足白酒品牌判别领域快速检测的迫切需求,提出了一种以紫外光谱为输入,移动窗口相关系数法为手段的白酒品牌快速判别新方法。研究以海之蓝酒作为对象品牌,实验结果显示各批次海之蓝酒在实验波长区间存在较高的吻合一致性,基于紫外光谱原始谱图的相关系数值和基于移动窗口光谱计算所得的相关系数值均达到0.99以上。由于其他洋河系列白酒与海之蓝酒均属于洋河酒厂生产,原料来源、生产制备工艺等存在较高的相似性,此时若仅使用紫外光谱原始谱图数据结合相似度算法进行品牌判别,则定量化的判别区分存在一定困难。移动窗口法可有效提高谱图细节差异,突出光谱在特征谱段的形状、强度、变化趋势差异,提高实验谱图在细节结构差异辨认分析能力。经过研究筛选,发现以移动窗口相关系数结合紫外光谱特征谱段(270~295 nm)可提高洋河系列酒间的谱图差异,实现这种有较高相似性白酒品牌的判别区分。此外,市售六种其他品牌白酒及乙醇作为对照组,进一步论证了该方案的可行性。该研究的创新之处在于提出了一种移动窗口相关系数光谱法进行白酒品牌快速判别分析的新思路,该方法同时具备速度快,操作简便等优点,具有较高的实际应用潜在价值,并可为其他食品的质量安全判别分析研究提供借鉴。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号