首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 125 毫秒
1.
遗传算法结合偏最小二乘法无损评价西洋梨糖度   总被引:4,自引:0,他引:4  
基于遗传算法的波段选择法在组合优化问题上具有很大的搜索优势,适应性很广。文章将该方法应用于西洋梨糖度近红外光谱分析中,探讨数据优化筛选的可行性。光谱经多元散射校正或标准归一化处理后进行波段选择,选择结果与样品中被测成分有关, 4个品种洋梨的最佳个体染色体编码有一定共性。分别建立了四种洋梨的GA-PLS模型和全谱模型,早红考密斯、五九香、凯斯凯德和康佛伦斯的GA-PLS建模数据点分别从1 557减少到了434,496,310和496。GA-PLS/Fr-PLS模型的预测标准偏差分别为0.428/0.518,0.696/0.694,0.425/0.421和0.567/0.633, 其中早红考密斯和康佛伦斯GA-PLS模型的预测精度明显优于全谱模型,而五九香和凯斯凯德的GA-PLS模型与全谱模型相近。结果表明,遗传算法用于PLS建立西洋梨糖度校正模型前的数据优化筛选是可行的, 有效提高测量精度, 减少建模变量。  相似文献   

2.
利用拉曼光谱技术结合化学判别方法建立新陈大米拉曼光谱判别模型。选取合适的样品预处理方式,使用拉曼光谱仪对新陈大米共计60组样品进行检测,在785nm波长的激光下,获取样品200~2 400cm-1的拉曼光谱信息,并对原始拉曼光谱进行基线校正、平滑、滤波等处理。应用主成分分析法(PCA)对光谱数据进行降维处理及粗分类鉴别;基于偏最小二乘分析法(PLS),建立新陈大米快速鉴别模型,该模型对建模训练集鉴别正确率为100%,模型验证集鉴别正确率为95%。结果表明:该模型判断新陈大米是可行的,为稻谷新陈度的快速判别提供了一种新的方法。  相似文献   

3.
向量空间模型最初用于文献检索,该模型是通过对文献内容进行特征文本提取后,将文献转换到文本向量空间,然后在文本向量空间中通过计算文献的特征文本向量与检索文本的特征文本向量的相似度,实现文献的检索,该方法基于模式识别中模板匹配的最近邻原则。针对光谱数据的特点和模式识别中模板匹配的基本原则,将向量空间模型引入基于样品光谱的分类识别。通过训练集中光谱数据获得各样品的光谱数据模板,提取训练集中各样品光谱数据模板特征峰的波长和相对强度信息,构建特征峰信息数据库,计算获得特征峰信息权值,将光谱数据转换到特征峰向量空间,获得各样品光谱数据模板的特征峰向量,构建样品特征峰向量数据库。同理获得预测集样品光谱的特征峰向量,在特征峰向量空间中通过计算预测集样品特征峰向量与样品特征峰向量数据库中各样品模板特征峰向量的余弦值,完成对预测集样品的分类识别。以岩屑样品的LIBS光谱为研究对象,将向量空间模型应用于LIBS光谱的分类识别。分类结果表明,该方法能够实现对岩屑样品LIBS全谱的快速分类识别,且在对预测集光谱数据进行平均处理后,分类准确率为100%。提出的基于向量空间模型的LIBS光谱分类方法可以拓展应用于其他光谱数据的分类识别。  相似文献   

4.
基于拉曼光谱检测技术结合化学判别方法,建立新陈大米拉曼光谱判别模型;建立适当的样品预处理方法,确保样品制备的均一性,使用拉曼光谱仪对新陈大米共计60组样品进行检测,在785 nm波长激光激发下,获取样品200~2 400 cm-1的拉曼光谱信息;对原始拉曼光谱进行基线校正、平滑、滤波等处理。利用主成分分析法(PCA)对拉曼光谱进行降维处理及粗分类鉴别;基于偏最小二乘分析法(PLS),建立新陈大米快速鉴别模型,该模型对建模训练集鉴别正确率为100%,模型验证集鉴别正确率为95%。结果表明:该模型判断新陈大米是可行的,为大米新陈度的快速判别提供了一种新的方法。  相似文献   

5.
近红外光谱结合化学计量学方法对癌症的辅助诊断已有了文献报道.该文测定了77例不同生理阶段的子官内膜组织病理切片的近红外光谱,对其分别进行多元散射校正(MSC)、正交信号校正(OSC)以及二者联用的预处理方法,采用拉丁配分法选择3/4样本作为训练集,1/4样本作测试集,建立支持向量机(SVM)模型进行分类,并与基于同样预处理方法建立的偏最小二乘(PLS)模型分类结果进行了比较.SVM对正常、增生和癌变三类不同的组织样品分类结果较好,总分类正确率约92%,好于PLS模型的结果(最高正确率90%).研究结果表明,光谱数据的预处理和建模方法对分类结果有重要影响,SVM结合子宫内膜组织的近红外光谱有望发展成为一种新型的肿瘤诊断方法.  相似文献   

6.
旨在建立可靠的Fisher判别模型,以实现西洋参及其常见伪品饮片的快速、客观、准确鉴别,采用自组的凝视式光谱成像仪,对90份不同市售来源的中药材饮片(西洋参、人参、桔梗各30份)进行了荧光光谱成像实验,波长范围为400~720 nm,成像间隔为5nm。采用标准正态变量(SNV)变换对原的光谱数据进行预处理,以减少光谱数据中的噪声干扰。比较了主成分分析(PCA)与逐步判别分析(SDA)的原理特点及对模型的优化效果,联合这两种分析方法,首先,应用PCA对预处理后的光谱数据进行处理,使光谱数据中的主要信息集中分布在前面的主成分中,然后应用SDA从65个主成分中筛选出判别能力较强的12个主成分建立Fisher判别模型。由所建模型的两个判别函数作样品得分散点图,各类样品在图中表现出良好的聚类现象。以待判样品点与各种类中心点之间的欧氏距离作为依据,得出模型的准确判别结果。结果显示,所建Fisher判别模型在训练集和预测集中的判别正确率分别为98.33%和 96.67%,具有较高的可信度与准确度,因此,荧光光谱法结合Fisher判别分析可用于快速鉴别西洋参及其伪品饮片。  相似文献   

7.
王动民  张军  赵滨 《光谱实验室》2006,23(5):921-925
对模拟退火算法进行了优化,并以小麦粉样品的光谱为对象,利用优化后的算法在分子含氢基团一倍频区域1400-1860nm(7144-5376cm-1)优选出了分析小麦蛋白质含量的4个特征波长,结合多元线性回归(MLR)建立了定标模型.同时,利用这个谱区的全谱数据,结合偏最小二乘法(PLS)建立了另外一个模型.经过比较,发现这两个模型具有相同的预测效果.说明优化后的模拟退火算法能很好地用于近红外光谱分析中定标波长的选取,进而建立"精而简"的模型.这对于简化定标模型及确定分立波长型仪器的定标波长具有十分重要的价值.同时,对处理其他优化组合问题也有一定的指导意义.  相似文献   

8.
激光诱导击穿光谱技术具有微损、原位、快速分析的特点,在样品分类识别、成分分析等领域有广阔的应用前景。为探索该技术在天然地质样品识别应用的可行性,提出了一种自组织特征映射神经网络结合相关判别对天然地质样品LIBS光谱分类识别的方法。为减小全谱中背景噪声等不相关数据干扰、降低计算量,在元素谱线归属的基础上进行了特征谱线提取,实现了高维光谱数据的降维。以特征谱数据为输入建立网络训练模型,得到具有输入样本特征的权向量,通过权向量与待测样本进行相关分析可以实现样品分类。对16种天然地质样品的分类算法实验证明,在全谱、主成分降维和特征谱段三种数据处理方法中,特征谱的降维和提取LIBS数据主特征效果最优。改进的SOM网络结合相关判别算法比支持向量机方法和直接应用SOM网络方法的分类准确度更高,初步证实了该方法的有效性。  相似文献   

9.
采用偏最小二乘法(PLS)和光谱Savitzky-Golay(SG)平滑方法,建立甘蔗清糖浆锤度近红外光谱分析的优化模型。基于最优单波长模型预测效果划分定标集和预测集。全谱(400—2500nm)经过SG平滑处理后用PLS方法建模。建立计算机算法平台,把483种SG平滑模式和1—40的PLS因子数任意组合分别建立PLS模型,根据预测效果选出最优模型,最优模型的SG平滑模式为二阶导数平滑、4、5次多项式类型、43平滑点数,PLS因子数为13,预测均方根偏差(RMSEP)、相对预测均方根偏差(RRMSEP)和预测相关系数(rP)分别为0.433%、0.69%和0.978。预测精度很高,并且大幅度优于未做SG平滑处理直接PLS建模的预测效果。从而表明,SG平滑模式和PLS因子数的联合大范围筛选能够有效地应用于近红外光谱分析的模型优选。  相似文献   

10.
应用SIMCA分类法与PLS算法结合卷烟纸的傅里叶变换近红外光谱(FT-NIR)建立了卷烟纸的分类模型,用于卷烟纸的判别分类,效果良好;同时,建立了测定卷烟纸定量、厚度、透气度、水分和灰分等性质的校正模型,其相应的相关系数分别为0.976 8,0.966 4,0.947 0,0.956 3和0.975 9;全交互校验均方残差分别为0.561 4,0.096 0,1.274 1,0.096 7和0.260 3。校正模型应用于样品实测,结果准确,令人满意。  相似文献   

11.
胶州湾海水溶解有机物三维荧光特征研究   总被引:5,自引:2,他引:3  
应用三维荧光光谱(excitation-emission matrix spectroscopy, EEMs)研究了不同河流输入有机物对胶州湾海水中溶解有机物荧光特征的影响。结果表明,生活污水和工业废水的排放使附近海水中类腐殖质荧光位置发生红移;类蛋白荧光在海泊河附近最强,类腐殖质荧光在李村河附近最强,中心海区荧光强度最弱,表明沿岸河流输入是胶州湾海水中有机物的主要来源,而中心海区有机物主要来源于现场生物活动。不同河口附近区域样品中有机物的类蛋白和类腐殖质荧光强度之间相关性不同,表明河流输入有机物的影响。胶州湾大部分海水中有机物的类蛋白与类腐殖质荧光强度之间的比值较大,表明可能受到了人类活动产生类蛋白有机物的污染。研究结果对于分析海水中有机物来源以及河流排放污染物的迁移等过程具有一定的指导意义。  相似文献   

12.
提出了利用可见/近红外高光谱成像技术检测高温障碍胁迫下番茄叶片色差的方法。首先采集380~1 023 nm波段范围内60个高温障碍胁迫和60个健康番茄叶片的高光谱图像,同时获取全部叶片的色差值(L*, a*b*),然后提取所有样本的高光谱图像中感兴趣区域(region of interest, ROI)的光谱反射率值。基于不同预处理方法建立偏最小二乘(partial least squares, PLS)预测模型,再利用连续投影算法(successive projections algorithm, SPA)提取特征波长并建立SPA-PLS预测模型。最后分别基于全波段和特征波段建立偏最小二乘-判别分析(partial least squares-discriminant analysis, PLS-DA)模型。结果显示,全波段中基于原始光谱信息建立的模型效果最好,3个色差值的预测集决定系数(determination coefficient, R2)分别是0.818,0.109和0.896;基于特征波长建立的模型预测集R2分别是0.591,0.244和0.673;所有模型预测集的总体识别率均大于77.50%。结果表明,可见/近红外高光谱成像技术检测番茄叶片色差值(L*和b*)和识别高温障碍样本是可行的。  相似文献   

13.
近红外光谱结合化学计量学方法对癌症的辅助诊断已有了文献报道.该文测定了77例不同生理阶段的子官内膜组织病理切片的近红外光谱,对其分别进行多元散射校正(MSC)、正交信号校正(OSC)以及二者联用的预处理方法,采用拉丁配分法选择3/4样本作为训练集,1/4样本作测试集,建立支持向量机(SVM)模型进行分类,并与基于同样预...  相似文献   

14.
为研究卷烟风格与卷烟化学成分之间的关系,应用主成分回归建立卷烟GC-MS数据与卷烟风格评吸值之间的定量模型.对于每种卷烟风格,均建立了4种候选模型,然后选取最佳者.通过最佳模型对测试集样品的30种风格进行预测,有23种风格的预测值与评吸值之间的平均绝对误差小于专家评吸时的最小计分单位,所以定量模型的预测结果可靠.此研究表明化学计量学方法在处理卷烟这种复杂体系时的可用性和有效性.这些定量模型可以作为专家评吸卷烟风格的辅助工具.在定量关系不明确的情况下,应当建立多个候选模型,然后从中选择最佳者.  相似文献   

15.
利用神经网络提高偏最小二乘法的NIR多组分分析精度   总被引:4,自引:2,他引:2  
提出了一种神经网络(ANN)和偏最小二乘法(PLS)结合的新的近红外(NIR)多组分分析法。该方法首先把训练样本中待测组分涵盖的浓度区间分成若干个子区间,利用各个子区间的训练样本分别建立PLS校正模型,然后利用ANN对未知样本进行分类,判断其所属的浓度子区间,应用对应子区间上的校正模型计算预测样本的组分浓度。和传统的PLS比较,此方法改善了模型的适应性,显著地提高了预测精度。实验及数据处理结果证明了本方法的有效性。  相似文献   

16.
建立了牛肉基于TVB-N、菌落总数、pH值和肉色参数L*多个指标的储存期预测模型,利用可见近红外光谱(Vis/NIR)技术结合区间偏最小二乘(iPLS)和遗传算法(GA)建立了各个指标的PLS预测模型,实现了多指标综合无损快速预测4 ℃下牛肉的储存期。用iPLS和iPLS-GA提取有效波长变量建立PLS预测模型,以预测相关系数和预测标准差作为模型评价标准,结果表明用iPLS-GA选择变量建立的各个指标的PLS预测模型均优于全波段和iPLS组合的PLS模型。由多个指标的预测值和储存期的预测模型,对校正集和预测集样品储存期进行预测,其预测相关系数和标准差分别是0.903, 0.897和1.88, 2.24。说明利用光谱技术结合得出的储存期预测模型可以实现多指标综合预测牛肉储存期,为无损快速检测牛肉储存期或货架期提供了一种新方法。   相似文献   

17.
针对天然纤维素清洁制浆新型连续生产工艺,提出了采用近红外漫反射光谱测定天然纤维素(棉、木浆粕)清洁浆料中α-纤维素含量。收集了142个天然纤维素清洁浆料样品,采用GB/T 9107—1999方法(化学分析方法)测定其α-纤维素含量。通过粉碎预处理提高样品的均匀性,继而压入旋转杯采集光谱。采用簇类独立软模式(SIMCA)方法建立了有效的棉浆粕和木浆粕的分类模型,模型识别率达到100%。基于偏最小二乘(PLS)法分别建立的全部样品以及分类棉、木浆粕的α-纤维素含量定量校正模型相关系数分别为0.954,0.911和0.839,SEP分别为2.4%,1.2%和1.6%,模型预测精密度与GB方法的允差接近,表明该方法是可行的,且操作简单,分析速度快,对提高天然纤维素清洁浆料α-纤维素含量分析效率和指导其连续生产具有积极意义。  相似文献   

18.
PLS-BP法近红外光谱定量分析研究   总被引:26,自引:7,他引:19  
建立BP模型用于近红外光谱定量分析时,为克服所建模型与训练样本集产生“过拟合”,先用线性算法为其压缩训练数据是必要的。目前多采用主成分法(PCA)和逐步回归法(SRA)。主成分法具有极强的压缩数据能力,用它压缩成的主成分输入BP网所建模型的预测精度一般能满足要求,但它处理数据时未考虑输出变量的影响。逐步回归法根据系统输出选择变量,但所选变量具有自相关性,而且与训练集样品的排列顺序有关,很难选出最好的变量,往往难满足预测精度要求。本研究用偏最小二乘法(PLS),根据输出变量将原始数据压缩为主成分,输入BP网并用所建模型预测30个小麦样品的蛋白质含量。结果表明,与PCA-BP模型的预测决定系数(R2)从92.50提高到97.10,训练迭代次数从12 000减少到4 500。  相似文献   

19.
Zhao J  Li Z  Li G  Lin L  Gao JX  Han GL 《光谱学与光谱分析》2012,32(6):1624-1627
为了消除光谱采集中操作方法对测量带来的干扰,以及提高仪器灵敏度和增强样本之间的差异性,将反射率归一化法用于光谱法舌诊数据预处理。采集被检者舌尖反射光谱,计算被测对象的反射率和归一化反射率,比较不同距离采集的同一被测对象反射率和归一化反射率发现,反射率归一化可以消除不同采集距离对反射光谱造成的影响,比较不同样本的反射率和归一化反射率曲线以及分类预测模型预测结果,结果表明反射率归一化法可以增强样本之间的差异性,增强后续疾病快速筛查模型的稳健性和预测能力。  相似文献   

20.
近红外光谱法快速测定新疆薰衣草精油主要组分   总被引:1,自引:0,他引:1  
为建立快速测定新疆薰衣草精油中芳樟醇(linalool)、乙酸芳樟酯(linalyl acetate)含量的定量分析模型,采用近红外吸收光谱法(NIR)测定了165个精油样品,通过对近红外光谱吸收峰分析,在7 100~4 500 cm-1波数范围内化学信息量比较丰富且噪音低,可选择此波数段为分析区间。剔除8个异常样本后,通过聚类方法划分为105个校正集样本和52个验证集样本,结合气相色谱质谱(GC-MS)法测定的薰衣草精油linalool和linalyl acetate的含量,建立原始数据矩阵。对比不同的预处理方法对原始近红外光谱的过滤作用,其中正交信号变换(OSC)方法效果明显,对两种化合物的预测均方根误差(RMSEP) 分别为0.226和0.558,再用向前间隔偏最小二乘法(FiPLS)剔除与待测成分无关或呈非线性关系的波长点,最终得到8个间隔区间共160个波长点的数据子集。使用OSC-FiPLS优化处理的数据子集结合偏最小二乘法(PLS)建立新疆薰衣草精油中linalool和linalyl acetate的快速定量分析模型,在模型中二成分的隐变量数都为8。交互验证均方根误差(RMSECV)分别为0.170和0.416;预测均方根误差(RMSEP)分别为0.188和0.364。结果表明,经OSC和FiPLS预处理建立的PLS-NIR定量分析模型稳健性好,测定精度高,能快速测定薰衣草精油中linalool和linalyl acetate含量,并且具有良好的预测能力。可为新疆薰衣草精油主要成分的快速定量分析提供一种新的有效方法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号