首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 187 毫秒
1.
基于小波系数的近红外光谱局部建模方法与应用研究   总被引:2,自引:0,他引:2  
局部建模方法使用与预测样本相似的样本建立模型,可解决光谱响应与浓度之间的非线性问题,扩大模型的适用范围,提高预测准确度。采用小波变换进行数据压缩并利用小波系数之间的欧氏距离作为光谱相似性的判据,实现了近红外光谱定量分析的局部建模方法,避免了样本之间的依赖性。将所建立的方法用于烟草样品中氯含量的测定,100次重复计算得到的预测集均方根误差(RMSEP)平均值为0.0665,标准偏差(σ)为0.0045,优于全局建模和基于主成分的局部建模方法。  相似文献   

2.
针对光谱反射率重建中已有样本选取方法的不足,提出了一种基于核模糊C聚类的样本优化选取方法。该方法综合考虑了光谱反射率空间的广泛性和色度空间的相似性,较大程度满足了光谱重建的精度。首先采用已有样本选取法在光谱反射率空间选取C个样本作为聚类初始点,再将原光谱转化到色度空间进行聚类,同时引入核函数将二维色度空间映射到三维特征空间,使得特征数据线性可分,从而达到更好的划分效果。实验结果表明,使用该方法选取训练样本进行光谱反射率重建能够进一步提高光谱重建精度,色度评价和光谱评价结果均好于已有方法。  相似文献   

3.
引入模拟辅助样本提高BP网络的泛化能力   总被引:2,自引:0,他引:2  
以2-吲哚醇在20种不同参数固定液上的保留值、19种不同物质在同一固定液上的保留值以及脂肪胺的电谱保留值分别作为网络的训练样本和检验样本,建立了多元线性回归(LR)模型和BP网络模型,并基于LR模型运用随机搜索最优化方法,产生模拟辅助样本并将其引入BP网络训练样本集。预测结果表明,该方法的使用提高了BP网络的泛化能力,对于残缺样本问题的预测研究,提供了一种有效的方法,与线性回归模型及原BP网络模型相比,预测精度有了明显的改善。  相似文献   

4.
粒子群算法结合支持向量机回归法用于近红外光谱建模   总被引:1,自引:0,他引:1  
研究了最小二乘法支持向量机(LSSVM)应用于烟丝样品和小麦样品的近红外光谱建模,采用粒子群优化算法(PSO)优化LSSVM的参数。通过对烟草样品和小麦样品的近红外光谱建模和预测,并与常规的偏最小二乘法(PLS)比较发现,PSO-LSSVM法具有更好的预测效果和稳健性。  相似文献   

5.
在法庭科学领域,轮胎橡胶颗粒的检验鉴别对交通肇事和一些诉讼案件的侦破尤为重要,针对传统取样分析技术会破坏物证的问题和综合考察样本在多变量多维度上的差异性,提出基于红外光谱法结合K近邻算法无损识别轮胎橡胶的鉴别方法。采集不同品牌的样本,对其光谱进行自动基线校正和归一化操作,采用Savitsky-Golay算法平滑去噪,通过降维实现对840个原始特征到5个识别特征的高效筛选,运用训练样本为测试样本的方法进行交互验证,选取K值为1,"特征3"为主要自变量,"特征4"、"特征5"、"特征2"和"特征1"为协变量作为分类参数,按重要性加权特征进行计算样本之间的距离,建立分类模型,模型总分类准确率达83. 56%,区分效果良好,结合样本红外谱图展开进一步分析,最终成功将73类样本分为了10类。结果表明,利用红外光谱检测和K近邻算法可实现对轮胎橡胶颗粒的识别与分类,普适性和高效性较强,具有一定的借鉴和参考意义。  相似文献   

6.
在法庭科学领域,轮胎橡胶颗粒的检验鉴别对交通肇事和一些诉讼案件的侦破尤为重要,针对传统取样分析技术会破坏物证的问题和综合考察样本在多变量多维度上的差异性,提出基于红外光谱法结合K近邻算法无损识别轮胎橡胶的鉴别方法。采集不同品牌的样本,对其光谱进行自动基线校正和归一化操作,采用Savitsky-Golay算法平滑去噪,通过降维实现对840个原始特征到5个识别特征的高效筛选,运用训练样本为测试样本的方法进行交互验证,选取K值为1,"特征3"为主要自变量,"特征4"、"特征5"、"特征2"和"特征1"为协变量作为分类参数,按重要性加权特征进行计算样本之间的距离,建立分类模型,模型总分类准确率达83. 56%,区分效果良好,结合样本红外谱图展开进一步分析,最终成功将73类样本分为了10类。结果表明,利用红外光谱检测和K近邻算法可实现对轮胎橡胶颗粒的识别与分类,普适性和高效性较强,具有一定的借鉴和参考意义。  相似文献   

7.
邵学广  陈达  徐恒  刘智超  蔡文生 《中国化学》2009,27(7):1328-1332
偏最小二乘法(PLS)在近红外光谱(NIR)定量分析中占有重要地位,但预测结果往往容易受到样本分组和奇异样本等因素的影响,稳健性不强。多模型PLS (EPLS)方法在模型稳健性上得到提高,然而它无法识别样本中存在的奇异样本。为了同时提高模型的预测准确性和稳健性,本文提出了一种根据取样概率重新取样的多模型PLS方法,称为稳健共识PLS(RE-PLS)方法。该方法通过迭代赋权偏最小二乘法(IRPLS)计算样本回归残差得到每个校正集样本的取样概率,然后根据样本的取样概率来选择训练子集建立多个PLS模型,最后将所有PLS模型的预测结果平均作为最终预测结果。该方法用于两种不同植物样品的近红外光谱建模,并与传统的PLS及EPLS方法进行比较。结果表明该方法可以有效的避免校正集中奇异样本对模型的影响,同时可以提高预测精确度和稳健性。对于含有较多奇异样本的,复杂近红外光谱烟草实际样本,利用简单PLS或者EPLS方法建模预测效果不是很理想,而RE-PLS凭借其独特优势则有望在这种复杂光谱定量分析中得到广泛的应用。  相似文献   

8.
将多模型共识偏最小二乘法用于近红外光谱定量分析。利用随机抽取的训练子集建立一系列偏最小二乘模型,选取其中性能较好的部分模型作为成员模型,用这些成员模型来预测未知样品。将该方法用于一组生物样本的近红外光谱与样品中人血清白蛋白、γ-球蛋白以及葡萄糖含量之间的建模研究,并与单模型偏最小二乘法了进行比较。结果 PLS对独立测试集中三种组分进行50次重复预测的平均RMSEP分别为0.1066,0.0853和0.1338,RMSEP的标准偏差分别为0.0174,0.0144和0.0416;而本方法重复预测的平均RMSEP分别为0.0715,0.0750和0.0781,RMSEP的标准偏差分别为0.0033,0.2729×10-4和0.0025。  相似文献   

9.
由于校正集样本的质量决定校正模型的质量,校正集中奇异样本的检测在多元校正建模中具有非常重要的意义.本研究建立了一种用于近红外光谱多元校正建模时校正集中奇异样本的检测方法.本方法基于奇异样本的定义和偏最小二乘方法的原理,通过考察每个校正集样本在模型的每个因子(或主成分)中对模型的贡献,将与多数样本表现不同的样本识别为奇异样本.采用218个橘汁样本构成的近红外光谱数据进行了分析,结果表明,校正集中存在6个奇异样本,扣除奇异样本后,校正集的交叉验证均方根误差由16.870减小为4.809,预测集的均方根误差从3.688减小为3.332.  相似文献   

10.
在恒温恒压条件下,以丙酮和样本中底物作为主要耗散物的不同成分的样本对非线性化学反应机理产生不同影响,从而引起反应体系电位-时间曲线形状不同变化为特征的B-Z化学振荡体系为例,就非线性化学指纹图谱原理进行了详细研究和讨论,并提出了计算非线性化学指纹图谱系统相似度的通用方法.利用系统相似度和欧氏距离、相关系数及夹角余弦对不同生产批次古汉养生精和18种其他样本的非线性化学指纹图谱的相似度进行了计算与分析.结果表明,相关系数和夹角余弦都不能用来作为评价非线性化指纹图谱相似度的指标.利用欧氏距离公式计算指纹图谱的非参数型相似度时,能正确反映指纹图谱的特征差异,但用其计算参数型相似度时,则有时不能正确反映样本非线性化学指纹图谱特征差异的相对程度.系统相似度能最真实反映样本指纹图谱之间差异程度,是4种相似度计算方法中最好的,可用于非线性化学指纹图谱相似度计算与评价.成功提出了一种经济、简便、易行和有效的鉴别样本真伪与评价其质量的科学方法.  相似文献   

11.
基于岭回归和SVM的高维特征选择与肽QSAR建模   总被引:1,自引:0,他引:1  
岭回归估计权重绝对值在一定程度上体现了对应特征作用大小, 据此发展了基于岭回归(RR)和支持向量机(SVM)的高维特征选择算法. 对苦味二肽(BTT)和细胞毒性T淋巴细胞(CTL)表位9 肽两个肽体系, 以氨基酸的531 个物理化学性质参数直接表征肽结构, 各获得1062、4779 个初始特征; 对训练集, 初始特征以岭回归排序后序贯引入, 当SVM留一法交叉测试(LOOCV)的均方误差(MSE)显著上扬时终止, 最后以多轮末尾淘汰进一步精筛, 分别获得7、18个物理化学意义明确的保留特征. 基于保留特征与支持向量回归(SVR), 对训练集建立定量构效关系(QSAR)模型, 预测独立测试集, 其拟合精度、留一法交叉测试精度、独立预测精度均优于现有文献报道结果. 新方法运行速度快, 选取的特征物理化学意义明确, 解释性强, 在肽、蛋白质定量构效关系建模等高维数据回归预测领域有较广泛应用前景.  相似文献   

12.
用局部拟合主成分回归计算光度分析法测定黄连生物碱   总被引:1,自引:0,他引:1  
陈闽军  程翼宇  刘雪松 《化学学报》2003,61(10):1623-1627
针对具有样本数据非无匀分布和非线性特点的光度分析问题,提聘种局部拟合 主成分回归法,用于中药多组分计算测定。该方法根据待测样本与各已知样本光度 分析数据的欧式距离确定相应的权值,将部分权值较大的样本组成校正集,并用分 段线性拟合算法建立待测样本的校正预测模型,将其用于分析黄连的药根碱、巴巴 亭和小檗碱等三种生物碱,所得预测均方根误差分别为0.023,0.0400和0.052,优 于主成分回归法、偏最小二乘法以及人工神经元网络法所得结果。这表明,本方法 用于中药光度分析能获得较为准确的计算分析结果。  相似文献   

13.
依据中药大黄的近红外光谱信息,采用最小二乘双胞胎支持向量机( LSTSVM)算法,通过MATLAB软件编程,建立参数可优化识别模型,实现了对中药大黄的真伪鉴别.将实验材料98个大黄样品随机划分为训练集和测试集,对于训练集60个样品采用留1/5法交叉验证优化模型参数,以所选最优化参数结合训练集样品的近红外光谱建立最优识别模型,对测试集的38个样品的真伪迸行识别,识别率可达97.4%.结果表明,LSTSVM算法是一种有效的识别方法,可依据中药大黄的近红外光谱对其真伪进行快速识别.同时,本研究将大黄样品6次随机划分为训练集和测试集,建模预测平均识别率为93.4%,表明采用LSTSVM算法建立识别模型具有较好的稳健性.  相似文献   

14.
构建支持向量机-偏最小二乘法为药物构效关系建模   总被引:6,自引:0,他引:6  
李剑  陈德钊  成忠  叶子青 《分析化学》2006,34(2):263-266
为研究药物构效关系积累样本数据的过程中,需为小样本建模。此时较易造成过拟合,影响模型的预测性能和稳定性。为此可用偏最小二乘(PLS)法从样本数据中成对地提取最优成分,消除自变量间的复共线性,并有效的降维,然后应用最小二乘支持向量机对成对成分进行非线性回归,并以基于误差修正的策略调整,使之更有效地表达自、因变量间的非线性关系。由此构建为EB-LSSVM-PLS算法,所建模型的预报精度高,稳定性良好。将其应用于新型黄烷酮类衍生物的QSAR建模,效果令人满意,其泛化性能优于其它方法。  相似文献   

15.
支持向量机分类和回归用于肽的QSAR研究   总被引:4,自引:0,他引:4  
周鹏  曾晖  李波  周原  李志良 《化学通报》2006,69(5):342-346
使用支持向量机技术对两类肽化合物体系进行了分类和回归研究,并将其系统地与K最邻近法、多元线性回归、偏最小二乘、人工神经网络进行了比较。结果表明,对于小样本、非线性问题,支持向量机具有较强的稳定性能及泛化能力,在大多数情况下能够得到优于传统方法的建模效果。对于分类问题,支持向量机对训练集和测试集都达到了100%的分类正确率;对于回归问题,支持向量机虽对训练集样本拟合效果略低于人工神经网络,但对外部测试集却表现出较强的预测能力。  相似文献   

16.
基于Bayesian相似性评估方法结合偏最小二乘局部回归,对苹果近红外数据库进行数据挖掘。通过相似性计算方法搜索出与预测样品相近的近红外光谱,形成校正子集后采用局部回归方法获得待测样品的相关信息。该方法所建立局部模型的平均检验标准偏差(SEV)约为0.57,分析30个预测样品的预测标准偏差(SEP)约为0.61;基于马氏距离的传统方法建立的偏最小二乘局部模型的平均SEV为0.59,分析30个待测样品的预测SEP为0.64;而采用整个数据库建立的全局偏最小二乘模型的SEV约为0.65,分析30个预测样品SEP约为0.70。基于Bayesian相似性评估的局部回归方法在苹果糖度的近红外无损定量分析中获得较好的应用结果,在实际应用中该方法比全局回归方法具有更强的适用性,为近红外光谱分析提供了新的分析工具。  相似文献   

17.
18.
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号