首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 171 毫秒
1.
恒星的分类对了解恒星和星系形成与演化历史具有重要的研究价值。面对大型巡天计划及由此产生的海量数据,如何迅速准确地将天体自动分类显得尤为重要。通过对SDSS DR9的恒星光谱数据进行深度置信神经网络(DBN)、神经网络和支持向量机(SVM)等算法分类的对比,分析三种自动光谱分类方法在恒星分类上的适用性。首先利用上述三种方法对K,F恒星进行识别分类,然后再分别对K1,K3和K5次型和F2,F5,F9次型识别,最后基于SVM支持向量机的二次分类模型,利用K次型的数据,构建剔除不属于K次型的模型。结果表明:深度置信网络对K,F型恒星分类效果较好,但是对K,F次型的分类效果不佳;SVM支持向量机在K,F型恒星分类以及相应的次型分类都具有较好的识别率,对K,F型分类效果要好于K,F次型的分类效果;BP神经网络对K,F型恒星以及其次型的识别一般;在剔除不属于K次型实验中,剔除率高达100%,可知SVM能够对未知的光谱数据进行筛选与分类。  相似文献   

2.
支持向量机作为一种经典的分类方法被广泛应用于恒星光谱分类领域。该方法在实际应用中取得了较为理想的分类效果,但其面临无法解决多分类问题的挑战。在支持向量机的基础上,提出多类支持向量机,建立基于多类支持向量机的恒星光谱分类模型。该方法的最大优势是经过一次分类过程,可以确定多类样本的类属。SDSS DR8恒星光谱数据上的比较实验表明,本研究所提的方法较之已有多分类方法在分类性能上有一定的提升。  相似文献   

3.
污染气体红外光谱特征的快速提取与识别   总被引:1,自引:1,他引:0  
利用小波变换的多尺度分析对污染气体红外光谱数据进行处理,并使用神经网络对红外光谱数据进行分类识别。实验结果表明:小波变换与神经网络的有机结合,有利于污染气体红外光谱的快速特征提取和识别, 并具有较高的识别率,是一个有效的识别系统。  相似文献   

4.
恒星光谱分类是天文学研究的一个热点问题。随着观测光谱数量的急剧增加,传统的人工分类无法满足实际需求,急需利用自动化技术,特别是数据挖掘算法来对恒星光谱进行自动分类。关联规则、神经网络、自组织网络等数据挖掘算法已广泛应用于恒星光谱分类。其中,支持向量机(SVM)分类能力突出,被广泛应用于恒星光谱分类。该方法试图在两类样本之间找到一个最优分类面将两类分开。该方法具有较高的时间复杂度,计算效率有限。双支持向量机(TWSVM)的出现有效地解决了SVM面临的效率问题。该方法通过构造两个非平行的分类面将两类分开,每一类靠近某个分类面,而远离另一个分类面。TWSVM的计算效率较之传统SVM提高近4倍,因此,自TWSVM提出后便受到研究人员的持续关注。但上述方法在分类决策时,一方面没有考虑数据的分布特征,另一方面较易受噪声点和奇异点的影响,分类效率难以显著提升。鉴于此,在双支持向量机的基础上,提出融合数据分布特征的模糊双支持向量机(TWSVM-SDP)。该方法引入线性判别分析(LDA)的类间离散度和类内离散度,用以表征光谱数据的分布性状;引入模糊隶属度函数用以降低噪声点和奇异点对分类结果的影响。在SDSS DR8恒星光谱数据集上的比较实验表明,与支持向量机SVM、双支持向量机TWSVM等传统分类方法相比,融合数据分布特征的模糊双支持向量机TWSVM-SDP具有更优的分类能力。该方法亦存在一定的局限性,其中一大难题是其无法处理海量光谱数据。接下来将利用大数据处理技术,来对所提方法在大数据环境下的适应性展开进一步研究。  相似文献   

5.
提出了一种利用多光谱图像纹理特征进行大米分类的新方法。图像由MS3100-3CCD光谱成像仪获得,光谱成像仪提供3个波段的图像,由近红外(NIR)、红色(R)和绿色(G)组成,因此它能够获取普通数码照相机所不能获取的信息。对3CCD近红外波段图像进行二层小波包分解,得到16个子频带,因为纹理图像的特征信息主要集中在中频,因此提取8个中频频带(带通频带)的熵值,并且作为支持向量机的特征值输入。最后应用支持向量机技术分别对有和没有经过小波包分解的NIR波段纹理图像的熵值进行建模,建模样本和预测模型各为80个,每种各为20个。对四种大米进行处理,结果表明,经过小波包分解的纹理图像的识别率达到了100%,而没有经过小波包分解的纹理图像的识别率只有93.75%,说明结合小波包和支持向量机进行多光谱图像的纹理识别是种非常有效的技术,同时也为大米的分类提供一种快速和无损的新方法。  相似文献   

6.
支持向量机(support vector machine, SVM)具有良好的学习性能和泛化能力,因而被广泛应用于恒星光谱分类中。然而实际应用面临的数据规模往往很大,SVM便暴露出计算量大、分类速度慢等问题。为了解决上述问题,Jayadeva等提出双支持向量机(twin support vector machine, TWSVM),将计算时间减少至SVM的1/4。然后上述方法仅关注数据的全局特征,对每类数据的局部特征并未关注。鉴于此,提出基于流形模糊双支持向量机(manifold fuzzy twin support vector machine, MF-TSVM)的恒星光谱分类方法。利用流形判别分析获得数据的全局特征和局部特征,模糊隶属度函数的引入将各类数据区别对待,尽可能减少噪声点和奇异点对分类结果的影响。与C-SVM,KNN等传统分类方法在SDSS恒星光谱数据集上的比较实验表明了该方法的有效性。  相似文献   

7.
在大气环境中,采用激光诱导击穿光谱技术与支持向量机算法相结合,对来自不同厂家不同颜色的20种工业塑料进行分类研究。首先对分类结果有影响的实验参数进行优化,在最佳的实验参数条件下进行光谱采集,采用6条非金属元素特征谱线,有效缩短了训练支持向量机分类模型所需时间,从而提高了塑料的分类效率。实验结果表明,利用碳、氢、氧、氮等主量非金属元素对这些工业塑料样品进行分类,测试集1 000个光谱数据中有996个识别正确,算术平均识别精度达到99.6%。在选取较少的主量非金属特征谱线的情况下,结合采用支持向量机算法,可以实现激光诱导击穿光谱技术对更多类型的塑料制品快速、高精度分类,为激光诱导击穿光谱技术在实现塑料分类方面提供了数据参考。  相似文献   

8.
支持向量机(support vector machine, SVM)具有良好的学习性能和泛化能力, 因而被广泛应用于恒星光谱分类中。然而实际应用面临的数据规模往往很大, SVM便暴露出计算量大、分类速度慢等问题。为了解决上述问题, Jayadeva等提出双支持向量机(twin support vector machine, TWSVM), 将计算时间减少至SVM的1/4。然后上述方法仅关注数据的全局特征, 对每类数据的局部特征并未关注。鉴于此, 提出基于流形模糊双支持向量机(manifold fuzzy twin support vector machine, MF-TSVM)的恒星光谱分类方法。利用流形判别分析获得数据的全局特征和局部特征, 模糊隶属度函数的引入将各类数据区别对待, 尽可能减少噪声点和奇异点对分类结果的影响。与C-SVM, KNN等传统分类方法在SDSS恒星光谱数据集上的比较实验表明了该方法的有效性。  相似文献   

9.
恒星光谱分类是天文技术与方法领域一直关注的热点问题之一。随着观测设备持续运行和不断改进,人类获得的光谱数量与日俱增。这些海量光谱为人工处理带来了极大挑战。鉴于此,研究人员开始关注数据挖掘算法,并尝试对这些光谱进行数据挖掘。近年来,神经网络、自组织映射、关联规则等数据挖掘方法广泛应用于恒星光谱分类。在这些方法中,支持向量机(SVM)以其强大的学习能力和高效的分类性能而备受推崇。SVM的基本思想是试图在两类样本之间找到一个最优分类面将两类分开。SVM在求解时,通过将其最优化问题转化为具有(QP)形式的凸问题,进而得到全局最优解。尽管该方法在实际应用中表现优良,但为了进一步提高其分类能力,有的学者提出双支持向量机(TSVM)。该方法通过构造两个非平行的分类面将两类分开,每一类靠近某个分类面,而远离另一个分类面。TSVM的计算效率较之传统SVM提高近4倍,因此,自TSVM提出后便受到研究人员的持续关注,并出现若干改进算法。在恒星光谱分类中,一般分类算法都是根据历史观测光谱来建立分类模型,其中最关键的是对光谱进行人工标注,这项工作极为繁琐,且容易犯错。如何利用已标记的光谱以及部分无标签的光谱来建立分类模型显得尤为重要。因此,提出带无标签数据的双支持向量机(TSVMUD)用以实现对恒星光谱智能分类的目的。该方法首先将光谱分为训练数据集和测试数据集两部分;然后,在训练集上进行学习,得到分类依据;最后利用分类依据对测试集上的光谱进行验证。继承了双支持向量机的优势,更重要的是,在训练集上学习分类模型过程中,不仅考虑有标记的训练样本,也考虑部分未标记的样本。一方面提高了学习效率,另一方面得到更优的分类模型。在SDSS DR8恒星光谱数据集上的比较实验表明,与支持向量机SVM、双支持向量机TSVM以及K近邻(KNN)等传统分类方法相比,带无标签数据的双支持向量机TSVMUD具有更优的分类能力。然而,该方法亦存在一定的局限性,其中一大难题是其无法处理海量光谱数据。该工作将借鉴海量数据随机采样思想,利用大数据处理技术,来对所提方法在大数据环境下的适应性展开进一步研究。  相似文献   

10.
麦卢卡蜂蜜产自新西兰,具有很强的抗菌及抗氧化作用,其售价较高,近年来掺假事件时有发生,利用激光诱导荧光技术对掺杂糖浆的麦卢卡蜂蜜进行分类识别研究。选用266,355,405和450 nm四种常用激光作为激发源,选择三种品牌的新西兰进口麦卢卡蜂蜜(编号A,B,C)中掺杂烘焙糖浆作为实验样品,掺杂比例为0%~90%,间隔10%;每个激发波长下每种样本溶液重复测试60次,共7 200组数据。光谱数据首先进行荧光波段截取、平滑及归一化等预处理;然后随机选取80%的数据做训练集,20%的数据做测试集;对训练集数据使用主成分分析(PCA)结合线性判别分析(LDA)做数据降维;最后对降维后的数据分别建立K最近邻(KNN)和支持向量机(SVM)分类模型,对测试集数据进行分类识别,重复进行50次随机分组及分类识别后对得到的分类识别率求平均值及标准差。实验分析结果表明,激发光波长对最终识别结果影响较大,266 nm激发的荧光光谱分类识别正确率最高,三种麦卢卡蜂蜜掺杂溶液的分类识别率均能达到98.5%以上,最高能达100%;355和405 nm激发的分类识别效果次之,所有样品的分类识别率均大于92%;而450 nm激发的荧光光谱分类识别率最低,不同样品的分类识别率均低于66%。因此,后续分类算法的比较仅使用266,355和405 nm激发的荧光光谱数据,分析结果表明,KNN算法的分类效果要优于SVM算法,不同激发波长下三种蜂蜜掺杂溶液的分类识别率均是KNN算法更高,且对266 nm激发的三种蜂蜜掺杂样品,KNN算法的分类识别率比SVM算法要高1%以上。实验结果表明,使用激光诱导荧光技术对掺假麦卢卡蜂蜜进行分类识别是可行的,对于掺杂糖浆的麦卢卡蜂蜜,在使用的所有组合中,266 nm激发结合PCA-LDA降维和KNN分类算法的分类识别率最高,分类效果最好,可用于掺假麦卢卡蜂蜜的快速准确鉴别。  相似文献   

11.
通过对恒星光谱进行分析可以研究银河系的演化与结构等科学问题,光谱分类是恒星光谱分析的基本任务之一。提出了一种结合非参数回归与Adaboost对恒星光谱进行MK分类的方法,将恒星按光谱型和光度型进行分类,并识别其光谱型的次型。恒星光谱的光谱型及其次型代表了恒星的表面有效温度,而光度型则代表了恒星的发光强度。在同一种光谱型下,光度型反映了谱线形状细节的变化,因此光度型的分类必须在光谱型分类基础上进行。本文把光谱型的分类问题转化为对类别的回归问题,采用非参数回归方法进行恒星光谱型和光谱次型的分类;基于Adaboost方法组合一组K近邻分类器进行光度型分类,Adaboost将一组弱分类器加权组合产生一个强分类器,提升光度型的识别率。实验验证了所提出分类方法的有效性,光谱次型识别的精度达到0.22,光度型的分类正确率达到84%以上。实验还对比了两种KNN方法与Adaboost方法的光度型分类,结果表明,利用KNN方法对光度型分类精度低,而基于弱分类器KNN的Adaboost方法将识别率大幅提升。  相似文献   

12.
恒星光谱数据的自动识别与分类是现代巡天望远镜所产生的海量光谱数据处理的一项重要研究内容。针对流量未定标的低分辨率恒星光谱设计了一种有效的自动分类方案,实现恒星光谱的MK分类:光谱型及其次型分类,光度型分类。该方案由三部分实现:(1)连续谱归一化:基于小波技术提取低频信号逼近连续谱的方法;(2)七种光谱型及其次型的分类通过非参数回归方法实现。(3)光度型分类通过基于最近邻的χ2方法实现。实验结果表明该方案能够有效实现恒星光谱的MK分类,光谱型及其次型的分类精度为3.2个光谱次型,Ⅰ-Ⅴ光度型的正确识别率为60%, 次优统计率为78%。该方案训练速度快,方法实现容易,适用于海量恒星光谱自动分类处理系统。  相似文献   

13.
基于谱线特征匹配的恒星光谱自动识别方法   总被引:1,自引:0,他引:1  
我国正在实施的大型巡天项目(LAMOST项目),急需恒星光谱的自动识别系统。文章给出了一种基于谱线特征匹配的恒星光谱自动识别方法。该方法由以下主要步骤组成:(1) 利用小波变换的方法对观测光谱进行谱线特征提取;(2) 将提取出的特征和恒星谱线的特征模板进行相关匹配;(3) 根据相关匹配结果进行恒星光谱识别。通过对Sloan Digital Sky Survey (SDSS),Data Release Four (DR4)中的大量真实光谱数据实验表明,该方法具有对噪声鲁棒等特点,正确识别率高达96.7%。该方法可对相对定标的巡天光谱进行自动识别,符合LAMOST数据的要求,可为天文学家进行恒星和银河系的结构等研究提供帮助。  相似文献   

14.
高光谱图像和叶绿素含量的水稻纹枯病早期检测识别   总被引:1,自引:0,他引:1  
基于高光谱成像技术和化学计量方法,实现了对水稻纹枯病病害的早期检测识别。以幼苗时期的水稻植株为研究对象,对其进行纹枯病病菌侵染,获得染病植株,采集358~1 021 nm波段范围的高光谱图像,三次实验共240个样本,包括染病植株120个样本和健康植株120个样本。根据高光谱图像的光谱维,对染病水稻叶片和健康水稻叶片提取感兴趣区域(ROI),利用感兴趣区域的光谱数据,对其进行Savitzky-Golay(SG)平滑、Savitzky-Golay(SG)一阶求导、Savitzky-Golay(SG)二阶求导、变量标准化(SNV)和多元散射校正(MSC)预处理,建立线性判别分析(LDA)和支持向量机(SVM)分类模型,结果表明:采用SG二阶求导预处理后的线性判别分析(LDA)模型取得了较好的性能,正确识别率在建模集达98.3%,在预测集达95%;利用载荷系数法(x-loading weights, x-LW)对原始光谱和5种预处理的光谱数据进行特征波长提取,然后根据选取的特征波长建立线性判别分析(LDA)和支持向量机(SVM)分类模型,其中采用SG二阶求导预处理后提取的12个特征波长的线性判别分析(LDA)模型取得了较好的性能,其正确识别率在建模集达97.8%,在预测集达95%,而且基于载荷系数法建立的模型性能与全波段相当,可以通过载荷系数法减少数据量对水稻纹枯病病害进行识别;根据高光谱图像的图像维,研究了基于图像主成分分析、基于概率滤波和基于二阶概率滤波的图像特征提取方法,利用提取的特征变量建立反向传播神经网络(BPNN)和支持向量机(SVM)分类模型,其中基于图像主成分分析的反向传播神经网络(BPNN)模型取得了较好的性能,建模集准确识别率达90.6%,预测集的准确识别率达83.3%;根据高光谱图像光谱维和图像维的最优模型,特将叶绿素含量作为建模的另一个特征,分别与光谱特征、图像特征组合,建立反向传播神经网络(BPNN)和线性判别分析(LDA)模型,提出基于光谱特征加叶绿素含量、图像特征加叶绿素含量和光谱、图像特征加叶绿素含量三种组合方式,其中,光谱特征和图像特征分别与叶绿素组合的方式比之前单独的光谱和图像特征建模性能都有所提升,而且三种组合方式中光谱特征加叶绿素含量的反向传播神经网络(BPNN)建模方式取得本研究所有建模方式中较优的性能,其准确识别率在建模集达100%,在预测集达96.7%。以上研究表明,基于高光谱图像和叶绿素含量对水稻纹枯病病害进行早期识别是可行的,为水稻病害的早期识别提供了一种新方法。  相似文献   

15.
用于复杂光谱数据压缩的自适应小波算法   总被引:6,自引:0,他引:6       下载免费PDF全文
王凯  张会  常胜江  申金媛 《物理学报》2007,56(6):3613-3618
对于超短脉冲激光与气体相互作用产生的复杂光谱,提出了基于递归最小方差方法的自适应小波算法,实现了对该类光谱数据的高效压缩. 在对三种气体,共计27组光谱数据进行压缩后,数据由最初的3968个点被压缩成124个点,压缩比为32∶1. 选择其中13组作为样本送入支持向量机神经网络进行训练,用剩下的14组进行检验,正确率为100%. 关键词: 非线性荧光光谱 小波分析 递归最小方差算法 线性神经网络  相似文献   

16.
激光诱导击穿光谱(LIBS)是一种高效快速的光谱采集手段,可应用于各类物质的元素分析工作中。线性判别分析(LDA)与支持向量机(SVM)是化学计量学中两种常用的有监督算法,均通过对已知不同种类的样本数据进行学习建模,进而实现对未知类别数据的归类。为了实现LIBS技术对有机物的高准确率识别,将这两种算法应用到LIBS光谱数据的分类中。实验利用波长为1 064 nm的纳秒激光烧蚀女贞、珊瑚树、竹子三种植物的叶片,并采集每种树叶220~432 nm波段的100组光谱数据。通过对300组样本的原始光谱数据进行主成分提取,由第一主成分(PC1)和第二主成分(PC2)的得分图得出三种植物光谱的相似度非常高。然后,利用每种叶片70组样本的光谱数据作为训练集建模,其余30组光谱数据作为测试集来进行树叶种类的预测识别。将PCA对原始光谱数据提取得到的前20个主成分作为LDA与SVM建模的属性值。对于LDA算法,将属性值分析后得到前两个判别函数值,通过聚类分析发现不同种类的植物叶片光谱数据在空间上的分离效果较好,同一种类基本聚集在一起。再借助马氏距离可得到测试集的平均分类正确率为96.67%。与此类似,使用SVM方法对训练集样本的数据进行学习得到分类超平面,对测试集的平均分类正确率达到98.9%。研究结果表明,经过PCA对数据的预处理,再结合LDA,SVM这两种方法可实现LIBS技术应用于复杂有机物的快速准确分类,并且PCA与SVM结合的分类正确率更高。该方法可在食品快速溯源、生物组织原位鉴别、有机爆炸物远程分析等领域应用。  相似文献   

17.
模式识别技术及数据挖掘方法已成为化学计量学的研究热点。近红外(NIR)光谱分析以其快速、简便、非破坏性等优势广泛应用于光谱信号的处理和分析模型的建立。基于五种不同的模式识别方法:局部线性嵌入(LLE),小波变换(WT),主成分分析(PCA),偏最小二乘(PLS)和支持向量机(SVM),利用NIR技术建立了玉米种子的模式识别系统,并将其应用于108玉米杂交种和母本178种子的近红外光谱样品。首先利用LLE,WT,PCA,PLS进行消噪或降维,然后运用SVM进行分类识别,而一模支持向量机(1-normSVM)算法直接进行分类识别。三个不同NIR光谱范围的数值实验显示:PCA+SVM,LLE+SVM和PLS+SVM识别效果甚佳,而WT+SVM和1-norm SVM方法也有较高的分类精度。实验结果表明了本文提出方法的可行性和有效性,为利用近红外光谱和模式识别技术进行种子识别研究提供了理论依据和实用方法。  相似文献   

18.
基于NIR分析和模式识别技术的玉米种子识别系统   总被引:4,自引:0,他引:4  
模式识别技术及数据挖掘方法已成为化学计量学的研究热点。近红外(NIR)光谱分析以其快速、简便、非破坏性等优势广泛应用于光谱信号的处理和分析模型的建立。文章基于五种不同的模式识别方法:局部线性嵌入(LLE),小波变换(WT),主成分分析(PCA),偏最小二乘(PLS)和支持向量机(SVM),利用NIR技术建立了玉米种子的模式识别系统,并将其应用于108玉米杂交种和母本178种子的近红外光谱样品。首先利用LLE,WT,PCA,PLS进行消噪或降维,然后运用SVM进行分类识别,而一模支持向量机(1-norm SVM)算法直接进行分类识别。三个不同NIR光谱范围的数值实验显示:PCA+SVM,LLE+SVM,PLS+SVM识别效果甚佳,而WT+SVM和1-norm SVM方法也有较高的分类精度。实验结果表明了本文提出方法的可行性和有效性,为利用近红外光谱和模式识别技术进行种子识别研究提供了理论依据和实用方法。  相似文献   

19.
小麦是制作馒头的主要原料之一,小麦中水、蛋白质、淀粉会因产地以及烘干程度的差异而不同,进而影响到加工成馒头的品质。所以实现对小麦产地和烘干程度的快速鉴别就显得尤为重要。感官评定是鉴别小麦产地和烘干程度常用的方法,对比感官评定,光谱分析可以识别样品中的分子结构等信息。基于此,尝试利用近红外和中红外光谱融合技术实现对不同产地和不同烘干程度的小麦同时鉴别。首先选取了两个不同产地的小麦,再利用微波干燥法对两个不同产地的小麦做烘干预处理,使烘干的小麦水含量为12%±0.5%,原麦水含量为18%±0.5%。分别标记为原麦A,烘干A,原麦B,烘干B,再将小麦研磨成粉末,过100目筛网筛选后,置于自封袋中备用。随后分别采集四种小麦样品的近红外和中红外光谱信息,在Matlab 7.10的环境下使用标准正态变量变换(standard normal variable transformation, SNVT)对采集到的原始光谱数据进行预处理,利用主成分分析对预处理后的数据进行降维处理,再结合线性判别分析(linear discriminant analysis,LDA)和支持向量机(support vector machine, SVM)分别建立小麦近红外、中红外光谱数据识别模型。另外利用联合区间偏最小二乘法(synergy interval partial least square, SiPLS)筛选出利用标准正态变量变换(SNVT)预处理后的小麦近红外和中红外光谱数据特征光谱区间,将筛选出的近红外和中红外光谱数据特征光谱区间融合后再结合线性判别分析(LDA)和支持向量机(SVM)建立小麦融合光谱信息的识别模型。然后比较同种光谱数据下利用线性判别分析(LDA)和支持向量机(SVM)建立的小麦识别模型识别率、比较同种建模方法下近红外和中红外光谱数据建立小麦识别模型识别率、比较同种建模方法下光谱数据融合和单一光谱数据建立小麦识别模型识别率。结果表明,同种光谱分析方法,利用SVM建立的四种小麦识别模型识别率高于利用LDA建立的小麦识别模型识别率。同种建模方法,近红外光谱数据建立的小麦识别模型识别率优于中红外光谱数据建立的小麦识别模型识别率。而在同种建模方法下,利用SiPLS筛选出近红外和中红外光谱数据的特征光谱区间数据融合后建立小麦识别模型识别率最高,光谱数据融合后结合LDA建立的小麦识别模型校正集识别率为98.75%,预测集识别率为97.50%;而将此选择的变量结合SVM建立的小麦识别模型的校正集和预测集识别率都达到100.0%。对比利用单一光谱数据建立的小麦识别模型识别率,光谱数据融合之后建立的小麦识别模型识别率得到显著提高,该研究从纵向和横向上全面地比较了光谱数据建立的小麦模型识别率,结果可为更准确地运用光谱融合技术建立小麦产地以及烘干程度识别模型提供参考。  相似文献   

20.
对60种植物类中药提取物的红外光谱药性特征标记及其模式识别模型进行评价筛选。利用傅里叶变换红外光谱结合(linear discriminant analysis, LDA), (logistic discriminant analysis, Logistic-DA), (principal component analysis-linear discriminant analysis, PCA-LDA), (partial least-squares discriminant analysis, PLS-DA), (random forest, RF), (support vector machine, SVM)六种模式识别技术进行研究。水提取组采用加热回流提取1.5 h,无水乙醇、氯仿、石油醚提取组采用室温超声提取45 min。首先分别建立六种模式识别模型,然后采用四种统计方法综合识别,包括60味中药组内回代、60味中药10次迭代5折交叉验证、48味中药训练集、12味中药测试集。选取组内回代识别正确率、交叉验证识别正确率、组外预测正确率同时很高,且理论图谱反映寒热中药原始图谱分布特征者为适宜模型。LDA和SVM是水提取物红外光谱的适宜模式识别模型,LDA是无水乙醇提取物红外光谱的适宜模式识别模型,SVM是氯仿提取物红外光谱的适宜模式识别模型,石油醚提取识别效果不佳。结论:根据适宜识别模型,通过红外光谱数据可识别表征中药寒热成分和寒热程度的特征参数,寒热成分特征参数为与红外光谱吸收位置波谱相对应的识别模型的识别系数,识别系数大于零为寒性标记,识别系数小于零为热性标记;寒热程度特征参数为识别模型的识别得分,得分越大(正值)则寒性越强,得分越小(负值)则热性越强。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号