首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 187 毫秒
1.
支持向量机(support vector machine, SVM)具有良好的学习性能和泛化能力, 因而被广泛应用于恒星光谱分类中。然而实际应用面临的数据规模往往很大, SVM便暴露出计算量大、分类速度慢等问题。为了解决上述问题, Jayadeva等提出双支持向量机(twin support vector machine, TWSVM), 将计算时间减少至SVM的1/4。然后上述方法仅关注数据的全局特征, 对每类数据的局部特征并未关注。鉴于此, 提出基于流形模糊双支持向量机(manifold fuzzy twin support vector machine, MF-TSVM)的恒星光谱分类方法。利用流形判别分析获得数据的全局特征和局部特征, 模糊隶属度函数的引入将各类数据区别对待, 尽可能减少噪声点和奇异点对分类结果的影响。与C-SVM, KNN等传统分类方法在SDSS恒星光谱数据集上的比较实验表明了该方法的有效性。  相似文献   

2.
恒星光谱分类是天文学研究的一个热点问题。随着观测光谱数量的急剧增加,传统的人工分类无法满足实际需求,急需利用自动化技术,特别是数据挖掘算法来对恒星光谱进行自动分类。关联规则、神经网络、自组织网络等数据挖掘算法已广泛应用于恒星光谱分类。其中,支持向量机(SVM)分类能力突出,被广泛应用于恒星光谱分类。该方法试图在两类样本之间找到一个最优分类面将两类分开。该方法具有较高的时间复杂度,计算效率有限。双支持向量机(TWSVM)的出现有效地解决了SVM面临的效率问题。该方法通过构造两个非平行的分类面将两类分开,每一类靠近某个分类面,而远离另一个分类面。TWSVM的计算效率较之传统SVM提高近4倍,因此,自TWSVM提出后便受到研究人员的持续关注。但上述方法在分类决策时,一方面没有考虑数据的分布特征,另一方面较易受噪声点和奇异点的影响,分类效率难以显著提升。鉴于此,在双支持向量机的基础上,提出融合数据分布特征的模糊双支持向量机(TWSVM-SDP)。该方法引入线性判别分析(LDA)的类间离散度和类内离散度,用以表征光谱数据的分布性状;引入模糊隶属度函数用以降低噪声点和奇异点对分类结果的影响。在SDSS DR8恒星光谱数据集上的比较实验表明,与支持向量机SVM、双支持向量机TWSVM等传统分类方法相比,融合数据分布特征的模糊双支持向量机TWSVM-SDP具有更优的分类能力。该方法亦存在一定的局限性,其中一大难题是其无法处理海量光谱数据。接下来将利用大数据处理技术,来对所提方法在大数据环境下的适应性展开进一步研究。  相似文献   

3.
基于高光谱图像技术的苹果粉质化LLE-SVM分类   总被引:3,自引:0,他引:3  
苹果粉质化程度是衡量其内部品质的一个重要因素,采用了高光谱散射图像技术进行苹果粉质化的无损检测。针对高光谱散射图像数据量大的特点,提出了局部线性嵌入(local linear embedded,LLE)和支持向量机(support vector machine,SVM)相结合的用于检测苹果粉质化的新分类方法。LLE是一种通过局部线性关系的联合来揭示全局非线性结构的非线性降维方法,能有效计算高维输入数据在低维空间的嵌入流形。对降维后的高光谱数据采用SVM进行分类。将LLE-SVM分类方法与传统的SVM分类方法比较,仿真结果表明,对高光谱数据而言,用LLE-SVM得到的训练精度高于单纯使用SVM的训练精度;降维前后,分类器的测试精度变化不大,波动范围不超过5%。LLE-SVM为高光谱散射图像技术进行苹果粉质化无损检测提供了一个有效的分类方法。  相似文献   

4.
流形判别分析和支持向量机的恒星光谱数据自动分类方法   总被引:1,自引:0,他引:1  
尽管经典的分类方法支持向量机SVM在天文学领域广泛应用,但其只考虑类间的绝对间隔而忽略类内的分布性状,因而分类性能有待于进一步提升。鉴于此,提出一种新颖的基于流形判别分析和支持向量机的恒星光谱数据自动分类方法。该方法引入流形判别分析的两个重要概念:基于流形的类内离散度MW和基于流形的类间离散度MB。所提方法找到的分类面同时保证MW最小且MB最大。可建立相应最优化问题,然后将原最优化问题转化为QP对偶形式求得支持向量和判别函数,最后利用判别函数判断测试样本的类属。该方法的最大优势在于进行分类决策时,不仅考虑样本的类间信息和分布特征,而且还保持了各类的局部流形结构。SDSS恒星光谱数据上的比较实验表明该方法的有效性。  相似文献   

5.
恒星光谱分类是天文技术与方法领域一直关注的热点问题之一。随着观测设备持续运行和不断改进,人类获得的光谱数量与日俱增。这些海量光谱为人工处理带来了极大挑战。鉴于此,研究人员开始关注数据挖掘算法,并尝试对这些光谱进行数据挖掘。近年来,神经网络、自组织映射、关联规则等数据挖掘方法广泛应用于恒星光谱分类。在这些方法中,支持向量机(SVM)以其强大的学习能力和高效的分类性能而备受推崇。SVM的基本思想是试图在两类样本之间找到一个最优分类面将两类分开。SVM在求解时,通过将其最优化问题转化为具有(QP)形式的凸问题,进而得到全局最优解。尽管该方法在实际应用中表现优良,但为了进一步提高其分类能力,有的学者提出双支持向量机(TSVM)。该方法通过构造两个非平行的分类面将两类分开,每一类靠近某个分类面,而远离另一个分类面。TSVM的计算效率较之传统SVM提高近4倍,因此,自TSVM提出后便受到研究人员的持续关注,并出现若干改进算法。在恒星光谱分类中,一般分类算法都是根据历史观测光谱来建立分类模型,其中最关键的是对光谱进行人工标注,这项工作极为繁琐,且容易犯错。如何利用已标记的光谱以及部分无标签的光谱来建立分类模型显得尤为重要。因此,提出带无标签数据的双支持向量机(TSVMUD)用以实现对恒星光谱智能分类的目的。该方法首先将光谱分为训练数据集和测试数据集两部分;然后,在训练集上进行学习,得到分类依据;最后利用分类依据对测试集上的光谱进行验证。继承了双支持向量机的优势,更重要的是,在训练集上学习分类模型过程中,不仅考虑有标记的训练样本,也考虑部分未标记的样本。一方面提高了学习效率,另一方面得到更优的分类模型。在SDSS DR8恒星光谱数据集上的比较实验表明,与支持向量机SVM、双支持向量机TSVM以及K近邻(KNN)等传统分类方法相比,带无标签数据的双支持向量机TSVMUD具有更优的分类能力。然而,该方法亦存在一定的局限性,其中一大难题是其无法处理海量光谱数据。该工作将借鉴海量数据随机采样思想,利用大数据处理技术,来对所提方法在大数据环境下的适应性展开进一步研究。  相似文献   

6.
恒星的分类对了解恒星和星系形成与演化历史具有重要的研究价值。面对大型巡天计划及由此产生的海量数据,如何迅速准确地将天体自动分类显得尤为重要。通过对SDSS DR9的恒星光谱数据进行深度置信神经网络(DBN)、神经网络和支持向量机(SVM)等算法分类的对比,分析三种自动光谱分类方法在恒星分类上的适用性。首先利用上述三种方法对K,F恒星进行识别分类,然后再分别对K1,K3和K5次型和F2,F5,F9次型识别,最后基于SVM支持向量机的二次分类模型,利用K次型的数据,构建剔除不属于K次型的模型。结果表明:深度置信网络对K,F型恒星分类效果较好,但是对K,F次型的分类效果不佳;SVM支持向量机在K,F型恒星分类以及相应的次型分类都具有较好的识别率,对K,F型分类效果要好于K,F次型的分类效果;BP神经网络对K,F型恒星以及其次型的识别一般;在剔除不属于K次型实验中,剔除率高达100%,可知SVM能够对未知的光谱数据进行筛选与分类。  相似文献   

7.
基于克隆选择支持向量机高光谱遥感影像分类技术   总被引:2,自引:0,他引:2  
作为支持向量机(support vector machine, SVM)高光谱影像分类的一个重要环节,参数设置的效率和精度直接影响到SVM模型训练效率和最终分类精度。本文首先建立一个SVM高光谱影像分类器,提出了利用免疫克隆选择算法优化的交叉验证进行核函数参数和惩罚因子C的优化选择的方法,得到了一种基于克隆选择优化的支持向量机(clonal selection SVM, CSSVM)高光谱影像分类器。然后将CSSVM与传统的基于网格搜索交叉验证的支持向量机(gird search SVM, GSSVM)分类器进行了对比评价,评价指标包括模型训练时间和分类精度等。最后基于AVIRIS高光谱遥感影像进行了两算法分类对比试验,结果表明:提出的CSSVM测试样本总分类精度超过85.1%和Kappa系数超过0.821 3,影像总分类精度超过81.58%和Kappa系数超过0.772 8,CSSVM与GSSVM的分类精度差别在0.08%以内,Kappa系数差别在0.001以内;CSSVM的模型训练时间是GSSVM的1/6至1/10,得到显著缩短;CSSVM方法在保持传统GSSVM优良分类精度的基础上,极大提高了模型的训练效率。  相似文献   

8.
基于小波降噪与支持向量机的恒星光谱识别研究   总被引:2,自引:2,他引:0  
提出了一种对恒星光谱识别的新方法。 根据恒星光谱数据的特性,我们以支持向量机为核心技术构建光谱识别器。 由于恒星光谱数据通常含有较高的噪声,如果直接进行分类,识别率往往较低。 因此作者首先采用小波分析的方法对原始光谱数据进行降噪预处理,提取光谱的特征,然后馈送到支持向量机完成对光谱数据的最终识别。 利用实际光谱数据(Jacoby, 1984)对所提出的技术进行检测,实验结果表明使用这种小波分析结合支持向量机的技术的识别效果要优于使用支持向量机结合主分量分析降维技术的识别方法。 另外,作者还比较了支持向量机与传统甄别分析的分类性能,对实际及合成光谱进行实验的结果显示了支持向量机的识别正确率不但优于常见的5种甄别分析方法的识别率,而且有较强的泛化能力。  相似文献   

9.
恒星光谱分类是恒星光谱分析的重要工作之一。我国大型巡天项目LAMOST能够获得海量的恒星光谱数据,为了对海量恒星光谱数据进行高效分类,特别是对恒星光谱子型数据进行分类,需要研究快速有效的恒星光谱自动分类算法。提出一种基于Transformer特征提取的混合深度学习算法Bert+svm(简记为Besvm)实现A型恒星光谱子型的自动分类。该算法将A型恒星光谱26个线指数作为输入特征,应用Bert模型对26个线指数进行更深层次的学习,通过学习26个线指数的内在关联,进而提取到更有利于A型恒星光谱子型分类的特征。提取好的新特征被输入到分类器算法支持向量机(简记为SVM)中,进而对A型恒星光谱的三个子型A1、 A2和A3进行自动分类。此前,SVM算法在恒星光谱分类任务中已经有过应用,一些衍生的SVM算法在恒星光谱分类任务中也有较高的分类正确率。相比从前应用到恒星光谱分类任务的SVM算法,我们的混合深度学习算法受数据的信噪比影响较小,使用低信噪比数据也能有较高的分类正确率,并且所用数据量较少。通过五组实验验证了该算法的有效性和优越性:实验1用来对比选择优秀的核函数,通过光谱数据的匹配实验,最终选择...  相似文献   

10.
油液光谱分析是研究综合传动运行状态的重要方法,文章以油液光谱分析数据为基础,运用支持向量机(support vector machine,SVM),建立了一种多输出最小二乘支持向量回归方法。利用多输出最小二乘支持向量回归方法对两台综合传动光谱油液分析数据进行了研究分析。研究表明,此方法得到的回归数据对1号综合传动试验数据具有良好的逼近效果,对2号综合传动油液光谱分析数据的预测具有较高的准确性。通过与2号综合传动试验数据的对比分析,发现了故障信息,并确定了故障部位。试验结果表明,该方法对于发现故障隐患,判断故障部位具有重要实际意义。  相似文献   

11.
支持向量机作为一种经典的分类方法被广泛应用于恒星光谱分类领域。该方法在实际应用中取得了较为理想的分类效果,但其面临无法解决多分类问题的挑战。在支持向量机的基础上,提出多类支持向量机,建立基于多类支持向量机的恒星光谱分类模型。该方法的最大优势是经过一次分类过程,可以确定多类样本的类属。SDSS DR8恒星光谱数据上的比较实验表明,本研究所提的方法较之已有多分类方法在分类性能上有一定的提升。  相似文献   

12.
基于模糊支持向量机的高光谱图像分类   总被引:1,自引:0,他引:1  
常规支持向量机应用到高光谱图像分类中有较好的分类效果,但它对训练样本内部的噪声和孤立点特别敏感,在一定程度上影响了支持向量机的分类性能,针对该问题,引入了模糊支持向量机(FSVM),并且利用灰色关联分析代替模糊隶属度的求解,将这种基于灰色关联分析的模糊支持向量机与一对多算法相结合,解决了多类高光谱图像分类问题。HYDICE高光谱图像分类结果表明,噪声和孤立点训练样本对支持向量机的影响得到了有效地抑制,相比于常规支持向量机方法,分类精度得到了明显的提高。  相似文献   

13.
为提高光谱伪装目标图像分类精度,提出了一种基于局部Gabor二进制模式(LGBP)的空间分类方法。LGBP作为一种多尺度算法,被用来提取高光谱图像的纹理特征。然后高光谱图像中的每一个像元可以用一个光谱特征向量及一个纹理特征向量表示。通过这种方法,增大类间距离。最后使用多核支持向量机结合光谱信息和空间纹理信息实现对高光谱伪装目标图像的分类。实验证明了该方法的有效性,分类总体精度和Kappa系数分别达到了95.6%和0.937。所提出的方法对于提高分类精度及鲁棒性具有重要意义。  相似文献   

14.
We use 343,747 sources from LAMOST DR5 to do star/galaxy/QSO classification with machine learning approaches. Specifically, the 312,767 spectral labeled stars (G, K, M, F, A) are used to do star classification. The photometry of u, g, r, i, z, J, and H are used as machine learning features. For star/galaxy/QSO classification, the k nearest neighbor algorithm (KNN), decision tree (DT), random forest (RF) and support vector machine (SVM) perform well. For star classification, the accuracy of RF and SVM classification are higher than the accuracy of KNN and DT. The area under receiver operating characteristic curves of the four models are approaching to 1. The accuracy, precision, recall, f_score, Matthews correlation coefficient are always greater than 0.5. The four models perform all right in predicting the nature of sources and the star label.  相似文献   

15.
刘建峰  淦燕 《应用声学》2016,24(3):231-233
针对传统SVM对噪声点和孤立点敏感的问题,以及不能解决样本特征规模大、含有异构信息、在特征空间中分布不平坦的问题,将模糊隶属度融入多核学习中,提出了一种模糊多核学习的方法。通过实验验证了模糊多核学习比传统SVM、模糊支持向量机以及多核学习具有更好的分类效果,从而验证了所提方法能够有效的克服传统SVM对噪声点敏感以及数据分布不平坦的问题。  相似文献   

16.
利用主成分分析方法结合支持向量机建立了太赫兹时域光谱冰片种类鉴别模型。冰片是一些常用中成药的重要成分,由于其来源多、真假易混淆,在制药和交易环节,迫切需要快速、简便、准确的检测、鉴别方法。太赫兹时域光谱技术是利用太赫兹脉冲表征物质性质的一种新兴光谱技术。实验使用透射式太赫兹时域光谱系统分别获得了艾片、合成冰片和梅片三种冰片在0.2~2 THz之间的吸收谱线。通过主成分分析,做出了第一、第二主成分二维得分图以及第一、二、三主成分三维得分图,两者对三种不同种类冰片都具有很好的聚类效果。用前十个主成分的得分值矩阵代替原光谱数据,通过对三种冰片的60组样本训练,对未知的60组样本鉴别,建立了四种不同核函数的支持向量机模型。对比结果表明,径向基核函数构建的支持向量机对三种冰片的分类鉴别准确率均为100%,由此我们确定选择具有径向基核函数的支持向量机建立冰片种类的鉴别模型。此外,在含噪情况下,四种核函数SVM获得的总分类准确率都在85%以上,说明支持向量机具有很强的泛化能力。主成分分析结合支持向量机方法对冰片太赫兹光谱具有很好的分类和鉴别效果,为冰片等中成药剂的种类鉴别提供了一种新思路。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号