首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 109 毫秒
1.
恒星光谱分类是天文学研究的一个热点问题。随着观测光谱数量的急剧增加,传统的人工分类无法满足实际需求,急需利用自动化技术,特别是数据挖掘算法来对恒星光谱进行自动分类。关联规则、神经网络、自组织网络等数据挖掘算法已广泛应用于恒星光谱分类。其中,支持向量机(SVM)分类能力突出,被广泛应用于恒星光谱分类。该方法试图在两类样本之间找到一个最优分类面将两类分开。该方法具有较高的时间复杂度,计算效率有限。双支持向量机(TWSVM)的出现有效地解决了SVM面临的效率问题。该方法通过构造两个非平行的分类面将两类分开,每一类靠近某个分类面,而远离另一个分类面。TWSVM的计算效率较之传统SVM提高近4倍,因此,自TWSVM提出后便受到研究人员的持续关注。但上述方法在分类决策时,一方面没有考虑数据的分布特征,另一方面较易受噪声点和奇异点的影响,分类效率难以显著提升。鉴于此,在双支持向量机的基础上,提出融合数据分布特征的模糊双支持向量机(TWSVM-SDP)。该方法引入线性判别分析(LDA)的类间离散度和类内离散度,用以表征光谱数据的分布性状;引入模糊隶属度函数用以降低噪声点和奇异点对分类结果的影响。在SDSS DR8恒星光谱数据集上的比较实验表明,与支持向量机SVM、双支持向量机TWSVM等传统分类方法相比,融合数据分布特征的模糊双支持向量机TWSVM-SDP具有更优的分类能力。该方法亦存在一定的局限性,其中一大难题是其无法处理海量光谱数据。接下来将利用大数据处理技术,来对所提方法在大数据环境下的适应性展开进一步研究。  相似文献   

2.
支持向量机(support vector machine, SVM)具有良好的学习性能和泛化能力, 因而被广泛应用于恒星光谱分类中。然而实际应用面临的数据规模往往很大, SVM便暴露出计算量大、分类速度慢等问题。为了解决上述问题, Jayadeva等提出双支持向量机(twin support vector machine, TWSVM), 将计算时间减少至SVM的1/4。然后上述方法仅关注数据的全局特征, 对每类数据的局部特征并未关注。鉴于此, 提出基于流形模糊双支持向量机(manifold fuzzy twin support vector machine, MF-TSVM)的恒星光谱分类方法。利用流形判别分析获得数据的全局特征和局部特征, 模糊隶属度函数的引入将各类数据区别对待, 尽可能减少噪声点和奇异点对分类结果的影响。与C-SVM, KNN等传统分类方法在SDSS恒星光谱数据集上的比较实验表明了该方法的有效性。  相似文献   

3.
支持向量机(support vector machine, SVM)具有良好的学习性能和泛化能力,因而被广泛应用于恒星光谱分类中。然而实际应用面临的数据规模往往很大,SVM便暴露出计算量大、分类速度慢等问题。为了解决上述问题,Jayadeva等提出双支持向量机(twin support vector machine, TWSVM),将计算时间减少至SVM的1/4。然后上述方法仅关注数据的全局特征,对每类数据的局部特征并未关注。鉴于此,提出基于流形模糊双支持向量机(manifold fuzzy twin support vector machine, MF-TSVM)的恒星光谱分类方法。利用流形判别分析获得数据的全局特征和局部特征,模糊隶属度函数的引入将各类数据区别对待,尽可能减少噪声点和奇异点对分类结果的影响。与C-SVM,KNN等传统分类方法在SDSS恒星光谱数据集上的比较实验表明了该方法的有效性。  相似文献   

4.
恒星的分类对了解恒星和星系形成与演化历史具有重要的研究价值。面对大型巡天计划及由此产生的海量数据,如何迅速准确地将天体自动分类显得尤为重要。通过对SDSS DR9的恒星光谱数据进行深度置信神经网络(DBN)、神经网络和支持向量机(SVM)等算法分类的对比,分析三种自动光谱分类方法在恒星分类上的适用性。首先利用上述三种方法对K,F恒星进行识别分类,然后再分别对K1,K3和K5次型和F2,F5,F9次型识别,最后基于SVM支持向量机的二次分类模型,利用K次型的数据,构建剔除不属于K次型的模型。结果表明:深度置信网络对K,F型恒星分类效果较好,但是对K,F次型的分类效果不佳;SVM支持向量机在K,F型恒星分类以及相应的次型分类都具有较好的识别率,对K,F型分类效果要好于K,F次型的分类效果;BP神经网络对K,F型恒星以及其次型的识别一般;在剔除不属于K次型实验中,剔除率高达100%,可知SVM能够对未知的光谱数据进行筛选与分类。  相似文献   

5.
恒星光谱分类是恒星光谱分析的重要工作之一。我国大型巡天项目LAMOST能够获得海量的恒星光谱数据,为了对海量恒星光谱数据进行高效分类,特别是对恒星光谱子型数据进行分类,需要研究快速有效的恒星光谱自动分类算法。提出一种基于Transformer特征提取的混合深度学习算法Bert+svm(简记为Besvm)实现A型恒星光谱子型的自动分类。该算法将A型恒星光谱26个线指数作为输入特征,应用Bert模型对26个线指数进行更深层次的学习,通过学习26个线指数的内在关联,进而提取到更有利于A型恒星光谱子型分类的特征。提取好的新特征被输入到分类器算法支持向量机(简记为SVM)中,进而对A型恒星光谱的三个子型A1、 A2和A3进行自动分类。此前,SVM算法在恒星光谱分类任务中已经有过应用,一些衍生的SVM算法在恒星光谱分类任务中也有较高的分类正确率。相比从前应用到恒星光谱分类任务的SVM算法,我们的混合深度学习算法受数据的信噪比影响较小,使用低信噪比数据也能有较高的分类正确率,并且所用数据量较少。通过五组实验验证了该算法的有效性和优越性:实验1用来对比选择优秀的核函数,通过光谱数据的匹配实验,最终选择...  相似文献   

6.
支持向量机作为一种经典的分类方法被广泛应用于恒星光谱分类领域。该方法在实际应用中取得了较为理想的分类效果,但其面临无法解决多分类问题的挑战。在支持向量机的基础上,提出多类支持向量机,建立基于多类支持向量机的恒星光谱分类模型。该方法的最大优势是经过一次分类过程,可以确定多类样本的类属。SDSS DR8恒星光谱数据上的比较实验表明,本研究所提的方法较之已有多分类方法在分类性能上有一定的提升。  相似文献   

7.
一种基于约束概念格的恒星光谱数据自动分类方法   总被引:1,自引:0,他引:1  
概念格是数据分析与知识提取的一种有效形式化工具,约束概念格是一种新的概念格结构,具有构造的时空复杂性低,所提取知识的实用性和针对性强等特点。针对海量恒星光谱自动分类任务,依据约束概念格结点外延与训练样本数据集等价划分之间的关系,通过引入外延支持度和划分支持度的概念,提出了一种基于约束概念格的恒星光谱数据分类规则挖掘方法,并采用SDSS恒星光谱数据集,实验验证了由该方法所提取出的分类规则具有较高的分类效率和分类正确率,从而为海量的恒星光谱数据自动分类提供了一种有效方法。  相似文献   

8.
流形判别分析和支持向量机的恒星光谱数据自动分类方法   总被引:1,自引:0,他引:1  
尽管经典的分类方法支持向量机SVM在天文学领域广泛应用,但其只考虑类间的绝对间隔而忽略类内的分布性状,因而分类性能有待于进一步提升。鉴于此,提出一种新颖的基于流形判别分析和支持向量机的恒星光谱数据自动分类方法。该方法引入流形判别分析的两个重要概念:基于流形的类内离散度MW和基于流形的类间离散度MB。所提方法找到的分类面同时保证MW最小且MB最大。可建立相应最优化问题,然后将原最优化问题转化为QP对偶形式求得支持向量和判别函数,最后利用判别函数判断测试样本的类属。该方法的最大优势在于进行分类决策时,不仅考虑样本的类间信息和分布特征,而且还保持了各类的局部流形结构。SDSS恒星光谱数据上的比较实验表明该方法的有效性。  相似文献   

9.
恒星光谱自动分类是研究恒星光谱的基础内容,快速、准确自动识别、分类恒星光谱可提高搜寻特殊天体速度,对天文学研究有重大意义。目前我国大型巡天项目LAMOST每年发布数百万条光谱数据,对海量恒星光谱进行快速、准确自动识别与分类研究已成为天文学大数据分析与处理领域的研究热点之一。针对恒星光谱自动分类问题,提出一种基于卷积神经网络(CNN)的K和F型恒星光谱分类方法,并与支持向量机(SVM)、误差反向传播算法(BP)对比,采用交叉验证方法验证分类器性能。与传统方法相比CNN具有权值共享,减少模型学习参数;可直接对训练数据自动进行特征提取等优点。实验采用Tensorflow深度学习框架,Python3.5编程环境。K和F恒星光谱数据集采用国家天文台提供的LAMOST DR3数据。截取每条光谱波长范围为3 500~7 500 部分,对光谱均匀采样生成数据集样本,采用min-max归一化方法对数据集样本进行归一化处理。CNN结构包括:输入层,卷积层C1,池化层S1,卷积层C2,池化层S2,卷积层C3,池化层S3,全连接层,输出层。输入层为一批K和F型恒星光谱相同的3 700个波长点处流量值。C1层设有10个大小为1×3步长为1的卷积核。S1层采用最大池化方法,采样窗口大小为1×2,无重叠采样,生成10张特征图,与C1层特征图数量相同,大小为C1层特征图的二分之一。C2层设有20个大小为1×2步长为1的卷积核,输出20张特征图。S2层对C2层20张特征图下采样输出20张特征图。C3层设有30个大小为1×3步长为1的卷积核,输出30张特征图。S3层对C3层30张特征图下采样输出30张特征图。全连接层神经元个数设置为50,每个神经元都与S3层的所有神经元连接。输出层神经元个数设置为2,输出分类结果。卷积层激活函数采用ReLU函数,输出层激活函数采用softmax函数。对比算法SVM类型为C-SVC,核函数采用径向基函数,BP算法设有3个隐藏层,每个隐藏层设有20,40和20个神经元。数据集分为训练数据和测试数据,将训练数据的40%,60%,80%和100%作为5个训练集,测试数据作为测试集。分别将5个训练集放入模型中训练,共迭代8 000次,每次训练好的模型用测试集进行验证。对比实验采用100%的训练数据作为训练集,测试数据作为测试集。采用精确率、召回率、F-score、准确率四个评价指标评价模型性能,对实验结果进行详细分析。分析结果表明CNN算法可对K和F型恒星光谱快速自动分类和筛选,训练集数据量越大,模型泛化能力越强,分类准确率越高。对比实验结果表明采用CNN算法对K和F型恒星光谱自动分类较传统机器学习SVM和BP算法自动分类准确率更高。  相似文献   

10.
基于支持向量机 (support vector machines, SVM) 算法采用激光诱导击穿光谱技术对11种塑料进行了识别. 每种塑料各采集100个光谱, 其中50个光谱作为训练集, 用于建立支持向量机模型, 剩下的50 个光谱作为测试集, 用于测试所建立支持向量机模型的识别精度. 结果表明测试集550个光谱中有543个光谱识别正确,算术平均识别精度达到了98.73%. 其中有6个聚氨酯 (PU) 光谱被误判为有机玻璃 (PMMA), 原因主要是受空气中氮气的影响, 使得有机玻璃和聚氨酯两种塑料在氮元素含量上的差异不能通过N I 746.87 nm, C-N(0,0) 388.3 nm两条谱线的强度准确表征. 本结果为LIBS技术塑料分类提供了方法和数据参考. 关键词: 支持向量机 激光诱导击穿光谱 塑料识别  相似文献   

11.
数据挖掘被广泛应用于恒星光谱分类。为了提高传统光谱分类方法性能,提出熵学习机(Entropy-based Learning Machine, ELM)。在该方法中,熵用来刻画分类的不确定性。为了得到理想的分类结果,分类的不确定性应最小,基于此,可得ELM的最优化问题。ELM在处理二分类问题和稀有光谱发现等方面具有一定优势。SDSS中K型、F型、G型恒星光谱数据集上的比较实验表明:ELM在进行恒星光谱分类时,其分类性能优于k近邻(k Nearest Neighbor)和支持向量机(Support Vector Machine)等传统分类方法。  相似文献   

12.
针对高速公路车辆换道问题, 提出一个多车道车辆换道模型。利用支持向量机(SVM)在多维特征下二分类问题的优势, 将SVM和Lagrange坐标下的高阶守恒模型(CHO)结合, 通过全离散跟车模型生成原始数据, 采用SMOTE(Synthetic Minority Oversampling Technique)算法对数据进行预处理, 采用双指标评估度SVM进行训练, 建立多车道车辆换道仿真模型。仿真结果表明: 基于支持向量机和CHO模型的换道模型, 驾驶车能够就当前的驾驶环境, 准确地作出决策, 有效地模拟高速公路上真实的多车道驾驶情况。  相似文献   

13.
Excitation-emission matrices (EEM) and total synchronous fluorescence spectra (SFS) of normal and malignant breast tissue specimens are measured in UV-VIS spectral region to serve as data inputs in development of Support Vector Machine (SVM) based breast cancer diagnostics tool. Various input data combinations are tested for classification accuracy using SVM prediction against histopathology findings to discover the best combination regarding diagnostics sensitivity and specificity. It is shown that with EEM data SVM provided 67?% sensitivity and 62?% specificity diagnostics. With SFS data SVM provided 100?% sensitivity and specificity for a several input data combinations. Among these combinations those that require minimal data inputs are identified.  相似文献   

14.
付蓉李洁  高新波 《光子学报》2014,39(6):1034-1039
为了解决海量极光图像手工分类效率低下的问题,提出一种静态极光图像自动分类系统,使用形态学成分分析将极光纹理从复杂背景中分离出来,从纹理中提取特征并利用支持向量机进行分类.实验结果表明:该算法分类正确率较之于传统方法均提高约10%,当分类器支持向量机+线性核函数时,分类速度最快,最适合于海量数据的处理.  相似文献   

15.
基于PCA和SVM的高光谱遥感图像分类研究   总被引:4,自引:0,他引:4  
支持向量机(SVM)是根据统计学习理论提出的新的研究方法,它在解决小样本、非线性及高维模式识别问题中表现出了许多特有的优势,在模式识别、函数逼近和概率密度估计等方面取得了良好的效果。由于高光谱图像波段数目多,各波段间具有较强的相关性,因此通过主成分分析(PCA)方法对高光谱数据进行预处理,达到了降维的目的,同时也去除了噪声波段。用支持向量机方法对高光谱遥感图像进行分类,可实现图像的分类识别。  相似文献   

16.
基于支持向量机的舰船图像识别   总被引:1,自引:1,他引:0  
支持向量机(SVM)是一种基于超平面分类的新的学习方法,具有很强的泛化能力。研究了支持向量机的学习机理,以及实现支持向量机的序贯最小优化算法(SMO),并用来对舰船图像进行识别。首先将待识别目标进行二维小波分解,获取不同尺度下的小波系数,然后对其进行主元分析,得到的主元分量作为支持向量机的特征量输入。实验结果表明,该方法具有良好的分类性能。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号