首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于t-SNE的恒星光谱降维与分类研究
摘    要:随着天文学的发展以及天文望远镜观测能力的提升,国内外许多大型巡天望远镜将产生PB级的恒星光谱数据。恒星光谱是来自恒星的电磁辐射,通常由连续谱与吸收线叠加而成,其差异源于恒星的有效温度、表面重力加速度以及元素的化学丰度等。恒星光谱自动分类是天文数据处理的一项重要研究内容,是研究恒星演化和参数测量的基础。海量的恒星光谱对分类方法提出了高效、准确的要求。传统的人工分类方法存在速度慢、精度低等缺点,已经无法满足海量恒星光谱特别是低信噪比恒星光谱自动分类的实际需要,机器学习算法目前已经被广泛地应用于恒星光谱分类。恒星光谱的一个显著特征是数据维度较高,降维不但可以实现特征提取,而且可以降低计算量,是光谱分类的首要任务。传统的线性降维方法如主成分分析仅依据方差对光谱进行降维,不同类型的光谱在投影到低维特征空间后会出现交叉现象,而流形学习能够产生优良的分类边界,很好地避开重叠,有利于后续的分类。针对光谱数据维度较高的特点,研究了光谱数据在高维空间内的分布以及流形学习对高维线性数据降维的原理,比较了t-SNE和主成分分析两种降维方法对光谱数据降维的效果,并使用基于属性值相关距离的改进的K近邻算法进行光谱分类,最终对实验结果进行了分析并使用多种机器学习分类器进行比较和验证。采用Python语言及Scikit-learn第三方库实现了算法,对SDSS的12 000条低信噪比的恒星光谱进行实验,最终实现了光谱数据的高精度自动处理和分类。实验结果表明,对于光谱数据的降维处理,基于流形学习的t-SNE方法能够在高维光谱数据中恢复低维流形结构,即找出高维空间中的低维流形,并解出与之对应的嵌入映射,在降维过程中最大程度地保留不同类别光谱样本之间的差异从而产生明显的分类边界。特征提取后,使用机器学习分类器能够在测试数据集上达到满意的分类准确率。所使用的方法也可以应用于其他的巡天望远镜产生的海量光谱的自动分类以及稀少天体的数据挖掘。

本文献已被 CNKI 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号