首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 203 毫秒
1.
恒星大气物理参数的自动测量是大型巡天计划中海量光谱数据自动处理中的一个重要内容。首先使用多尺度Harr小波对恒星光谱数据进行特征分解,然后选用相应的小波系数作为光谱的特征向量,最后采用非参数回归算法对光谱的物理参数进行估计。研究表明,只需对光谱进行四层小波分解, 并选择第四层小波系数作为光谱的特征向量,即可获得重力加速度和表面有效温度的较好估计。对于化学丰度的估计,选择第一层小波系数作为光谱特征向量可取得较好效果。选用文献相关研究中常用的恒星大气模拟模型合成光谱库ELODIE中光谱数据测试了该方法的有效性。结果表明,基于Harr小波分解的光谱特征提取方法对恒星表面温度、表面重力和化学丰度等物理参数的估计具有较高的精度和鲁棒性。  相似文献   

2.
恒星大气物理参量(有效温度、表面重力、化学丰度)是导致恒星光谱差异的主要因素。恒星大气物理参量的自动测量是LAMOST等大规模巡天望远镜所产生的海量天体光谱数据自动处理中一个重要研究内容。文章采用两种非线性核回归方法对低分辨率恒星光谱进行3个物理参量的自动估计:核最小二乘回归(KLSR),核PCA回归(KPCR)。实验表明:(1)KLSR与KPCR可以实现光谱到表面有效温度和表面重力的回归,但是KLSR对噪声敏感,KPCR鲁棒性好于前者;(2)对于温度参数估计,两种算法具有相近的估计效果;对于表面重力和化学丰度估计,KPCR优于KLSR和非参数回归方法;(3)KLSR与KPCR方法实现容易,模型的训练速度快,运算复杂度小,适用于恒星光谱物理参量的自动测量。  相似文献   

3.
一种基于主分量分析的恒星光谱快速分类法   总被引:11,自引:2,他引:9  
恒星光谱分类是天体光谱自动识别中的重要组成部分。本文主要介绍一种实用的基于主分量分析(PCA)法对恒星光谱进行快速自动的分类方法。该方法在恒星的主分量空间中对样本点进行投影 ,并利用最近邻分类器进行分类 ,获得与恒星MK分类标准的光谱型基本一致的结果。本文的主要工作有 :(1 )利用PCA方法构造恒星光谱的特征矩阵 ,建构恒星的主分量空间 ;(2 )对恒星光谱进行主分量投影 ,对投影点进行光谱型和光度级的分类器设计 ,利用最近邻法分类 ,最后得出恒星的分类树。该分类法速度快 ,分类准确率较高 ,对目前许多大型光谱巡天计划所获得的大量光谱数据的处理有着重要的意义。  相似文献   

4.
近些年海量恒星光谱数据的获取使得恒星三个基本参数(表面有效温度Teff,表面重力log g,金属丰度[Fe/H])的自动测量方法研究成为一个重要的研究课题,相应对恒星大气物理参数测量的研究将对科学家研究宇宙演化等重大科学问题具有重要的意义。但是目前国内外针对此问题所做的研究并不是很广泛深入,且已有的一些方法还不能够完全准确地估计出恒星的大气物理参数。因此本文研究了一种基于质量估计的恒星大气物理参数自动测量方法,该方法计算量比较小,其主要思想是首先建立一些质量分布,将原始光谱数据经过质量估计算法映射到新的质量空间,然后在质量空间利用支持向量机回归对恒星的三个基本物理参数进行估计。在实验中,从SDSS-DR8光谱数据库中选择部分实测光谱数据来进行训练和测试,并将该方法预测出的参数结果与SSPP给出的参数值进行了对比,取得了比较理想的结果。实验结果表明, 该研究方法的准确率更高,预测结果更稳定,训练所用的时间短,在恒星大气物理参数自动测量上是行得通的,可以有效地测量恒星的大气物理参数。  相似文献   

5.
基于实测光谱的恒星大气物理参数估计是探索恒星本质的首要任务。随着郭守敬望远镜(LAMOST)进入正式巡天阶段,正以前所未有的速度获取海量的恒星实测光谱数据,这为星系研究带来了新的机遇和挑战。由于LAMOST是多目标光纤光谱天文望远镜,获取的光谱噪音比较大。光谱前期处理中的波长定标和流量定标精度不高,导致光谱存在微小畸变,这些都大大增加了恒星大气物理参数测量的难度。如何对LAMOST实测光谱的恒星大气物理参数进行自动测量是迫切期待需要研究的一个重要课题,关键是如何消除噪声,提高恒星大气物理参数的测量精度和鲁棒性。提出了一个测量LAMOST恒星光谱大气参数的回归模型(SVM(lasso))。基本思路是:首先使用Haar小波对光谱信号进行滤波,抑制光谱中噪声的不利影响,最大限度地保留光谱判别信息。然后采用lasso算法进行特征选择,选取与恒星大气物理参数相关性强的特征。最后将选择的光谱特征输入支持向量机回归模型对恒星大气物理参数进行估计,该模型对光谱畸变和噪音的容忍性比较好,提高了测量的精确度。为了验证上述方案的可行性,在33 963条LAMOST先导巡天恒星光谱库上作了实验研究,三个恒星大气物理参数的精度分别为log Teff:0.006 8dex,log g:0.1551dex,[Fe/H]:0.104 0dex。  相似文献   

6.
天体光谱处理中的一项基本任务是对大量的恒星光谱进行自动分类。到目前为止,恒星光谱的分类工作多是基于一维光谱数据。该研究打破传统的天体光谱数据处理流程,提出了基于二维恒星光谱分类的方法。在LAMOST(the large sky area multi-object fiber spectroscopic telescope)的数据处理流程中,所有的一维光谱都是由二维光谱抽谱、合并得来。二维光谱是由光谱仪产生的图像,包括蓝端图像和红端图像。基于LAMOST二维光谱数据,提出了特征融合卷积神经网络(FFCNN)分类模型,用于二维恒星光谱的分类。该模型是一个有监督的算法,通过两个CNN模型分别提取蓝端图像和红端图像的特征,然后将二者进行融合得到新的特征,再利用CNN对新特征进行分类。所使用的数据全部来源于LAMOST,我们在LMOST DR7中随机选择了一批源,然后获得了它们的二维光谱。一共有14 840根F,G和K型恒星的二维光谱用于FFCNN模型的训练,其中包括7 420根蓝端光谱和7 420根红端光谱。由于三类恒星光谱的数量并不均衡,在训练的过程中分别为每类恒星光谱设置了不同权重,防止模型出现分类失衡现象。同时,为了加快模型收敛,对二维光谱数据采用Z-score归一化处理。此外,为了充分利用所有样本,提高模型的可靠度,采用五折交叉验证的方法验证模型。3 710根二维光谱用作测试集,使用准确率、精确率、召回率和F1-score来对FFCNN模型的性能进行评价。实验结果显示,F,G和K型恒星的精确率分别达到87.6%,79.2%和88.5%,而且它们超过了一维光谱分类的结果。实验结果证明基于FFCNN的二维恒星光谱分类是一种有效的方法,它也为恒星光谱的处理提供了新的思路和方法。  相似文献   

7.
恒星光谱数据的分类是天体光谱自动识别的最基本任务之一,光谱分类的研究能够为恒星的演化提供线索。随着科技的发展,天文数据也向大数据时代迈进,需要处理的恒星光谱数量越来越多,如何对其进行自动而精准地分类成为了天文学家要解决的难题之一。当前恒星光谱自动分类问题的解决方法相对较少,为此本文使用了一种基于卷积神经网络的方法对恒星光谱MK系统进行分类。该网络由数据输入层、四个卷积层、四个池化层、全连接层、输出层构成,与传统网络相比具有局部感知、参数共享等优点实验。在Python3.5的环境下编程,利用Tensorflow构建了一个简单高效的具有四个卷积层的卷积神经网络,并将Dropout作用于全连接层之后以防止过度拟合。Dropout的基本思想:当网络模型进行训练时,把一些神经网络节点按一定的比例丢弃,使其暂时不发挥作用。Dropout可以理解成是一种十分高效的神经网络模型平均方法,由于它不依赖于某些局部特征所以能够让网络模型更加鲁棒。实验中使用的一维恒星光谱图是取自LAMOST DR3数据库,首先进行预处理截取光谱3 600~7 300 Å的部分,均匀采样后使用min-max标准化法对其进行初始化。实验包括两部分:第一部分为依据恒星光谱MK系统对光谱进行分类,每一类的训练样本包含1 000条光谱数据,测试样本为400条光谱数据,首先通过训练样本对CNN网络进行训练,进行3 000次的迭代,用训练后的网络将测试样本进行分类以验证网络的准确性;第二部分为相邻两类的恒星光谱的分类,其中O型星数据集样本为250条光谱,其余类别恒星样本数据集均为4 000条光谱,将数据5等分,每次选取当中的一份当作测试集,其余部分当作训练集,采用5折交叉验证法求得模型准确率,用BP神经网络进行对比实验。选择对网络模型进行评估的指标包括精确率P、召回率R、F-score、准确率A。实验结果显示CNN在对六类恒星光谱进行分类时其准确率都在95%以上,在对相邻类别的恒星进行分类时,由于O型星样本量较少,所以得到的分类结果不太理想,对其余类别的恒星分类准确率都高于98%,以上结果都证明了CNN算法能够很好地解决恒星光谱的分类问题。  相似文献   

8.
我国大科学工程项目LAMOST巡天计划每观测夜能获取多达数万条天体光谱数据,天文学家通过对天体光谱的分析观察可以获取有效的天文信息用于天文学或天体物理学的研究。而针对海量数据,寻找自动方法分析天体光谱并进行天体各种物理参数的测量就具有重要研究意义和价值。这一课题也吸引了许多学者进行研究,但目前所尝试的算法和相应结果仍然需要进一步改进,针对这一需求深入研究了核岭回归(KRR)方法在恒星大气物理参数(包括有效温度、表面重力和金属丰度)自动测量方面的应用,特别是在我国大科学工程项目LAMOST所释放光谱数据上的应用。核岭回归是岭回归算法的进一步发展,而岭回归是最小二乘方法的一种变形,其具有解决高维多重共线性问题的能力。所以KRR方法适合于处理高维的天体光谱信息,从LAMOST的第五期释放数据中随机选择了2万条被识别为恒星的光谱数据用于实验测试,该数据既包含低信噪比数据,也包含高信噪比数据(g,r,i波段平均信噪比最低至6.7,最高到793)。首先,本文对光谱进行预处理,包括三个步骤:(1)利用小波变换对光谱数据进行去噪处理;(2)因为LAMOST采用的是后期修正的流量定标设计,所以还通过流量归一化来避免部分光谱流量值不准确的问题;(3)由于每条光谱维数高达数千维,利用主成分分析方法(PCA)对光谱进行了降维。然后,利用KRR方法建立了光谱数据和标准化后的三大参数值之间的回归模型。最后,通过设计进行不同的组合实验对KRR算法模型进行了测试分析,并与经典算法支持向量回归(SVR)进行了对比。综合所有实验结果显示KRR方法对应的有效温度、表面重力和金属丰度的测试平均绝对误差分别为82.9897 K,0.1858 dex和0.1211 dex,优于SVR的144.2308 K,0.1886 dex和0.1246 dex。特别是KRR在温度测试结果上有较大优势,由此表明KRR方法能够有效地应用于天体光谱特别是恒星光谱参数的自动测量处理中。  相似文献   

9.
聚类分析是数据挖掘中用以发现数据分布和隐含模式的一种重要算法,能简单有效地研究大样本、多参量和类别未知的光谱数据。以线指数作为光谱数据的特征值能够在尽可能多的保留光谱物理特征的同时,有效解决高维光谱数据聚类分析中运算复杂度较高的问题。本文提出了基于线指数特征的海量恒星光谱数据聚类分析的方法,提取恒星光谱中的Lick线指数作为海量巡天光谱数据的特征,使用k均值聚类算法完成对光谱数据的聚类,然后对聚类结果进行有效的分析。实验结果证明该方法能够快速有效地将具有相似物理特征的恒星光谱数据聚集到一起,该方法可以应用到巡天数据的研究中。  相似文献   

10.
距离度量是光谱巡天数据处理中的一个重要研究内容,其定义了一种不同光谱间的距离计算方法,以此为基础可进行光谱的分类、聚类、参数测量及离群数据挖掘等工作。距离度量方法的好坏在一定程度上影响了分类、聚类、参数测量及离群数据挖掘的效果及性能,同时随着大规模恒星光谱巡天项目的开展,如何针对恒星光谱定义更为有效的距离度量方法成为其数据处理中一个非常关键的问题。基于此问题,在充分考虑到恒星光谱的特点及其数据特征的基础上,提出一种新的恒星光谱间的距离度量方法:残差分布距离。该距离度量有别于传统计算恒星光谱间距离计算方法,利用该方法计算恒星光谱间的距离时,首先将两条光谱归一化到同一尺度下,然后计算对应波长处的残差,以残差谱分布的标准差作为距离度量。该距离度量方法可用于恒星分类、聚类以及恒星大气物理参数测量等应用中。本文以恒星光谱细分类为例来比较检验该距离度量方法,结果表明该方法定义的距离在分类时能更为有效的刻画不同类别光谱间的差距,可以很好的用于相关应用中。同时还研究了信噪比对该距离度量方法的影响:残差分布距离一定程度上受光谱信噪比影响,信噪比越小,对距离的影响越大;在信噪比大于10之后,残差分布距离对分类的影响很小。  相似文献   

11.
恒星的连续谱是由于黑体辐射导致的光辐射强度随波长(频率)连续光滑变化的光谱。每条观测到的光谱数据中都会包含连续谱、谱线和噪声。恒星的分类主要是依据光谱的谱线、连续谱的相对强度以及光谱的其他特征。恒星连续谱的分布以及谱线的轮廓是由恒星大气内的物理因素决定的,也可以根据连续谱及谱线对恒星大气的物理参数进行估计。因而处理光谱的主要问题就是提取连续谱,并且通过归一化进行谱线的提取。恒星连续谱提取的算法主要有多项式逼近、中值滤波、形态滤波以及小波滤波等,但是这些方法对于低质量光谱处理的鲁棒性不是很好,因此有必要研究一种新的算法对低质量光谱的连续谱进行提取。在仔细分析恒星低质量连续谱的基础上,提出一种基于蒙特卡罗方法的低质量恒星连续谱拟合方法。该方法对恒星光谱筛选过程中不在范围内的点利用蒙特卡罗均匀分布进行自动插值,让每一个波长都对应一个流量点,然后对这些流量点进行低阶多项式迭代拟合,从而得到连续谱。为了验证算法对不同信噪比的低质量光谱连续谱提取的鲁棒性,利用不同的信噪比在原始光谱中加入不同的高斯白噪声对低质量光谱进行模拟。结果表明蒙特卡罗算法对不同信噪比的低质量光谱的拟合具有较高的精度与较强的鲁棒性。  相似文献   

12.
特殊恒星是金属丰度异常的恒星,其中包含的信息对于研究宇宙起源、太阳系的演变以及生命的演化都有着重要的意义。因此,特殊恒星的搜寻是国内外巡天项目中的重要目标。恒星光谱中包含着恒星的化学成分、物理性质以及运动状态等丰富的信息,它是开展恒星研究的重要依据。恒星的识别、分类以及特殊恒星的发现主要依据的是恒星光谱数据。随着LAMOST和SDSS等国内外大规模数字巡天项目的深入展开,恒星光谱的数据量达到了前所未有的高度,如此大的数据量为特殊恒星的发现提供了强有力的支撑。因此如何利用这些数据快速准确地发现特殊、稀少甚至于未知类型的恒星光谱是天文学研究的重要问题。数据挖掘是结合模式识别、机器学习、统计分析及相关专家背景知识,从数据中提取出隐含的过去未知的有价值的潜在信息的技术,其在处理大数据方面有着天然的优势,越来越多的数据挖掘方法被应用到巡天数据处理及分析之中。目前针对特殊恒星搜寻的数据挖掘算法主要包含随机森林、聚类分析以及异常值检测等,但随着巡天深度的拓展,观测的目标越来越暗,进而观测光谱的信噪比也随之变低。低信噪比光谱中存在着大量的无用信息,直接利用相关算法对其进行分析处理得到的结果往往存在很大的偏差。因此,如何从大量低信噪比恒星光谱巡天数据中有效地搜寻出特殊的恒星光谱,是当前面临的一个重要问题。由于低信噪比恒星光谱本身的特点,对于从中搜寻特殊恒星光谱的工作开展较少。为了解决此问题,在仔细研究光谱数据处理方法的基础上,针对低信噪比巡天数据中特殊恒星光谱的搜寻,提出了一种以主成分分析(PCA)和基于密度峰值聚类为基础的方法。该方法首先选取O,B,A,F,G,K和M各种类型的高信噪比恒星光谱,进行波长统一和流量插值后,利用主成分分析得到特征光谱;然后利用方差贡献率最大的前几个特征光谱对低信噪比的恒星光谱进行重构得到高信噪比的光谱;最后利用重构之后的高信噪比光谱进行聚类,聚类分析中得到的离群数据即为所要搜寻的特殊恒星光谱。在聚类时,考虑到恒星光谱数据本身的特点,采用了一种基于密度峰值的聚类方法来进行聚类及离群点的挖掘。实验表明,该方法能够在低信噪比的恒星光谱巡天数据中准确地搜寻出数量相对较少的特殊恒星。同时,也可应用于诸如LAMOST、SDSS等各种银河系巡天的光谱数据分析与挖掘中。  相似文献   

13.
针对稀疏表示高光谱检测算法性能受背景字典影响较大的问题,充分利用高光谱图像空间信息和光谱主成分信息,提出了一种基于字典学习的稀疏表示异常检测算法。首先利用主成分分析提取高光谱数据的主特征,建立目标主成分空间,并证明了在主成分空间进行字典学习稀疏重构的可行性;然后在主成分空间内构造基于K-SVD算法的训练字典,改善了背景字典性能;采用正交匹配算法重构主成分分量,利用主成分分析反变换得到待检测像元重构光谱,增强了高光谱图像的局部异常特性;最后,基于重构误差异常特性实现高光谱图像异常检测。仿真结果证明了该方法的有效性。  相似文献   

14.
随着天文大数据时代计算科学的蓬勃发展,我国具备自主知识产权的国际天文界口径最大、光谱获取率最高的大视场望远镜LAMOST,已率先在国际上开拓并实现了同时观测几千个天体光谱的大规模巡天工作。自2011年巡天至2015年6月所获得的DR3光谱数据集目前已获取世界上最大的恒星参数星表。针对LAMOST第三期发布FGK恒星光谱的流量定标等相关数据,利用Kurucz模板光谱对应的参数空间划分网格,基于开源高效的数据处理R语言程序软件平台,设计了有监督的聚类中心,便于验证其理论参数网格的差异。处理LAMOST实测光谱经归一化后,选择距离量直接描述属性,采用欧氏距离分析判别光谱之间的相似度,选取相应的属性向量构造函数判断观测光谱和理论光谱差别的量级。实验表明:比对LAMOST实测FGK型恒星光谱数据与Kurucz理论模板库数据一致性以及参数测量的准确性,结果显示相同参数的光谱间特征谱线具有较好的一致性,从而得出LAMOST光谱测量物理参数质量较高,具备极好的可靠性,为后续恒星大气模型的改进提供相应的论证依据。  相似文献   

15.
针对混合气体建模过程中最小二乘支持向量机参数难以确定及红外光谱数据计算量过大的问题,提出一种粒子群优化的最小二乘支持向量机方法,用于建立基于主成分分析特征提取的红外光谱多组分气体定量分析模型。首先对主吸收峰区域的550个红外光谱数据利用主成分分析技术进行了特征提取,将降维得到的7个特征值作为模型的输入变量从而有效地降低了计算量。混合气体主要由浓度范围分别是0.1%~1%的甲烷、乙烷及0.1%~1.5%的丙烷三种组分气体组成。采用最小二乘支持向量机技术分别建立了各组分气体的定量分析模型,利用粒子群优化算法对最小二乘支持向量机算法中的参数进行了优化选取,取代了传统的遍历优化方法,然后利用取得的最优参数重建定量分析模型。实验结果表明,采用此方法离线建模所用时间比采用遍历优化方法节省40倍以上,预测结果误差水平相当,满足实测要求。粒子群优化算法在全局优化及收敛速度方面具有较大优势。粒子群优化算法与最小二乘支持向量机技术相结合用于混合气体定量分析是切实可行的,具有一定的实际意义和应用价值。  相似文献   

16.
烤烟香型的判别一直是烟草行业的关注焦点。利用中红外和近红外光谱对189份不同香型的烟叶进行分析。分别从中红外谱图数据中提取21个特征波数处以及近红外谱图数据中13个特征波数处的吸光值作为影响因素。通过主成分分析方法分别对选取的中红外、近红外数据进行烟叶清香型、中间香型和浓香型三种香型风格的定性分析。结果表明基于中红外和近红外数据PCA投影图中三种香型混淆严重,区分界面不清晰。随后,将中红外、近红外数据进行融合,将提取的34个特征波数处的吸光值同时代入主成分分析, 得到基于中红外和近红外融合数据的PCA投影图。该投影图可以将不同香型的烟叶明显地区分出来。随后利用后退法和遗传算法对中红外和近红外融合后的34个吸光度值进行变量选择,后退法选择出了24个变量,遗传算法选择出了19个变量。对比34,24和19个变量的烟叶三种香型风格的主成分投影图,遗传算法虽然选择了比较少的变量,但其仍然可以将烟叶进行准确的分类。利用遗传算法对中红外和近红外融合后数据进行变量选择,剔除对烟叶香型分类影响小的因素。最后,利用支持向量机建立烟叶清香型、中间香型和浓香型分类判别模型。该模型的建模结果准确率为92.72%,其中清香型、中间香型和浓香型的准确率分别为93.75%,92.11%和91.84%。内部交叉验证留一法结果准确率为88.74%,其中清香型、中间香型和浓香型的准确率分别为90.63%,86.84%和87.76%。对未知样本预报结果的准确率为86.84%,其中清香型、中间香型和浓香型的准确率分别为88.24%,85.71%和85.71%。无论是建模结果、留一法结果和预报结果其准确率都大于85%。研究结果表明中红外和近红外数据融合可以提供更多的特征信息,利用这些信息可以建立烟叶香型风格的分类判别模型,为烟叶香型风格快速鉴别提供帮助。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号