首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 109 毫秒
1.
恒星大气物理参数(有效温度、表面重力、化学丰度)的自动测量是天体光谱数据自动处理中的一项重要内容。由于光谱数据的高维性的特点,处理运算量非常大,对于光谱的实时分析及处理会造成延误。文章提出了一种基于Lick线指数,利用核偏最小二乘回归(KPLSR) 对恒星大气物理参数进行测量的方法。可以有效地减少运算量并可达到理想的准确率。首先计算Kurucz合成光谱的Lick线指数,利用核偏最小二乘回归方法建立Lick线指数与大气物理参数之间的核回归模型,并利用DR8实测光谱数据对得到的模型进行测试,将测试的结果与SEGUE SSPP提供的大气物理参数进行了对比,取得了比较好的效果。此外,为了检验噪声对参数测量的影响,本文还对Kurucz光谱分别加了信噪比为10, 20, 30, 40, 50, 70, 90, 120的高斯白噪声,对得到的不同信噪比的Kurucz数据进行了测试,实验结果表明,核回归模型对噪声比较敏感,光谱数据的信噪比越高,其大气物理参数的预测精度越高。提出的基于线指数建立核偏最小二乘回归模型的方法运算量小,训练速度快,适合用于恒星大气物理参数的测量。  相似文献   

2.
恒星大气物理参数的自动测量是大型巡天计划中海量光谱数据自动处理中的一个重要内容。首先使用多尺度Harr小波对恒星光谱数据进行特征分解,然后选用相应的小波系数作为光谱的特征向量,最后采用非参数回归算法对光谱的物理参数进行估计。研究表明,只需对光谱进行四层小波分解, 并选择第四层小波系数作为光谱的特征向量,即可获得重力加速度和表面有效温度的较好估计。对于化学丰度的估计,选择第一层小波系数作为光谱特征向量可取得较好效果。选用文献相关研究中常用的恒星大气模拟模型合成光谱库ELODIE中光谱数据测试了该方法的有效性。结果表明,基于Harr小波分解的光谱特征提取方法对恒星表面温度、表面重力和化学丰度等物理参数的估计具有较高的精度和鲁棒性。  相似文献   

3.
我国大科学工程项目LAMOST巡天计划每观测夜能获取多达数万条天体光谱数据,天文学家通过对天体光谱的分析观察可以获取有效的天文信息用于天文学或天体物理学的研究。而针对海量数据,寻找自动方法分析天体光谱并进行天体各种物理参数的测量就具有重要研究意义和价值。这一课题也吸引了许多学者进行研究,但目前所尝试的算法和相应结果仍然需要进一步改进,针对这一需求深入研究了核岭回归(KRR)方法在恒星大气物理参数(包括有效温度、表面重力和金属丰度)自动测量方面的应用,特别是在我国大科学工程项目LAMOST所释放光谱数据上的应用。核岭回归是岭回归算法的进一步发展,而岭回归是最小二乘方法的一种变形,其具有解决高维多重共线性问题的能力。所以KRR方法适合于处理高维的天体光谱信息,从LAMOST的第五期释放数据中随机选择了2万条被识别为恒星的光谱数据用于实验测试,该数据既包含低信噪比数据,也包含高信噪比数据(g,r,i波段平均信噪比最低至6.7,最高到793)。首先,本文对光谱进行预处理,包括三个步骤:(1)利用小波变换对光谱数据进行去噪处理;(2)因为LAMOST采用的是后期修正的流量定标设计,所以还通过流量归一化来避免部分光谱流量值不准确的问题;(3)由于每条光谱维数高达数千维,利用主成分分析方法(PCA)对光谱进行了降维。然后,利用KRR方法建立了光谱数据和标准化后的三大参数值之间的回归模型。最后,通过设计进行不同的组合实验对KRR算法模型进行了测试分析,并与经典算法支持向量回归(SVR)进行了对比。综合所有实验结果显示KRR方法对应的有效温度、表面重力和金属丰度的测试平均绝对误差分别为82.9897 K,0.1858 dex和0.1211 dex,优于SVR的144.2308 K,0.1886 dex和0.1246 dex。特别是KRR在温度测试结果上有较大优势,由此表明KRR方法能够有效地应用于天体光谱特别是恒星光谱参数的自动测量处理中。  相似文献   

4.
近些年海量恒星光谱数据的获取使得恒星三个基本参数(表面有效温度Teff,表面重力log g,金属丰度[Fe/H])的自动测量方法研究成为一个重要的研究课题,相应对恒星大气物理参数测量的研究将对科学家研究宇宙演化等重大科学问题具有重要的意义。但是目前国内外针对此问题所做的研究并不是很广泛深入,且已有的一些方法还不能够完全准确地估计出恒星的大气物理参数。因此本文研究了一种基于质量估计的恒星大气物理参数自动测量方法,该方法计算量比较小,其主要思想是首先建立一些质量分布,将原始光谱数据经过质量估计算法映射到新的质量空间,然后在质量空间利用支持向量机回归对恒星的三个基本物理参数进行估计。在实验中,从SDSS-DR8光谱数据库中选择部分实测光谱数据来进行训练和测试,并将该方法预测出的参数结果与SSPP给出的参数值进行了对比,取得了比较理想的结果。实验结果表明, 该研究方法的准确率更高,预测结果更稳定,训练所用的时间短,在恒星大气物理参数自动测量上是行得通的,可以有效地测量恒星的大气物理参数。  相似文献   

5.
恒星表面有效温度是恒星的一个重要物理参量,是恒星光谱差异的重要因素。文章采用非参数估计算法对恒星表面温度进行估计。首先对历史光谱数据进行主成分分析(PCA)处理,再根据PCA特征数据与其表面温度的对应关系建立温度的估计模型,该模型是基于高斯核函数的。方法不依赖对光谱进行精确测量,就可以得到较高估计精度的温度值,对大样本光谱分析具有重要意义。  相似文献   

6.
基于实测光谱的恒星大气物理参数估计是探索恒星本质的首要任务。随着郭守敬望远镜(LAMOST)进入正式巡天阶段,正以前所未有的速度获取海量的恒星实测光谱数据,这为星系研究带来了新的机遇和挑战。由于LAMOST是多目标光纤光谱天文望远镜,获取的光谱噪音比较大。光谱前期处理中的波长定标和流量定标精度不高,导致光谱存在微小畸变,这些都大大增加了恒星大气物理参数测量的难度。如何对LAMOST实测光谱的恒星大气物理参数进行自动测量是迫切期待需要研究的一个重要课题,关键是如何消除噪声,提高恒星大气物理参数的测量精度和鲁棒性。提出了一个测量LAMOST恒星光谱大气参数的回归模型(SVM(lasso))。基本思路是:首先使用Haar小波对光谱信号进行滤波,抑制光谱中噪声的不利影响,最大限度地保留光谱判别信息。然后采用lasso算法进行特征选择,选取与恒星大气物理参数相关性强的特征。最后将选择的光谱特征输入支持向量机回归模型对恒星大气物理参数进行估计,该模型对光谱畸变和噪音的容忍性比较好,提高了测量的精确度。为了验证上述方案的可行性,在33 963条LAMOST先导巡天恒星光谱库上作了实验研究,三个恒星大气物理参数的精度分别为log Teff:0.006 8dex,log g:0.1551dex,[Fe/H]:0.104 0dex。  相似文献   

7.
提出一种基于BP神经网络及Ca线线指数估计恒星大气金属丰度的方法。该方法以从斯隆数字巡天SDSS中恒星光谱以及SSPP给出的参数作为训练样本,其中每条恒星光谱计算16个Ca线线指数,结合其他方法得到的表面有效温度Teff作为输入, 以SSPP得到的金属丰度[Fe/H]作为输出,对训练样本进行重采样后通过训练得到一个人工神经网络,通过该网络可以用来预测恒星光谱的[Fe/H]。通过相关实验表明,提出的方法能够准确而且有效的测量出恒星光谱的[Fe/H]。  相似文献   

8.
随着斯隆数字巡天项目(SDSS)、欧空局GAIA和我国大天区面积多目标光纤光谱天文望远镜(LAMOST)等项目的相继实施,拥有的恒星光谱数据量急速增加,由此导致基于光谱的恒星大气物理参数自动测量方法的研究成为天文光谱分析的重要课题之一[1]。探讨了恒星光谱特征提取的方法(Haar+lasso),其基本思想是首先使用Haar小波包对原始光谱进行多尺度分解,去除高频系数,选取低频系数作为光谱信息的描述;再采用lasso算法提取最优的特征; 最后将最优特征输入非参数回归模型中对恒星大气参数进行自动测量。Haar小波可以较好地去除原始光谱信号中的高频噪声,对全频谱数据进行降维。lasso算法可以进一步剔除数据冗余, 提取与物理参数相关度较强的特征。Haar+lasso方法提高了物理参数自动测量的准确性和运行效率。我们采用本文方案对SLOAN发布的40 000个恒星子样本的物理参数进行测量,三个物理参数的平均绝对误差为: log Teff: 0.007 1 dex,log g: 0.225 2 dex和[Fe/H]: 0.199 6 dex。同现有相关文献的实验结果相比,该方案可以获得更准确的物理参数。  相似文献   

9.
提出了一种新的恒星大气物理参数自动估计的新方案,并称之为SVR(Haar)。由于观测光谱受到大量宇宙辐射、大气和观测设备等引起的噪声干扰,且这种噪声干扰往往是其中的频率较高成分。所以该方案的基本思想是首先使用Haar小波剔除高频噪声成份,以提高恒星大气物理参数估计的准确性;然后使用支持向量机回归方法(SVR)对恒星参数做出估计,该方法能通过ε不敏感域进一步提高对光谱微小畸变和干扰的容许能力,增强解决方案的鲁棒性。为了验证SVR(Haar)方案的有效性,针对相关研究中的权威模拟恒星光谱和SLOAN发布的实测光谱,以及文献中的典型处理方法,做了大量比较实验。实验结果表明,所提出的SVR(Haar)恒星参数估计方案比文献中常用的主成分分析和非参数回归模型均要好。  相似文献   

10.
天文光谱线指数数据能够较好地保留着恒星的物理特征信息,为此借助线指数特征数据构建多参数模型,有利于更好地回归分析数据的共变关系及谱线的内在规律。世界上光谱获取率最高的施密特天文望远镜LAMOST发布的观测光谱都已经过标记,利用天文可视化工具分析这些标记的恒星光谱线指数会产生预测因子自相关,多元线性回归时因变量存在共线性,导致方差较大、得到最小二乘回归系数不稳定,虽不影响使用回归的有效性,但较难从回归方程中得到独立预测因子的评估系数。利用LAMOST巡天光谱数据中A型恒星Lick线指数为数据源,选取有效温度Teff为7 000~8 500 K,取信噪比大于50的光谱特征值实现回归分析恒星参数Teff值,经箱线图呈现DR5星表中,A型光谱86 097条具备Teff值大样本光谱数据的整体分布,统计分析26种线指数的特征值后,选取分布相似且带宽为12 Å的kp12,halpha12和hgamma12字段,减少解释线指数变量的数目,优化冗余变量方差膨胀因子(VIF)系数。实验选取两两变量间观测数据集,局部拟合回归散点、同样的数据源使用散点图的总体轮廓生成高密度散点图,利用色差透明性突出显示数据密集区域。结果表明多元线性回归和岭回归算法都能从低分辨率光谱中确定A型恒星的有效温度,但经过共线性数据分析有偏估计实验,使用岭回归分析寻找最佳模型,能更准确地确定恒星有效温度,进而得到预测A型恒星有效温度及谱线回归特性。  相似文献   

11.
距离度量是光谱巡天数据处理中的一个重要研究内容,其定义了一种不同光谱间的距离计算方法,以此为基础可进行光谱的分类、聚类、参数测量及离群数据挖掘等工作。距离度量方法的好坏在一定程度上影响了分类、聚类、参数测量及离群数据挖掘的效果及性能,同时随着大规模恒星光谱巡天项目的开展,如何针对恒星光谱定义更为有效的距离度量方法成为其数据处理中一个非常关键的问题。基于此问题,在充分考虑到恒星光谱的特点及其数据特征的基础上,提出一种新的恒星光谱间的距离度量方法:残差分布距离。该距离度量有别于传统计算恒星光谱间距离计算方法,利用该方法计算恒星光谱间的距离时,首先将两条光谱归一化到同一尺度下,然后计算对应波长处的残差,以残差谱分布的标准差作为距离度量。该距离度量方法可用于恒星分类、聚类以及恒星大气物理参数测量等应用中。本文以恒星光谱细分类为例来比较检验该距离度量方法,结果表明该方法定义的距离在分类时能更为有效的刻画不同类别光谱间的差距,可以很好的用于相关应用中。同时还研究了信噪比对该距离度量方法的影响:残差分布距离一定程度上受光谱信噪比影响,信噪比越小,对距离的影响越大;在信噪比大于10之后,残差分布距离对分类的影响很小。  相似文献   

12.
天体光谱中蕴含着非常丰富的天体物理信息,通过对光谱的分析,可以得到天体的物理信息、化学成分以及天体的大气参数等。随着LAMOST和SDSS等大规模巡天望远镜的实施,将会产生海量的光谱数据,尤其是LAMOST正式运行后,每个观测夜产生大约2~4万条光谱数据。如此海量的光谱数据对光谱的快速有效的处理提出了更高的要求。恒星光谱的自动分类是光谱处理的一项基本内容,该研究主要工作就是研究海量恒星光谱的自动分类技术。Lick线指数是在天体光谱上定义的一组用以描述光谱中谱线强度的标准指数,代表光谱的物理特性,以每个线指数最突出的吸收线命名,是一个相对较宽的光谱特征。研究了基于Lick线指数的贝叶斯光谱分类方法,对F,G,K三类恒星进行分类。首先,计算各类光谱的Lick线指数作为特征向量,然后利用贝叶斯分类算法对三类恒星进行分类。针对海量光谱的情况,基于Hadoop平台实现了Lick线指数的计算,以及利用贝叶斯决策进行光谱分类的方法。利用Hadoop HDFS高吞吐率和高容错性的特点,结合Hadoop MapReduce编程模型的并行优势,提高了对大规模光谱数据的分析和处理效率。该研究的创新点为:(1) 以Lick线指数作为特征,基于贝叶斯算法实现恒星光谱分类;(2) 基于Hadoop MapReduce分布式计算框架实现Lick线指数的并行计算以及贝叶斯分类过程的并行化。  相似文献   

13.
恒星光谱数据的自动识别与分类是现代巡天望远镜所产生的海量光谱数据处理的一项重要研究内容。针对流量未定标的低分辨率恒星光谱设计了一种有效的自动分类方案,实现恒星光谱的MK分类:光谱型及其次型分类,光度型分类。该方案由三部分实现:(1)连续谱归一化:基于小波技术提取低频信号逼近连续谱的方法;(2)七种光谱型及其次型的分类通过非参数回归方法实现。(3)光度型分类通过基于最近邻的χ2方法实现。实验结果表明该方案能够有效实现恒星光谱的MK分类,光谱型及其次型的分类精度为3.2个光谱次型,Ⅰ-Ⅴ光度型的正确识别率为60%, 次优统计率为78%。该方案训练速度快,方法实现容易,适用于海量恒星光谱自动分类处理系统。  相似文献   

14.
恒星光谱参数自动测量中不同模板匹配度量方法比较   总被引:1,自引:0,他引:1  
模板匹配方法是恒星光谱参数自动测量中常用的方法之一。对经常使用的三种模板匹配算法:K-最近邻算法(KNN)、卡方最小化算法和光谱相似度算法测量恒星光谱参数结果进行比较。首先对光谱进行连续谱归一化及流量归一化,然后对三种算法测量恒星光谱参数的结果进行比较。对SDSS DR8大样本数据的实验表明,光谱相似度算法在测量恒星光谱参数中有相对优势。  相似文献   

15.
基于小波降噪与支持向量机的恒星光谱识别研究   总被引:2,自引:2,他引:0  
提出了一种对恒星光谱识别的新方法。 根据恒星光谱数据的特性,我们以支持向量机为核心技术构建光谱识别器。 由于恒星光谱数据通常含有较高的噪声,如果直接进行分类,识别率往往较低。 因此作者首先采用小波分析的方法对原始光谱数据进行降噪预处理,提取光谱的特征,然后馈送到支持向量机完成对光谱数据的最终识别。 利用实际光谱数据(Jacoby, 1984)对所提出的技术进行检测,实验结果表明使用这种小波分析结合支持向量机的技术的识别效果要优于使用支持向量机结合主分量分析降维技术的识别方法。 另外,作者还比较了支持向量机与传统甄别分析的分类性能,对实际及合成光谱进行实验的结果显示了支持向量机的识别正确率不但优于常见的5种甄别分析方法的识别率,而且有较强的泛化能力。  相似文献   

16.
恒星光谱分类是天文学研究的一个热点问题。随着观测光谱数量的急剧增加,传统的人工分类无法满足实际需求,急需利用自动化技术,特别是数据挖掘算法来对恒星光谱进行自动分类。关联规则、神经网络、自组织网络等数据挖掘算法已广泛应用于恒星光谱分类。其中,支持向量机(SVM)分类能力突出,被广泛应用于恒星光谱分类。该方法试图在两类样本之间找到一个最优分类面将两类分开。该方法具有较高的时间复杂度,计算效率有限。双支持向量机(TWSVM)的出现有效地解决了SVM面临的效率问题。该方法通过构造两个非平行的分类面将两类分开,每一类靠近某个分类面,而远离另一个分类面。TWSVM的计算效率较之传统SVM提高近4倍,因此,自TWSVM提出后便受到研究人员的持续关注。但上述方法在分类决策时,一方面没有考虑数据的分布特征,另一方面较易受噪声点和奇异点的影响,分类效率难以显著提升。鉴于此,在双支持向量机的基础上,提出融合数据分布特征的模糊双支持向量机(TWSVM-SDP)。该方法引入线性判别分析(LDA)的类间离散度和类内离散度,用以表征光谱数据的分布性状;引入模糊隶属度函数用以降低噪声点和奇异点对分类结果的影响。在SDSS DR8恒星光谱数据集上的比较实验表明,与支持向量机SVM、双支持向量机TWSVM等传统分类方法相比,融合数据分布特征的模糊双支持向量机TWSVM-SDP具有更优的分类能力。该方法亦存在一定的局限性,其中一大难题是其无法处理海量光谱数据。接下来将利用大数据处理技术,来对所提方法在大数据环境下的适应性展开进一步研究。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号