首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 234 毫秒
1.
随着天文大数据不断积累,我国大天区多目标光纤光谱望远镜LAMOST已完成6年的大规模巡天观测,获得DR5数据集已达到900多万条光谱,其中含有观测比例较低的早型恒星光谱,具备重要的研究价值。利用准确的恒星分类模板库可提升恒星的分类精度与可靠性,由于LAMOST第一年的巡天光谱中并没有完整覆盖B型恒星包含的所有子类型,造成后续观测数据分类的子类型范围受限。依据LAMOST已发布DR5数据中B型恒星光谱为研究对象,选取ELODIE发布的B型恒星实测光谱模板库来检测LAMOST在用的分类光谱。首先完成ELODIE发布37条B型光谱模板的相关性分析,去掉相关性弱的三条光谱后,筛选出ELODIE 34条B型恒星实测模板作为中心,通过计算LAMOST DR5发布的绝大多数被标记为B6型(7 662条)和B9型(3 969条)实测光谱的马氏距离,经有监督聚类LAMOST早型恒星光谱数据,标记13个子类型在涵盖B2-B9子类的34条ELODIE光谱模板中的分布。经线性分析判别每条谱线子类型的类内距离,确保波长覆盖范围和分辨率与LAMOST数据完全一致,去掉距离数值偏差较大的数据,计算相应子类的平均谱线,得到LAMOST源于DR5观测数据早型B型恒星的13条子类型光谱分类模板,为后期完善模板提供较好的参考性。  相似文献   

2.
随着天文大数据时代计算科学的蓬勃发展,我国具备自主知识产权的国际天文界口径最大、光谱获取率最高的大视场望远镜LAMOST,已率先在国际上开拓并实现了同时观测几千个天体光谱的大规模巡天工作。自2011年巡天至2015年6月所获得的DR3光谱数据集目前已获取世界上最大的恒星参数星表。针对LAMOST第三期发布FGK恒星光谱的流量定标等相关数据,利用Kurucz模板光谱对应的参数空间划分网格,基于开源高效的数据处理R语言程序软件平台,设计了有监督的聚类中心,便于验证其理论参数网格的差异。处理LAMOST实测光谱经归一化后,选择距离量直接描述属性,采用欧氏距离分析判别光谱之间的相似度,选取相应的属性向量构造函数判断观测光谱和理论光谱差别的量级。实验表明:比对LAMOST实测FGK型恒星光谱数据与Kurucz理论模板库数据一致性以及参数测量的准确性,结果显示相同参数的光谱间特征谱线具有较好的一致性,从而得出LAMOST光谱测量物理参数质量较高,具备极好的可靠性,为后续恒星大气模型的改进提供相应的论证依据。  相似文献   

3.
恒星光谱分类是天文数据处理中一项非常重要的工作,主要对海量光谱巡天数据按照其物理性质进行分类。利用残差分布度量的方法对LAMOST巡天中观测到的 M矮星光谱进行细分类研究。残差分布度量是一种光谱间的距离度量方法,计算光谱之间的距离时,先将两条光谱进行归一化处理,之后计算对应波长采样点处的残差,最终以残差分布的标准差作为光谱之间的距离。使用LAMOST DR2中释放的M矮星光谱进行细分类实验。实验结果表明,残差分布度量方法能比较准确地对M矮星光谱数据进行细分类。还研究了信噪比、离群点以及残差标准化系数等因素对分类结果的影响。  相似文献   

4.
基于K-均值聚类与夹角余弦法的多光谱分类算法   总被引:1,自引:0,他引:1  
近年来对高光谱与多光谱进行分类去混的研究方法很多,K-均值聚类算法与光谱相似度计算算法都属于成熟的分类算法.作者在对其研究基础上,将K-均值算法进行改进,并融入光谱相似度匹配算法,形成一种新的光谱分类算法,找出两条距离最远的光谱作为参考光谱,用欧氏距离法或夹角余弦法对数据立方体进行分类,并且从数据立方体中删除属于这两条谱线的其余谱线,同时找出与两条参考光谱距离最远或者夹角最大者作为第三条参考光谱,对剩余数据立方体进行新的分类,并在此算法上用多光谱数据立方体进行了试验验证.通过ENVI用K-均值(K-means)进行分类,与改进的K-means算法和夹角余弦法Matlab仿真结果进行比较,后两种对于两种气泡的分类效果都很好,对背景的分类改进的K-means算法效果较好,尤其是欧氏距离法能将背景完整地分离出来.  相似文献   

5.
基于谱线特征匹配的恒星光谱自动识别方法   总被引:1,自引:0,他引:1  
我国正在实施的大型巡天项目(LAMOST项目),急需恒星光谱的自动识别系统。文章给出了一种基于谱线特征匹配的恒星光谱自动识别方法。该方法由以下主要步骤组成:(1) 利用小波变换的方法对观测光谱进行谱线特征提取;(2) 将提取出的特征和恒星谱线的特征模板进行相关匹配;(3) 根据相关匹配结果进行恒星光谱识别。通过对Sloan Digital Sky Survey (SDSS),Data Release Four (DR4)中的大量真实光谱数据实验表明,该方法具有对噪声鲁棒等特点,正确识别率高达96.7%。该方法可对相对定标的巡天光谱进行自动识别,符合LAMOST数据的要求,可为天文学家进行恒星和银河系的结构等研究提供帮助。  相似文献   

6.
面向LAMOST的天体光谱离群数据挖掘系统研究   总被引:4,自引:3,他引:1  
在宇宙中寻求未知天体是人类探索宇宙奥妙所追求的目标之一,离群数据挖掘是发现未知天体光谱数据的一种有效途径。文章首先以VC++和Oracle9i为开发工具,设计与实现了面向LAMOST的恒星光谱离群数据挖掘系统,并给出了其软件体系结构和模块功能。其次,对基于中值滤波器的恒星光谱数据预处理、基于距离的恒星光谱数据聚类、基于距离支持度的恒星光谱数据离群数据挖掘、基于主分量分析法PCA的恒星光谱数据离群数据的三维可视化等主要关键技术进行了详细描述。最后,基于SDSS恒星光谱数据的运行结果表明,利用该系统寻找天体光谱离群数据是可行的,从而为寻找未知的、特殊的天体光谱数据提供了一种新途径。  相似文献   

7.
距离度量是光谱巡天数据处理中的一个重要研究内容,其定义了一种不同光谱间的距离计算方法,以此为基础可进行光谱的分类、聚类、参数测量及离群数据挖掘等工作。距离度量方法的好坏在一定程度上影响了分类、聚类、参数测量及离群数据挖掘的效果及性能,同时随着大规模恒星光谱巡天项目的开展,如何针对恒星光谱定义更为有效的距离度量方法成为其数据处理中一个非常关键的问题。基于此问题,在充分考虑到恒星光谱的特点及其数据特征的基础上,提出一种新的恒星光谱间的距离度量方法:残差分布距离。该距离度量有别于传统计算恒星光谱间距离计算方法,利用该方法计算恒星光谱间的距离时,首先将两条光谱归一化到同一尺度下,然后计算对应波长处的残差,以残差谱分布的标准差作为距离度量。该距离度量方法可用于恒星分类、聚类以及恒星大气物理参数测量等应用中。本文以恒星光谱细分类为例来比较检验该距离度量方法,结果表明该方法定义的距离在分类时能更为有效的刻画不同类别光谱间的差距,可以很好的用于相关应用中。同时还研究了信噪比对该距离度量方法的影响:残差分布距离一定程度上受光谱信噪比影响,信噪比越小,对距离的影响越大;在信噪比大于10之后,残差分布距离对分类的影响很小。  相似文献   

8.
大规模光谱巡天项目如LAMOST等产生了海量极具研究价值的观测数据,如何对此数量级的数据进行有效的分析是当前的一个研究热点。聚类算法是一类无监督的机器学习算法,可以在不依赖于领域知识的情况下对数据进行处理,发现其中的规律与结构。恒星光谱聚类是天文数据处理中一项非常重要的工作,主要对海量光谱巡天数据按照其物理及化学性质分类。针对LAMOST巡天中的早M型矮恒星的光谱数据,使用多种聚类算法如K-Means,Bisecting K-Means和OPTICS算法做了聚类分析,研究不同聚类算法在早M型恒星数据的表现。聚类算法在一定程度依赖于其使用的距离度量算法,同时研究了欧氏距离、曼哈顿距离、残差分布距离和上述三种聚类算法搭配下的表现。实验结果表明:(1)聚类算法可以很好地辅助分析早M型矮恒星的光谱数据,聚类产生的簇心数据和MK分类吻合得非常好。(2)三种不同聚类算法表现不尽相同,Bisecting K-Means在恒星光谱细分类方面更有优势。(3) 在聚类的同时也会产生一些数量较少的簇,从这些簇中可以发现一些稀有天体候选体,相对而言OPTICS适合用来寻找稀有天体候选体。  相似文献   

9.
SIMCA采用PCA模型参数和F检验构造计算T2i/T2uclSi/Q统计量作为样本分类的新属性,并计算待测样本到各类主成分空间的欧式距离作为判别类别的依据,是一种最常用和优秀的光谱分类方法。但是,在QT2作图平面上,以欧式距离确定的样本分布范围是一个圆,多数情况下并不一定能符合实际样本分布规律。本文在分析了SIMCA理论缺陷的基础上,提出了一种新方法,即用马氏距离代替欧氏距离作为判别依据来判断样本的类别。并设计了采用红外光谱判别组分比例很接近的掺假食用油样本的实验,以及用近红外光谱判别相近皮毛样本的实验。用调和比5%~8%的食用油红外光谱PCA模型,分别以马氏距离和欧式距离计算出其样本的分布范围,结果表明马氏距离的分类与识别能力更强。新方法和SIMCA对动物皮毛样本的正确识别率分别为87.5%和75%,对比例相近的食用油调和油的正确识别率分别为65%和55%。结果表明新方法对化学组成差异微小的样品分类精度明显优于SIMCA。  相似文献   

10.
基于纯牛奶、掺杂牛奶样品间二维红外相关谱欧氏距离,依据未知样品与校正集中“极值样品”欧氏距离平均值、组内、组间样品欧氏距离平均值,提出了一种掺杂牛奶判别的新方法。分别配置掺杂尿素牛奶(0.01~0.3 g·L-1)和掺杂三聚氰胺牛奶(0.01~0.3 g·L-1)样品各16个,采集纯牛奶及掺杂牛奶样品的红外光谱。以牛奶中掺杂物浓度为外扰,构建纯牛奶与掺杂牛奶的同步二维红外相关谱,并计算了各样品相关谱矩阵间的欧氏距离。在此基础上,分别建立掺杂尿素牛奶、掺杂三聚氰胺牛奶与纯牛奶的判别模型,确定模型中的“极值样品”,组内、组间样品欧氏距离平均值。利用所建模型,计算未知样品与“极值样品”的欧式距离,并依据判别规则,对未知样品进行判别。研究结果表明: 基于样品红外相关谱矩阵间欧氏距离可实现掺杂牛奶的判别,其判别正确率为100%,验证了该方法的有效性。该研究为掺杂牛奶的检测提供了一种新的可能方法。  相似文献   

11.
光谱的自动分析对大规模的光谱巡天有着非常重要的意义。文章提出了一种基于相似性度量的星系光谱红移测量方法。方法中采用主分量分析构造星系光谱的静止模板,利用谱线特征确定观测光谱的红移候选,然后根据红移候选进行观测光谱与模板光谱间的相似性度量,所采取的相似性度量策略类似于证据积累的思想,定义为几个相似证据的加权和,从而降低了观测光谱与模板光谱之间的误匹配,提高了红移估计的正确率。通过实验将所提出方法与基于谱线匹配的方法和传统的交叉相关方法进行了比较,实验结果表明:本文方法的正确率较之基于谱线匹配的方法和传统相关法有较大提高。  相似文献   

12.
一种基于光谱奇异值检测的高光谱遥感小目标探测方法   总被引:4,自引:1,他引:3  
高光谱遥感技术能够借助丰富的地物图像和光谱信息,反映目标地物与背景地物间的细微差异,从而将其区分开来。目前的小目标探测算法多侧重于从图像处理方面着手,文章则从光谱维数据分析的角度出发,利用光谱分析中的奇异值检测方法探测小目标,首先对关注区域的地物像元光谱进行连续统去除和正交变换等预处理;然后将每个像元的光谱对该区域平均光谱进行光谱匹配求其相似性,并实现高光谱数据降维;而后通过光谱角匹配值的马氏距离进行奇异值检测,将马氏距离大于自适应阈值的像元判定为小目标。该方法不需要任何先验信息,实验结果表明该方法运算量较小,运算速度快,并有较好的小目标探测准确度。  相似文献   

13.
主要研究了一种新的基于ELM算法的中低分辨光谱的恒星Mg元素丰度估计方法。大科学工程郭守敬望远镜(LAMOST)为我们提供了海量的中低分辨率的光谱,确定这些光谱的Mg元素丰度将有助于我们深入了解银河系的形成历史和演化过程。目前从中低分辨率光谱中确定Mg元素丰度的方法主要是模板匹配法,但该方法算法复杂,优化参数较为困难且对噪声敏感,因此有必要研究新的方法。实验结果显示,ELM算法对MILES光谱的Mg丰度的估计的精度为0.009 9(0.15)dex,而对信噪比大于50的LAMOST光谱的精度为0.002 7(0.11)dex。通过与其他算法进行对比,证实ELM算法是一种能精确估计中低分辨率光谱的Mg元素丰度的算法,能够应用于LAMOST后期的光谱数据中。  相似文献   

14.
自动测量LAMOST望远镜所产生的大量星系光谱红移,是LAMOST望远镜数据处理的关键。PCAZ的红移自动测量方法,只适用于红移值较小(一般情况不超过z<0.2)的情况,其原因是受到所应用构建正交模板的光谱模板范围的限制。文章突破了这一限制,针对LAMOST将产生的光谱的特点,作者改进了这套方法。应用该方法到具体的观测数据中,得到了准确率超过90%的红移值。该方法的红移测量极限依赖于模板的波长范围和待测光谱蓝端的信噪比,按照LAMOST的初步设计,对z<0.8红移,可进行准确测量。经过测量, 得出结论:(1)该方法适用于LAMOST的星系红移测量;(2)为实现巡天红移的测量,需要构造完备的不同星系的光谱模版(UV-IR);(3)蓝端信噪比大小影响对大红移的测量。  相似文献   

15.
This paper explored the relationship among genetic distances, NIR spectra distances and NIR-based identification model performance of the seeds of maize inbred lines. Using 3 groups (total 15 pairs) of maize inbred lines whose genetic distaches are different as experimental materials, we calculates the genetic distance between these seeds with SSR markers and uses Euclidean distance between distributed center points of maize NIR spectrum in the PCA space as the distances of NIR spectrum. BPR method is used to build identification model of inbred lines and the identification accuracy is used as a measure of model identification performance. The results showed that the correlation of genetic distance and spectra distancesis 0.9868, and it has a correlation of 0.9110 with the identification accuracy, which is highly correlated. This means near-Infrared spectrum of seedscan reflect genetic relationship of maize inbred lines. The smaller the genetic distance, the smaller the distance of spectrum, the poorer ability of model to identify. In practical application, near infrared spectrum analysis technology has the potential to be used to analyze maize inbred genetic relations, contributing much to genetic breeding, identification of species, purity sorting and so on. What's more, when creating a NIR-based identification model, the impact of the maize inbred lines which have closer genetic relationship should be fully considered.  相似文献   

16.
局部建模方法用于烟草样品的近红外光谱定量分析   总被引:1,自引:0,他引:1  
采用近红外光谱在主成分空间的距离作为样本相似性的判据,建立了一种用于近红外光谱定量分析的局部建模方法。该方法首先对校正集的光谱进行主成分分析(PCA),然后基于主成分空间中预测样本与校正集样本的距离选择校正子集并建立局部偏最小二乘(PLS)回归模型。对欧氏距离和马氏距离的比较表明,欧氏距离可以更好地表达样本之间的相似性。将所建立的方法用于烟草样品中氯和尼古丁含量的测定,结果表明局部建模方法比常用的全局建模方法具有更好的预测准确性,特别是在低含量成分的预测中具有明显优势。  相似文献   

17.
从玉米自交系种子的遗传距离、近红外光谱距离、品种鉴别模型性能三方面进行分析,探索三者间的关系。采用三组(共15对)遗传关系远近不同的玉米自交系种子作为实验材料,通过简单重复序列(simple sequence repeats, SSR)标记计算自交系种子间的遗传距离;种子的近红外光谱经预处理后降维到主成分分析(principal component analysis, PCA)空间中,计算各个自交系种子样本中心点之间的欧氏距离,作为对应的近红外光谱距离;使用仿生模式识别方法建立鉴别模型,用模型的鉴别正确率评价模型的性能。分析结果表明,自交系种子间遗传距离与近红外光谱距离相关性为0.986 8,与模型鉴别正确率的相关性为0.911 0,相关性显著。说明近红外光谱可以反映出玉米自交系种子之间的遗传关系,遗传关系的远近影响品种鉴别模型的性能,遗传距离越小,近红外光谱距离越小,模型鉴别能力也越差。实际应用中有望利用近红外光谱技术分析玉米自交系的遗传关系,对遗传育种、品种识别、纯度分选等具有重要意义;且建立品种鉴别模型时,应充分考虑遗传关系较近的玉米自交系对模型性能的影响。  相似文献   

18.
提出一种适用于在郭守敬望远镜海量光谱中自动、快速筛选激变变星的方法。利用已证认的激变变星光谱作为模板,通过随机森林分类训练,得到一个分类模型,该模型给出了各个波长对应流量的重要性排序,可根据该排序进行降维并用于激变变星判别,结果作为反馈进一步丰富模板库。实验中共发现了16个新的激变变星候选体,表明了该方法的可行性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号