首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到15条相似文献,搜索用时 109 毫秒
1.
寻找特殊的、未知的天体是人类探索宇宙奥妙所追求的目标之一,天体光谱数据挖掘是实现该目标的一种有效方法.约束概念格是一种新的概念格结构,具有构造效率高、提取知识针对性和实用性强等特点.针对天体光谱数据在特征子空间中的局部偏离,采用VC++6.0和Oracle 9i作为开发工具,设计与实现了基于约束概念格的天体光谱局部离群数据挖掘系统,并对软件模块功能和体系结构,以及天体光谱数据预处理、约束概念格构造方法、基于链表结构的概念格构造、局部离群数据挖掘方法等关键技术进行了详细描述.运行结果表明,该系统实现天体光谱数据局部离群数据挖掘是可行的,有价值的,从而为寻找未知的、特殊的天体提供了一种新途径.  相似文献   

2.
大规模光谱巡天将产生海量的光谱数据,为搜寻一些奇异甚至于未知类型的光谱提供了机会,对这些特殊天体的研究有助于揭示宇宙的演变规律和生命起源,巡天数据的离群数据挖掘有助于这些特殊的光谱的发现。利用线指数对光谱数据进行降维能够在尽可能多的保留光谱物理特征的同时,有效解决高维光谱数据聚类分析中运算复杂度较高的问题。提出了基于线指数特征的海量恒星光谱离群数据挖掘及分析的方法,以恒星光谱的Lick线指数作为光谱数据的特征,利用聚类搜寻离群数据的方法在海量光谱巡天数据搜寻离群数据,以此为基础并给出线指数特征空间内离群光谱数据的分析方法。实验结果证明:(1)以线指数作为光谱的特征值能快速的完成对高维光谱数据的离群数据挖掘,可以解决高维光谱数据运算复杂度高的问题;(2)该方法是在聚类结果上进行的离群数据挖掘,能够有效的挖掘出数量较少的发射线恒星、晚M型恒星、极贫金属星、缺失数据光谱等数据;(3)线指数特征空间的离群数据挖掘可以得到线指数特征空间内特殊恒星的发现规则。本文所提出的基于线指数特征的离群数据挖掘及分析方法可以应用到巡天数据的相关研究中。  相似文献   

3.
由于人类对宇宙的认识有限,因此,如何通过对光谱数据分析发现一些新的、特殊的天体成为天文学家面临的重要课题。目前,常见特殊天体发现方法的基本思想是利用智能分类算法对离群数据进行分析。然而,当前主流分类算法大多对离群数据不敏感,分类性能甚至受离群点影响较大,因而无法完成特殊天体发现任务。鉴于此,提出基于模糊大间隔最小球分类模型的离群数据挖掘方法,该方法利用部分一般样本和离群样本建立最小球模型,并在此基础上引入模糊技术,通过降低噪声的权重,尽量减少噪声的影响。与C-SVM,SVDD,KNN等传统分类方法在SDSS恒星光谱数据集上的比较实验表明所提方法的有效性。  相似文献   

4.
探索海量的M型恒星中具有磁活动、巨星等较特殊、稀有的天体,对于后续观测、银河系结构、演化等科学研究具有重要的意义,针对M型恒星光谱特征线出现在子空间中的局部偏离,设计并实现了晚型恒星离群数据挖掘系统。首先采用稀疏因子和稀疏度系数度量样本在属性空间上的分布特征,并在此基础上对M型恒星光谱特征线进行离散化、降维等预处理,获得光谱子空间;然后采用微粒群算法搜索离群子空间,并证认子空间内光谱是否离群;此外,选择SDSS M型光谱特征线指数集为样本,实验分析了稀疏因子和稀疏度系数的设置对离群结果的影响,并将离群挖掘结果与SDSS提供光谱型等参数对照,表明利用该系统实现晚型恒星光谱特征线局部离群数据挖掘是可行并有价值的。  相似文献   

5.
特殊恒星是金属丰度异常的恒星,其中包含的信息对于研究宇宙起源、太阳系的演变以及生命的演化都有着重要的意义。因此,特殊恒星的搜寻是国内外巡天项目中的重要目标。恒星光谱中包含着恒星的化学成分、物理性质以及运动状态等丰富的信息,它是开展恒星研究的重要依据。恒星的识别、分类以及特殊恒星的发现主要依据的是恒星光谱数据。随着LAMOST和SDSS等国内外大规模数字巡天项目的深入展开,恒星光谱的数据量达到了前所未有的高度,如此大的数据量为特殊恒星的发现提供了强有力的支撑。因此如何利用这些数据快速准确地发现特殊、稀少甚至于未知类型的恒星光谱是天文学研究的重要问题。数据挖掘是结合模式识别、机器学习、统计分析及相关专家背景知识,从数据中提取出隐含的过去未知的有价值的潜在信息的技术,其在处理大数据方面有着天然的优势,越来越多的数据挖掘方法被应用到巡天数据处理及分析之中。目前针对特殊恒星搜寻的数据挖掘算法主要包含随机森林、聚类分析以及异常值检测等,但随着巡天深度的拓展,观测的目标越来越暗,进而观测光谱的信噪比也随之变低。低信噪比光谱中存在着大量的无用信息,直接利用相关算法对其进行分析处理得到的结果往往存在很大的偏差。因此,如何从大量低信噪比恒星光谱巡天数据中有效地搜寻出特殊的恒星光谱,是当前面临的一个重要问题。由于低信噪比恒星光谱本身的特点,对于从中搜寻特殊恒星光谱的工作开展较少。为了解决此问题,在仔细研究光谱数据处理方法的基础上,针对低信噪比巡天数据中特殊恒星光谱的搜寻,提出了一种以主成分分析(PCA)和基于密度峰值聚类为基础的方法。该方法首先选取O,B,A,F,G,K和M各种类型的高信噪比恒星光谱,进行波长统一和流量插值后,利用主成分分析得到特征光谱;然后利用方差贡献率最大的前几个特征光谱对低信噪比的恒星光谱进行重构得到高信噪比的光谱;最后利用重构之后的高信噪比光谱进行聚类,聚类分析中得到的离群数据即为所要搜寻的特殊恒星光谱。在聚类时,考虑到恒星光谱数据本身的特点,采用了一种基于密度峰值的聚类方法来进行聚类及离群点的挖掘。实验表明,该方法能够在低信噪比的恒星光谱巡天数据中准确地搜寻出数量相对较少的特殊恒星。同时,也可应用于诸如LAMOST、SDSS等各种银河系巡天的光谱数据分析与挖掘中。  相似文献   

6.
采用信息熵思想,给出一种基于属性权值和wk-距离的异常天体光谱特征线挖掘方法,并开发了天体光谱异常特征线挖掘系统。首先采用信息熵思想计算天体光谱特征线属性权值,从而有效地刻画每条特征线的重要程度;其次采用邻域半径的剪枝技术,对海量天体光谱特征线数据集约简,删除不可能成为异常的数据对象,形成一个候选异常数据集;然后根据离候选异常数据中对象之间的偏差,计算wk-距离和,并选取wk-距离和较大的前TOP-NN个数据对象作为天文光谱异常特征线数据;最后采用SDSS恒星光谱特征线数据集,实验和系统运行结果验证了该方法的有效性和可行性。  相似文献   

7.
基于谱线检测的发射线星自动识别方法   总被引:1,自引:0,他引:1  
刘中田  邱宽民  杨金福 《光学学报》2008,28(6):1101-1105
针对我国即将建成的大型巡天项目(LAMOST),给出了一种基于谱线检测的发射线星自动识别方法.主要步骤:1)通过获取谱线特征匹配值进行恒星谱线整体估计;2)利用提取出的恒星谱线特征检测恒星的巴耳末(Balmer)线;3)对获取的特征匹配值采用阈值法,并结合恒星Balmer线的检测结果,进行发射线里判别.通过对SDSS DR4所有光谱进行识别,共获得了242条具有恒星发射线的特殊天体.根据星表查询结果,这些天体包括发射线星、激变变星和一些未知特殊天体等.大量真实光谱数据实验表明,本文方法可有效识别发射线星.  相似文献   

8.
大规模光谱巡天项目如LAMOST等产生了海量极具研究价值的观测数据,如何对此数量级的数据进行有效的分析是当前的一个研究热点。聚类算法是一类无监督的机器学习算法,可以在不依赖于领域知识的情况下对数据进行处理,发现其中的规律与结构。恒星光谱聚类是天文数据处理中一项非常重要的工作,主要对海量光谱巡天数据按照其物理及化学性质分类。针对LAMOST巡天中的早M型矮恒星的光谱数据,使用多种聚类算法如K-Means,Bisecting K-Means和OPTICS算法做了聚类分析,研究不同聚类算法在早M型恒星数据的表现。聚类算法在一定程度依赖于其使用的距离度量算法,同时研究了欧氏距离、曼哈顿距离、残差分布距离和上述三种聚类算法搭配下的表现。实验结果表明:(1)聚类算法可以很好地辅助分析早M型矮恒星的光谱数据,聚类产生的簇心数据和MK分类吻合得非常好。(2)三种不同聚类算法表现不尽相同,Bisecting K-Means在恒星光谱细分类方面更有优势。(3)在聚类的同时也会产生一些数量较少的簇,从这些簇中可以发现一些稀有天体候选体,相对而言OPTICS适合用来寻找稀有天体候选体。  相似文献   

9.
基于支撑矢量机的天体光谱自动分类方法   总被引:3,自引:2,他引:1  
天体光谱自动识别系统的主要目标是对天体进行分类和参数测量。文章提出一种新的基于支撑矢量机的非活动天体与活动天体的自动分类方法。在信噪比低的时候 ,由于红移值未知使得噪声与发射谱线难于辨别 ,因此不能单纯依靠寻找发射谱线来确定是否为活动天体。据此 ,在低噪声情况下对非活动天体与活动天体的区分成为难点。本方法结合主分量分析法和支撑矢量机 ,能够对红移值未知的活动天体与非活动天体比较有效地进行自动光谱分类 ,对天文界的大型巡天计划中的海量观测数据自动处理有比较重要的应用价值。  相似文献   

10.
天体光谱包含着许多重要的关于天体的物理和化学信息,如天体表面的有效温度、重力加速度以及化学丰度等,天体光谱的处理和分析对天文研究具有重要的科学意义。一些大型巡天计划的实施(如SDSS,LAMOST等)使我们获得了海量的天文光谱数据,因此天文光谱数据的自动分类成为重要的科学研究课题,然而面对如此海量的光谱数据,一些传统的光谱自动分类方法已经不适用,迫切需要寻找高效率的光谱自动分类技术。研究了基于局部均值的K-近质心近邻(local mean-based K-nearest centroid neighbor,LMKNCN)算法在恒星(Star)、星系(Galaxy)和类星体(Quasar,QSO)的光谱分类中的应用。LMKNCN算法的基本思想是根据近质心近邻原则,从每一类训练样本集中为待测样本点选取k个近质心近邻点,然后根据每一类中所选取的k个近质心近邻点的均值点到待测样本点x的距离来判别x的所属类别。针对美国SDSS-DR8的天体光谱数据,对比了K-近邻、K-近质心近邻、LMKNCN三种算法在恒星、星系和类星体的光谱分类中所表现的性能,结果表明三种方法中,LMKNCN算法对这三种光谱的识别率高于其他两种算法或者与其相当,而且其平均分类正确率高于另外两种算法,特别是在类星体的识别率上表现的更好。表明了该算法对天文光谱大数据的快速处理和有效利用具有重要的意义。  相似文献   

11.
从海量天体光谱数据中挖掘光谱数据特征和物理化学性质之间内在的、隐含的相关性,是人类探索天文规律的一种有效方法。利用基于约束FP树的关联规则挖掘方法作为天体光谱数据相关性分析手段,采用VC 和Oracle9i作为开发工具,设计与实现了天体光谱数据相关性分析系统,给出了其系统的软件体系结构和模块功能,并对光谱数据预处理、背景知识表示、CFP树构造、频繁模式提取及关联规则生成等关键技术以及关键模块的实现技术,进行了详细描述。系统运行结果表明,利用关联规则来描述、分析天体光谱数据特征和物理化学性质之间存在的相关性,是可行的和有价值的,从而为寻找天体规律提供了一种有效手段。  相似文献   

12.
变星对人类研究宇宙的起源与发展具有重要意义,对于变星研究的困难首先源于对变星的筛选和识别,即如何从海量恒星光谱数据中有效识别变星光谱。传统的异常数据定义试图通过不同的方式寻找异常数据与一般模式之间的偏差,进而予以定量分析和筛选。然而,这种方法的时间复杂度过大,且结果存在不可理解和无法解释的问题。文章利用熵可以反映系统有序程度与稳定程度的特性,引入信息熵作为衡量数据集一般模式的标准,提出了基于信息熵的变星光谱快速识别方法。该方法显著降低了算法的时间复杂度,有效地消除了人为主观因素对识别结果的影响。采用国家天文台提供的Sloan数字巡天数据实验验证了该方法的可行性和有效性。  相似文献   

13.
多目标光纤光谱望远镜可以在一次观测中获得大量的不同天体的光谱数据。从天体探测到的光在通过光纤之后,再通过光谱仪狭缝,然后在CCD传感器中成像为二维光谱图;之后经过光纤光谱数据处理系统的一系列软件处理,最终输出可供天文界使用的一维光谱并存储起来。一维光谱是天文学家研究目标天体的主要手段,它是通过处理二维光谱图得到的。以LAMOST为例,望远镜系统在一次观测后首先会得到32幅由250条光纤光谱组成的二维光谱,然后经过一系列的处理得到一维光谱。在这个过程中,会有很多因素影响到最终一维光谱的精确度。比如由于望远镜使用时间的增加,某些元件会产生磨损、老化或变形,使得二维光谱中光纤形状会产生一定程度的弯曲,这种弯曲在二维光谱的两侧表现得尤为明显。在一幅常见的二维光谱中,纵坐标方向代表了抽取的一维光谱的波长方向,横坐标方向代表了抽取的一维光谱的流量方向,这种弯曲形变的产生会影响到之后的波长定标和流量定标,使得抽取的一维谱信息不准确。目前初步的解决办法是通过与定标灯谱的比对来尽量减少其影响。但这样不仅造成了时间和人力的浪费,而且准确率和效率不高。就这一现状,提出了一种基于曲线距离法的思想,将弯曲的二维谱线校直:首先采用灰度重心法将一幅二维光谱中的250条光纤中心轨迹进行定位,将异常点采用稳健的局部回归方法剔除;然后将中心轨迹进行曲线拟合,得到光纤中心轨迹的方程;通过模仿曲线变弯的逆过程,即保持轨迹上两点间的曲线距离不变,再将弯曲的光谱映射到竖直的法线上,完成校直过程。在整个过程中保持各个对应点的灰度值不变,通过边缘处理和插值运算解决产生的像素点稀疏问题。最后采用累加法进行一维谱抽取,并将校直后抽取的一维光谱与未校直抽取的一维光谱进行比对,比对后可发现校直前后在一维光谱的两端差别较大,其差值谱线也说明了这一点。该方法实现了二维光谱的自动校直,大大提高了抽取一维谱的效率和准确性。二维光谱的预处理和校直方法首先在LAMOST数据上进行验证,鉴于多目标光纤光谱望远镜系统原理的相似性,该处理方法也适用于其他的多目标光纤光谱望远镜系统,具有较好的参考和应用价值。  相似文献   

14.
卫星自主导航技术具有重要的军事价值。提出了一种基于焦平面的红外静态地球敏感器和可见光星敏感器的天文自主导航系统。详细论述了天文导航的原理,推导了地心矢量和地心距的解算公式,分析了影响地心矢量和地心距解算精度的因素,并给出了数值仿真的结果。结果表明该系统具有体积小、重量轻、功耗小、成本低和无转动部件等优点,适用于各种轨道航天器的姿态确定与轨道确定。  相似文献   

15.
基于相融性度量的光谱分类方法   总被引:2,自引:2,他引:0  
海量天体光谱的自动分类以及从海量天体光谱中发现新类型天体或新的天文规律(知识发现)已经受到天文工作者的普遍关注。在相关文献中这两方面的研究工作都是分别进行的。文章首先提出了一种相融性度量的概念,该度量能够刻画一个样本与训练样本集融合为一体的程度。然后,在此基础上给出了一种基于相融性度量的k-近邻分类方法。该方法不仅能够实现较准确的分类,而且还具有相当好的知识发现能力。通过对活动星系与活动星系核实验表明,该方法无论对分类还是对知识发现都是非常有效的。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号