首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 81 毫秒
1.
一种稳健的聚类方法   总被引:5,自引:0,他引:5  
本文讨论一种新的聚类方法 :属性均值聚类 .通过理论分析 ,属性均值聚类是比模糊均值聚类更稳健的聚类方法 .数值实验说明了该方法的有效性  相似文献   

2.
运用基于模糊一致矩阵元素与权重关系式的排序方法,建立了一个基于模糊一致矩阵法的优选炮兵阵地的数学模型,具有较强的可操作性,利于计算机实现,可为实现炮兵作战自动化指挥提供有力支持.  相似文献   

3.
传统的聚类方法由于无法提取样本和变量间的局部对应关系,并且当数据具有高维性和稀疏性时表现不佳,因此学者们提出了双向聚类,基于样本和变量间的局部关系,同时对样本和变量进行聚类,形成一系列子矩阵的聚类结果。近年来,双向聚类发展迅速,在基因分析、文本聚类、推荐系统等领域应用广泛。首先,对双向聚类方法进行梳理与归纳,重点阐述稀疏双向聚类、谱双向聚类和信息双向聚类三类方法,分析它们之间的区别和联系,并且介绍这三类方法在多源数据的整合分析、多层聚类、半监督学习以及集成学习上的发展现状和趋势;其次,重点介绍双向聚类在基因分析、文本聚类、推荐系统等领域的应用研究情况;最后,结合大数据时代的数据特征和双向聚类存在的问题,展望双向聚类未来的研究方向。  相似文献   

4.
在不同的实际问题中,往往视需要使用不同的准则对模式进行聚类。本文给出了一个聚类准则,并使用该准则用人工神经网络方法在计算机上进行了模拟。结果表明本文使用的聚类准则更适合于用人工神经网络实现,可以取得极好的聚类效果。  相似文献   

5.
Hierarchical hesitant fuzzy K-means clustering algorithm   总被引:1,自引:0,他引:1  
Due to the limitation and hesitation in one's knowledge, the membership degree of an element to a given set usually has a few different values, in which the conventional fuzzy sets are invalid. Hesitant fuzzy sets are a powerful tool to treat this case. The present paper focuses on investigating the clustering technique for hesitant fuzzy sets based on the K-means clustering algorithm which takes the results of hierarchical clustering as the initial clusters. Finally, two examples demonstrate the validity of our algorithm.  相似文献   

6.
硬聚类和模糊聚类的结合——双层FCM快速算法   总被引:3,自引:0,他引:3  
模糊c均值(FCM)聚类算法在模式识别领域中得到了广泛的应用,但FCM算法在大数据集的情况下需要大量的CPU时间,令用户感到十分不便,提高算法的速度是一个急待解决的问题。本文提出的双层FCM聚类算法是一种快速算法,它体现了硬聚类和模糊聚类的结合,以硬聚类的结果对模糊聚类的初始值进行指导,从而明显地缩短了迭代过程。双层FCM算法所用的CPU时间仅为FCM算法的十三分之一,因而具有很强的实用价值。  相似文献   

7.
对文[1]提出的聚类有效性函数HP(u,c)作了一定的理论分析,并就文[1]使用的数据及其他数据进行了计算机模拟。模拟结果显示:HP(u,c) 作为FCM算法的聚类有效性函数是不合适的。  相似文献   

8.
用于聚类有效性判定的包含度公式   总被引:16,自引:2,他引:14  
对基于模糊集合定义的若干包含度公式在聚类有效性方面的性质进行讨论 ,并对分类性能进行实验 ,筛选出两个有应用价值的包含度公式。  相似文献   

9.
《数理统计与管理》2019,(5):882-898
风靡世界的侦探小说《福尔摩斯探案集》的写作几乎贯穿作者柯南·道尔爵士的一生,但其写作风格并非一成不变。本文从《福尔摩斯探案集》本身出发,以57篇侦探故事为研究对象,构建词频、词长、单词数、标点出现频率等语言要素指标,利用文本聚类技术对柯南·道尔写作风格进行研究,从统计语言学的角度揭示了不同时期柯南·道尔写作风格的变化。研究结果表明,根据写作风格的不同,柯南·道尔的创作生涯大致可分为两个阶段,且风格的转变与其私人生活的变故、宗教信仰的转变等密切相关。社会大环境的变迁以及作家个人坎坷的人生路程,都是其写作风格发生变化的重要原因。在分析文学作品时,应该紧密联系作者当时所处的社会环境和个人经历,才能对作者有更深刻的理解。通过柯南·道尔作品的文本聚类后,我们对柯南·道尔的生平进行梳理,不难发现1893、1901、1907以及1926年这几个特殊时点可能是与道尔的人生轨迹由第一阶段转变到第二阶段有紧密联系的。  相似文献   

10.
目前模糊技术已经应用于许多智能系统,如模糊关系与模糊聚类.聚类是数据挖掘的重要任务,它将数据对像分成多个聚类,在同一个聚类中,对象的属性特征之间具有较高的相似度,有很大研究及应用价值.结合数据库中的挖掘技术,对属性特征为区间数的多属性决策问题,提出了一种基于区间数隶属度的区间模糊ISODATA动态聚类方法.  相似文献   

11.
针对一类具有不确定性区间数多指标信息的聚类分析问题,依据传统的基于数值信息的FCM聚类算法的思路,提出了一种新的聚类分析算法。章首先描述了具有区间数多指标信息的聚类分析问题;其次给出了基于区间数多指标信息的关于最优划分和最优聚类中心确定的两个定理;然后给出了基于区间数多指标信息的FCM聚类算法的计算步骤。该算法的特点是聚类中心的表现形式为精确的数值,给出的两个定理说明了该聚类算法的收敛性。最后,通过给出一个算例说明了本给出的聚类算法。  相似文献   

12.
This paper presents a fuzzy clustering algorithm, called the alternative fuzzy c-numbers (AFCN) clustering algorithm, for LR-type fuzzy numbers based on an exponential-type distance function. On the basis of the gross error sensitivity and influence function, this exponential-type distance is claimed to be robust with respect to noise and outliers. Hence, the AFCN clustering algorithm is more robust than the fuzzy c-numbers (FCN) clustering algorithm presented by Yang and Ko (Fuzzy Sets and Systems 84 (1996) 49). Some numerical experiments were performed to assess the performance of FCN and AFCN. Numerical results clearly indicate AFCN to be superior in performance to FCN. Finally, we apply the FCN and AFCN algorithms to real data. The experimental results show the superiority of AFCN in Taiwanese tea evaluation.  相似文献   

13.
The problem of Hybrid Linear Modeling (HLM) is to model and segment data using a mixture of affine subspaces. Different strategies have been proposed to solve this problem, however, rigorous analysis justifying their performance is missing. This paper suggests the Theoretical Spectral Curvature Clustering (TSCC) algorithm for solving the HLM problem and provides careful analysis to justify it. The TSCC algorithm is practically a combination of Govindu’s multi-way spectral clustering framework (CVPR 2005) and Ng et al.’s spectral clustering algorithm (NIPS 2001). The main result of this paper states that if the given data is sampled from a mixture of distributions concentrated around affine subspaces, then with high sampling probability the TSCC algorithm segments well the different underlying clusters. The goodness of clustering depends on the within-cluster errors, the between-clusters interaction, and a tuning parameter applied by TSCC. The proof also provides new insights for the analysis of Ng et al. (NIPS 2001). This work was supported by NSF grant #0612608.  相似文献   

14.
K-means聚类算法是在数据挖掘和数据分析中一种常用算法,但是其存在依赖初始值和易陷入局部最优值的缺陷,针对这些不足,本文提出一种闪电分叉过程算法优化的K-means聚类,克服聚类算法在初始值选择困难的问题,提高K-means聚类算法的求解精度,降低陷入局部最优的可能性。从UCI数据集中选取6个真实的数据集进行仿真实验,结果表明本文改进后的聚类算法有更好的求解精度和鲁棒性。  相似文献   

15.
土壤是一个多性状的连续体,其分类的首选方法是模糊聚类分析.但是模糊聚类分析中现有的基于模糊等价关系的动态聚类法和模糊c-均值法各有利弊,采用其中一种方法聚类肯定存在不足.为此集成两种聚类方法的优点,避其缺点,提出了用基于模糊等价关系的动态聚类方法和方差分析方法确定聚类数目和初始聚类中心,再用模糊c-均值法决定最终分类结果的集成算法,并将其应用到松花江流域土壤分类中,得到了较为切合实际的分类结果.  相似文献   

16.
基于加权相似性的BIRCH聚类算法   总被引:1,自引:0,他引:1  
BIRCH方法是一个集成的层次聚类方法.它克服了凝聚层次聚类方法所面临的两个难点:可伸缩性和不能撤销前一步工作的问题.基于BIRCH聚类的多阶段聚类算法思想,结合基于权重的欧式距离度量和基于划分的K-means算法,提出了一种基于加权相似性的BIRCH聚类方法,并将方法应用在时间序列的气象数据分析中.  相似文献   

17.
城市气温是对城市气候特性评价的一个重要指标.提出核概率聚类算法并将其应用于城市气温的模式分类中,以此寻找城市发展上的共同点.该算法在概率聚类算法上引入了核学习方法的思想,能够很好地处理噪音和孤立点,实现更为准确的聚类.实验结果表明,与相关聚类算法相比,核概率聚类算法聚类效果好,且算法能够很快地收敛.  相似文献   

18.
Clustering analysis plays an important role in the filed of data mining. Nowadays, hierarchical clustering technique is becoming one of the most widely used clustering techniques. However, for most algorithms of hierarchical clustering technique, the requirements of high execution efficiency and high accuracy of clustering result cannot be met at the same time. After analyzing the advantages and disadvantages of the hierarchical algorithms, the paper puts forward a two-stage clustering algorithm, named Chameleon Based on Clustering Feature Tree (CBCFT), which hybridizes the Clustering Tree of algorithm BIRCH with algorithm CHAMELEON. By calculating the time complexity of CBCFT, the paper argues that the time complexity of CBCFT increases linearly with the number of data. By experimenting on sample data set, this paper demonstrates that CBCFT is able to identify clusters with large variance in size and shape and is robust to outliers. Moreover, the result of CBCFT is as similar as that of CHAMELEON, but CBCFT overcomes the shortcoming of the low execution efficiency of CHAMELEON. Although the execution time of CBCFT is longer than BIRCH, the clustering result of CBCFT is much satisfactory than that of BIRCH. Finally, through a case of customer segmentation of Chinese Petroleum Corp. HUBEI branch; the paper demonstrates that the clustering result of the case is meaningful and useful. The research is partially supported by National Natural Science Foundation of China (grants #70372049 and #70121001).  相似文献   

19.
本文提出一种新的聚类算法-基于模糊的投影寻踪算法,可以有效的处理医学中常常遇到的高维混合数据的模糊聚类问题.并将其应用在慢性肾衰的辩证分析问题中,为已有的慢性肾衰证候的分型标准提供科学支持.本文的研究方法为中医辩证的现代化研究开拓了新的思路,值得进一步深入探讨。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号