首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 46 毫秒
1.
基于核函数的混合C均值聚类算法   总被引:2,自引:0,他引:2  
提出了一种基于核函数的混合C均值聚类算法.首先利用模糊C均值聚类算法和另一种类型的可能性C均值聚类算法的优点,设计出一种混合C均值聚类算法.然而鉴于该算法存在的不足,本文将Mercer核函数引入到该算法中,仿真实验结果证实了该方法的可行性和有效性.  相似文献   

2.
土壤是一个多性状的连续体,其分类的首选方法是模糊聚类分析.但是模糊聚类分析中现有的基于模糊等价关系的动态聚类法和模糊c-均值法各有利弊,采用其中一种方法聚类肯定存在不足.为此集成两种聚类方法的优点,避其缺点,提出了用基于模糊等价关系的动态聚类方法和方差分析方法确定聚类数目和初始聚类中心,再用模糊c-均值法决定最终分类结果的集成算法,并将其应用到松花江流域土壤分类中,得到了较为切合实际的分类结果.  相似文献   

3.
针对评估指标的重要性不一,且存在冗余问题,基于粗集可辨识矩阵,提出了一种计算指标属性重要度和约简的有效、简便算法,对样本信息进行约简,并计算约简后各指标的权重.其中,针对连续属性值离散化过程可能造成信息损失问题,采用了模糊C均值聚类算法离散化连续属性值.最后,建立了基于粗糙集和模糊C均值聚类的空战效能评估模型,并通过实例验证了该模型的可行性和有效性.  相似文献   

4.
针对传统k-均值聚类算法事先必须获知类别数和难以确定初始聚类中心的缺点,建立了关于聚类中心和类别数k的双层规划模型,结合粒子群算法确定出聚类中心,通过在迭代过程中不断更新准则函数的方法搜索并确定出最佳类别数惫,基于所建模型,提出了一种改进的k-均值聚类算法,并将算法应用于冰脊表面形态分析中.结果表明,算法得到的聚类结果不但具有相邻类别边界清晰的优点,而且能够较好地反映出地理位置和生长环境对冰脊形成的影响.  相似文献   

5.
针对传统k-均值聚类算法事先必须获知类别数和难以确定初始聚类中心的缺点,建立了关于聚类中心和类别数k的双层规划模型,结合粒子群算法确定出聚类中心,通过在迭代过程中不断更新准则函数的方法搜索并确定出最佳类别数惫,基于所建模型,提出了一种改进的k-均值聚类算法,并将算法应用于冰脊表面形态分析中.结果表明,算法得到的聚类结果不但具有相邻类别边界清晰的优点,而且能够较好地反映出地理位置和生长环境对冰脊形成的影响.  相似文献   

6.
加权模糊C-均值聚类   总被引:4,自引:0,他引:4  
将经典的模糊C-均值聚类中的欧氏距离推广到广义欧氏距离,得到了加权模糊C-均值聚类的迭代公式,实证分析表明加权模糊C-均值聚类的结果与主成分分析的排序基本一致,特别适用于大样本的聚类与排序。  相似文献   

7.
未确知均值聚类结合未确知理论和聚类理论构造未确知测度作为集合隶属度来表示样本与各类间的隶属关系.从产品合格、柔性、可靠性等几方面对影响供应链客户满意度的因素进行分析,构建供应链环境下的客户满意度评价指标体系.在此基础上,应用未确知均值聚类理论对供应链环境下的客户满意度进行综合评价,得出聚类结果,找出各类类中心,并给出样本属于各类的隶属度,较好的解决了对供应链环境下客户满意度的分类问题,最后以实例来论证该方法的可行性和有效性.  相似文献   

8.
目前模糊技术已经应用于许多智能系统,如模糊关系与模糊聚类.聚类是数据挖掘的重要任务,它将数据对像分成多个聚类,在同一个聚类中,对象的属性特征之间具有较高的相似度,有很大研究及应用价值.结合数据库中的挖掘技术,对属性特征为区间数的多属性决策问题,提出了一种基于区间数隶属度的区间模糊ISODATA动态聚类方法.  相似文献   

9.
针对具有正态分布随机变量的多属性决策问题,依据属性均值聚类思想,提出了一种计算机编程求解方法.方法避开了区间数的运算和比较,评价结果不具有主观随意性.最后,我们给出了一个实际应用的例子,验证了方法的有效性.  相似文献   

10.
针对模糊C-均值聚类算法对初始化分类参数的选择比较敏感而导致分类结果差异性较大的不足,提出基于万有引力定律的分类效果好坏的评价准则。实验结果表明。本文定义的分类效果评价准则是可行的。  相似文献   

11.
一种新的分类方法   总被引:5,自引:0,他引:5  
本文在属性聚类网络的基础上 ,提出了堆近邻分类方法 .通过将无监督的属性聚类加上有监督信息 ,能自适应地优选堆数 .样本所考察的近邻个数依据它所在的堆的大小 ,因而每个样本所考查的近邻的个数不是完全相等的 .这种方法可用到高维小样本的数据分类问题中 .我们将它应用到基因表达谱形式的癌症辩识问题中 ,结果表明分类性能得到了较大的提高  相似文献   

12.
Harmonic means clustering is a variant of minimum sum of squares clustering (which is sometimes called K-means clustering), designed to alleviate the dependance of the results on the choice of the initial solution. In the harmonic means clustering problem, the sum of harmonic averages of the distances from the data points to all cluster centroids is minimized. In this paper, we propose a variable neighborhood search heuristic for solving it. This heuristic has been tested on numerous datasets from the literature. It appears that our results compare favorably with recent ones from tabu search and simulated annealing heuristics.  相似文献   

13.
Candidate groups search for K-harmonic means data clustering   总被引:2,自引:0,他引:2  
Clustering is a very popular data analysis and data mining technique. K-means is one of the most popular methods for clustering. Although K-mean is easy to implement and works fast in most situations, it suffers from two major drawbacks, sensitivity to initialization and convergence to local optimum. K-harmonic means clustering has been proposed to overcome the first drawback, sensitivity to initialization. In this paper we propose a new algorithm, candidate groups search (CGS), combining with K-harmonic mean to solve clustering problem. Computational results showed CGS does get better performance with less computational time in clustering, especially for large datasets or the number of centers is big.  相似文献   

14.
以辽东湾某生态监测区水质监测数据为例,以矩阵的奇异值分解和K means算法为分类工具,给出生态监测区水质监测数据的分类方法.方法具有以下特点:通过奇异值分解简化并加速了类比过程,通过动态设置类K避免了K means算法先设定类数的不足,还探讨了对少量新增监测数据的归类问题.方法对近海海水水质监测数据分类具有普适性.  相似文献   

15.
张璐  孔令臣  陈黄岳 《计算数学》2019,41(3):320-334
随着大数据时代的到来,各个领域涌现出海量数据且结构复杂.如变量的维数不同、尺度不同等.而现实中变量之间往往存在着不确定关系,经典的Pearson相关系数仅能反映两个同维变量间的线性相关关系,不足以完全刻画变量间的相关关系.2007年Szekely等提出的距离相关系数则能描述不同维数变量间的非线性关系.为了探索变量之间的内在信息,本文基于距离相关系数提出了最大距离相关系数法对变量聚类,且有超度量性和空间收缩性.为充分发挥距离相关系数的优势,对上述方法改进得到类整体距离相关系数法.该方法在刻画两类间相似性时,将每类中的所有变量合并成一个整体,再计算这两个不同维数的整体间的距离相关系数.最后,将类整体距离相关系数法应用到几个实际问题中,验证了算法的有效性.  相似文献   

16.
基于模糊聚类分析的教师课堂教学质量评价   总被引:2,自引:0,他引:2  
用模糊聚类的方法对教师的课堂教学进行分类分析,选取合适的相似系数,建立模糊相似矩阵,用直接聚类法进行分类,它不能实现我们传统意义的名次排序,但它很好的实现了量化评价和质性评价的结合,实现了评价的诊断功能,为信息反馈提供了依据,充分发挥了评价的导向和激励功能.  相似文献   

17.
多指标综合评价方法及其优化选择研究   总被引:13,自引:0,他引:13  
本文分三部份:1)用等级次序检验解决多种综合评价方法的优化选择;2)根据综合评价值,用有序聚类方法对样本划分级别;3)实证分析。  相似文献   

18.
Clustering is a popular data analysis and data mining technique. Since clustering problem have NP-complete nature, the larger the size of the problem, the harder to find the optimal solution and furthermore, the longer to reach a reasonable results. A popular technique for clustering is based on K-means such that the data is partitioned into K clusters. In this method, the number of clusters is predefined and the technique is highly dependent on the initial identification of elements that represent the clusters well. A large area of research in clustering has focused on improving the clustering process such that the clusters are not dependent on the initial identification of cluster representation. Another problem about clustering is local minimum problem. Although studies like K-Harmonic means clustering solves the initialization problem trapping to the local minima is still a problem of clustering. In this paper we develop a new algorithm for solving this problem based on a tabu search technique—Tabu K-Harmonic means (TabuKHM). The experiment results on the Iris and the other well known data, illustrate the robustness of the TabuKHM clustering algorithm.  相似文献   

19.
The paper is devoted to statistical nonparametric estimation of multivariate distribution density. The influence of data pre-clustering on the estimation accuracy of multimodal density is analyzed by means of the Monte Carlo method. It is shown that the soft clustering is more advantageous than the hard one. While a moderate increase in the number of clusters also increases the calculation time, it considerably reduces the estimation error.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号