首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 54 毫秒
1.
一种改进的遗传k-means聚类算法   总被引:8,自引:0,他引:8  
在经典的k-means聚类算法中,聚类数k必须事先给定,然而在现实中k很难被精确的确定.本文提出了一种改进的遗传k-means聚类算法,并构造了一个用来评价分类程度好坏的适应度函数,该适应度函数考虑的是在提高紧凑度(类内距)和分离度(类间距)的同时使得分类个数尽可能少.最后采用两个人工数据集和三个UCI数据集对k-means聚类算法(KM),遗传聚类算法(GA),遗传k-means聚类算法(GKM)和改进的遗传k-means聚类算法(IGKM)进行比较研究,比较的指标有类间距、类内距和分类正确率.研究证明改进的遗传k-means算法能够自动获取最佳聚类数k并且保持较高的正确率.  相似文献   

2.
传统的K-modes算法采用了简单的0-1匹配来计算属性间的相异度,后改进为频率计算相异度,但是他们都忽略了各属性间的差异。本文研究了基于粗糙集和知识粒度的属性加权算法,该算法既克服了属性的冗余问题又综合考虑了各属性间的差异。在此基础上,通过对传统K-modes算法进行属性加权来改进K-modes算法中忽略的属性间差异问题。通过与其他的K-Modes算法进行实验比较,结果表明新的算法更加有效的。  相似文献   

3.
硬聚类和模糊聚类的结合——双层FCM快速算法   总被引:3,自引:0,他引:3  
模糊c均值(FCM)聚类算法在模式识别领域中得到了广泛的应用,但FCM算法在大数据集的情况下需要大量的CPU时间,令用户感到十分不便,提高算法的速度是一个急待解决的问题。本文提出的双层FCM聚类算法是一种快速算法,它体现了硬聚类和模糊聚类的结合,以硬聚类的结果对模糊聚类的初始值进行指导,从而明显地缩短了迭代过程。双层FCM算法所用的CPU时间仅为FCM算法的十三分之一,因而具有很强的实用价值。  相似文献   

4.
一种稳健的聚类方法   总被引:5,自引:0,他引:5  
本文讨论一种新的聚类方法 :属性均值聚类 .通过理论分析 ,属性均值聚类是比模糊均值聚类更稳健的聚类方法 .数值实验说明了该方法的有效性  相似文献   

5.
目前模糊技术已经应用于许多智能系统,如模糊关系与模糊聚类.聚类是数据挖掘的重要任务,它将数据对像分成多个聚类,在同一个聚类中,对象的属性特征之间具有较高的相似度,有很大研究及应用价值.结合数据库中的挖掘技术,对属性特征为区间数的多属性决策问题,提出了一种基于区间数隶属度的区间模糊ISODATA动态聚类方法.  相似文献   

6.
一种基于区间数多指标信息的FCM聚类算法   总被引:2,自引:0,他引:2  
针对一类具有不确定性区间数多指标信息的聚类分析问题,依据传统的基于数值信息的FCM聚类算法的思路,提出了一种新的聚类分析算法。章首先描述了具有区间数多指标信息的聚类分析问题;其次给出了基于区间数多指标信息的关于最优划分和最优聚类中心确定的两个定理;然后给出了基于区间数多指标信息的FCM聚类算法的计算步骤。该算法的特点是聚类中心的表现形式为精确的数值,给出的两个定理说明了该聚类算法的收敛性。最后,通过给出一个算例说明了本给出的聚类算法。  相似文献   

7.
针对炮兵阵地配置的特殊要求,将模糊数学中的隶属度概念引入到炮兵阵地聚类算法之中,具有较强的可操作性,利于计算机实现,对炮兵指挥决策有一定的参考价值.  相似文献   

8.
一种随机聚类法   总被引:1,自引:1,他引:1  
本文给出了一种新的随机聚类法 ,并应用这种方法分析了银行帐号 ,对于银行系统选择帐号校验码的算法这类问题有参考价值 .  相似文献   

9.
闪电分叉过程算法优化的K-means聚类   总被引:1,自引:0,他引:1       下载免费PDF全文
K-means聚类算法是在数据挖掘和数据分析中一种常用算法,但是其存在依赖初始值和易陷入局部最优值的缺陷,针对这些不足,本文提出一种闪电分叉过程算法优化的K-means聚类,克服聚类算法在初始值选择困难的问题,提高K-means聚类算法的求解精度,降低陷入局部最优的可能性。从UCI数据集中选取6个真实的数据集进行仿真实验,结果表明本文改进后的聚类算法有更好的求解精度和鲁棒性。  相似文献   

10.
针对采用经典划分思想的聚类算法以一个点来代表类的局限,提出一种基于泛化中心的分类属性数据聚类算法。该算法通过定义包含多个点的泛化中心来代表类,能够体现出类的数据分布特征,并进一步提出泛化中心距离及类间距离度量的新方法,给出泛化中心的确定方法及基于泛化中心进行对象到类分配的聚类策略,一般只需一次划分迭代就能得到最终聚类结果。将泛化中心算法应用到四个基准数据集,并与著名的划分聚类算法K-modes及其两种改进算法进行比较,结果表明泛化中心算法聚类正确率更高,迭代次数更少,是有效可行的。  相似文献   

11.
一种基于模糊聚类的区间值属性约简算法   总被引:1,自引:0,他引:1  
针对区间值信息系统基于粗糙集理论提出一种新的属性约简算法:首先计算同一属性下对象间的相似度,然后通过合取算子计算出所有属性下对象之间的相似度矩阵,再用模糊聚类中的传递闭包算子得到等价矩阵,将区间值信息系统转化为具有等价关系的信息系统并且进行约简,从而得到λ-核,同时给出了该算法的复杂度.最后通过一个实例表明这种算法的有效性和合理性.  相似文献   

12.
模糊聚类分析的新算法   总被引:1,自引:0,他引:1  
提出了一种模糊聚类分析的新算法——追踪法 ,解决了以往模糊聚类分析计算量过大以及难于编程实现的问题 .该方法尤其适用于大规模数据的模糊聚类分析 ,对于模糊聚类分析的推广使用有重要意义 .  相似文献   

13.
基于遗传算法的模糊聚类分析   总被引:1,自引:0,他引:1  
针对模糊C-均值算法容易收敛于局部极小点的缺陷,将遗传算法应用于算法的优化计算.同时针对算法中,聚类效果往往受到聚类数目和初始聚类中心的影响,提出了基于平均信息熵确定聚类数目的方法,并采用密度函数来获得初始聚类中心.实验证明,基于遗传算法的模糊聚类方法能够避免产生局部极小值,较好的解决聚类结果对初值的依赖.  相似文献   

14.
因为k-平面聚类算法(kPC)和k-中心平面聚类算法(kPPC)构建的聚类中心平面是无限延伸的,这会影响聚类的性能,所以提出了局部的k-中心平面聚类(L-kPPC)算法.此算法在kPPC中引入了k-均值聚类算法(k-mean),这样使得样本点都聚集在类中心周围.L-kPPC利用了各聚类中心平面的局部特征构建类中心平面,...  相似文献   

15.
为解决模糊C均值算法对初始值敏感、容易陷入局部极值的问题,提出基于混合细菌趋药性的聚类分割算法,在简单细菌趋药性算法的基础上,将粒子群算法引入.新算法使用粒子群算法、细菌趋药性算法两步优化得到的结果作为模糊C均值算法的初始值,同时新算法中引入精英保持策略,进一步提高算法效率.实验结果表明,新算法具有较快的收敛速度,.同时能够获得较好的图像分割效果和质量.  相似文献   

16.
以客户关系为导向的服务经济时代,客户细分是企业判断具有相似特征的客户,并以此为基础有针对性的提供产品及服务的最为有效的手段.利用数据挖掘技术,将模糊聚类算法应用于客户细分中,以此寻找具有相似特征及价值的客户,并在电信行业中进行实证应用.  相似文献   

17.
图像分割就是把感兴趣的区域从背景中分割、提取出来,为了使分割出来的图像特征信息完整,根据图像的灰度值和空间距离构造了一种相似度函数,得到基于图的灰度值的相似度矩阵,将图像分割转化为图论最小割问题,然后运用谱聚类算法进行分割.针对谱聚类算法运行所需的内存空间和运算量大的特点,提出一种考虑概率因素的随机抽样谱聚类算法.在具体实施时,为了减少背景噪声对分割结果的影响,对图像进行了滤波预处理.结果表明,算法稳定性好,相对现有算法,分割效果得到改善.  相似文献   

18.
提出了一种基于模糊聚类的属性匹配算法。该算法采用能综合反映属性名称相似性和语义相似性的模糊相似关系,提高了属性匹配的准确率;以等价闭包法对相似属性进行模糊聚类,得到多层次属性分类结果,更客观真实地反映了属性匹配的模糊性;同时,属性匹配过程中不需要设置匹配参数,避免了人为造成的误差。  相似文献   

19.
基于加权相似性的BIRCH聚类算法   总被引:1,自引:0,他引:1  
BIRCH方法是一个集成的层次聚类方法.它克服了凝聚层次聚类方法所面临的两个难点:可伸缩性和不能撤销前一步工作的问题.基于BIRCH聚类的多阶段聚类算法思想,结合基于权重的欧式距离度量和基于划分的K-means算法,提出了一种基于加权相似性的BIRCH聚类方法,并将方法应用在时间序列的气象数据分析中.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号