首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 437 毫秒
1.
K-means算法需要提前确定聚类数量和初始聚类中心.为了解决这个问题,提出了一种基于改进的差分进化算法DVDE的自动聚类算法(AC-DVDE).使用双交叉策略来添加基于个体间聚类的随机交叉策略,用于在传统的两点交叉操作之后的自动聚类中使用的特定编码方法;提出了用于聚类中心选择的随机交叉策略,聚类中心很可能偏离数据集或聚类中心太过集中的问题,通过改进,有效地避免算法本身随机性的错误聚类划分,首先筛选聚类中心,再进行聚类.通过比较UCI的四个数据集的仿真结果,提高了算法的聚类精度和稳定性,具有一定的价值.  相似文献   

2.
K-means算法是一种非常重要的聚类算法,然而算法的聚类效果受簇的个数、初始中心点位置的影响很大.提出基于优化初始中心集合和中心移动算法tNN-MEANS,算法有效解决了以下三个问题:1)准确确定大规模数据集中簇的个数;2)精确确定全局高密度的核心区域;3)克服了簇中存在多个高密度区域的问题.运用UCI数据集分别对X-means算法、DBSCAN算法和tNN-MEANS算法进行对比实验,实验结果验证了tNN-MEANS算法的聚类精度、确定簇的个数、蔟划分的正确率等性能均优于与之对比的其它算法.  相似文献   

3.
利用K-means进行数据聚类时,借用不同处理手段其统计距离和聚类中心等会有所差异,从而影响聚类结果,尤其是当数据维度增高时,这种现象更为明显.对此,文章提出一种基于样本方差的多元统计距离算法,并引入改进人工蜂群算法及评价准则函数确定聚类中心和最佳聚类数,优化K-means算法.理论上,该方法可以克服原算法易陷入局部最优和固定聚类数等缺陷.最后,通过特异值检测,人工数据集以及UCI真实数据集测试验证该优化算法性能.  相似文献   

4.
K-means聚类算法是在数据挖掘和数据分析中一种常用算法,但是其存在依赖初始值和易陷入局部最优值的缺陷,针对这些不足,本文提出一种闪电分叉过程算法优化的K-means聚类,克服聚类算法在初始值选择困难的问题,提高K-means聚类算法的求解精度,降低陷入局部最优的可能性。从UCI数据集中选取6个真实的数据集进行仿真实验,结果表明本文改进后的聚类算法有更好的求解精度和鲁棒性。  相似文献   

5.
因为k-平面聚类算法(kPC)和k-中心平面聚类算法(kPPC)构建的聚类中心平面是无限延伸的,这会影响聚类的性能,所以提出了局部的k-中心平面聚类(L-kPPC)算法.此算法在kPPC中引入了k-均值聚类算法(k-mean),这样使得样本点都聚集在类中心周围.L-kPPC利用了各聚类中心平面的局部特征构建类中心平面,使同一类的数据点到此类的聚类中心或平面尽可能的近,离其他类中心或平面尽量远,这导致求解特征值问题.在此,利用拉普拉斯图建立初始化的数据点,而不是随机选择的初始数据点.最后从电商平台ebay提供的Web Service接口提得数据进行实验,实验结果分析表明,L-KPPC算法有较好的表现.  相似文献   

6.
自适应约束模糊C均值聚类算法   总被引:1,自引:0,他引:1  
针对经典C均值聚类算法和模糊C均值聚类算法所存在的对初始聚类中心过分依赖以及需要预先知道实际聚类数目的问题,基于模糊C均值聚类算法提出了一种新算法:自适应约束模糊C均值(ACFCM)聚类算法,它在模糊C均值聚类算法的基础上,给目标函数加入了一个惩罚项,使得上述问题得以解决.并通过仿真实验证实了新算法的可行性和有效性.  相似文献   

7.
针对传统k-均值聚类算法事先必须获知类别数和难以确定初始聚类中心的缺点,建立了关于聚类中心和类别数k的双层规划模型,结合粒子群算法确定出聚类中心,通过在迭代过程中不断更新准则函数的方法搜索并确定出最佳类别数惫,基于所建模型,提出了一种改进的k-均值聚类算法,并将算法应用于冰脊表面形态分析中.结果表明,算法得到的聚类结果不但具有相邻类别边界清晰的优点,而且能够较好地反映出地理位置和生长环境对冰脊形成的影响.  相似文献   

8.
基于加权相似性的BIRCH聚类算法   总被引:1,自引:0,他引:1  
BIRCH方法是一个集成的层次聚类方法.它克服了凝聚层次聚类方法所面临的两个难点:可伸缩性和不能撤销前一步工作的问题.基于BIRCH聚类的多阶段聚类算法思想,结合基于权重的欧式距离度量和基于划分的K-means算法,提出了一种基于加权相似性的BIRCH聚类方法,并将方法应用在时间序列的气象数据分析中.  相似文献   

9.
针对模糊C均值聚类算法对初始聚类中心值敏感和抗噪声能力差的问题,提出一种基于改进的量子遗传优化初始聚类中心的算法,改进双链编码的量子遗传算法增加了全局搜索能力,改变传统的FCM算法计算迭代慢和易陷入局部极值的问题.同时引入空间邻域信息,利用加权隶属度矩阵建立适应度函数来改善对噪声的鲁棒性,实验结果表明,算法具有很好的分割效果和较强的抗噪能力.  相似文献   

10.
针对传统k-均值聚类算法事先必须获知类别数和难以确定初始聚类中心的缺点,建立了关于聚类中心和类别数k的双层规划模型,结合粒子群算法确定出聚类中心,通过在迭代过程中不断更新准则函数的方法搜索并确定出最佳类别数惫,基于所建模型,提出了一种改进的k-均值聚类算法,并将算法应用于冰脊表面形态分析中.结果表明,算法得到的聚类结果不但具有相邻类别边界清晰的优点,而且能够较好地反映出地理位置和生长环境对冰脊形成的影响.  相似文献   

11.
K-means聚类算法在SIR传染病模型中的应用研究   总被引:1,自引:0,他引:1  
基于SIR传染病模型,建立了具有K-means聚类算法的SIR元胞自动机模拟模型.通过对分别服从高斯分布和随机均匀分布的两类初始感染源的分析与模拟,给出了疾病感染半径与隔离半径对疾病传播的影响.结果显示:在两种不同类型的初试分布下,感染者的最大值分别与疾病感染传播半径和隔离半径呈正相关与负相关关系,感染者数量随时间的变化率亦呈现相同的变化规律.初始数据的不同分布类型只影响这种正负相关关系的增速.研究结果可为控制和消除传染病提供有效合理的隔离措施,为卫生部门提供防控传染病的理论支持.  相似文献   

12.
针对采用经典划分思想的聚类算法以一个点来代表类的局限,提出一种基于泛化中心的分类属性数据聚类算法。该算法通过定义包含多个点的泛化中心来代表类,能够体现出类的数据分布特征,并进一步提出泛化中心距离及类间距离度量的新方法,给出泛化中心的确定方法及基于泛化中心进行对象到类分配的聚类策略,一般只需一次划分迭代就能得到最终聚类结果。将泛化中心算法应用到四个基准数据集,并与著名的划分聚类算法K-modes及其两种改进算法进行比较,结果表明泛化中心算法聚类正确率更高,迭代次数更少,是有效可行的。  相似文献   

13.
提出了一个判别模糊聚类中聚类数有效性的新指标.首先利用FCM算法对数据集进行模糊聚类,通过隶属度矩阵和聚类中心构建加权二分网络.然后通过改进加权二分网络的模函数,定义一个新的聚类有效性指标.为了检验该有效性指标的性能,选取了三个常见的有效性指标在十五个数据集上进行了对比.实验结果表明,该有效性指标具有较好的性能.  相似文献   

14.
文本聚类是聚类技术的重要研究领域.该技术根据文本的相似特征或相似表达式对文本进行聚类,使得属于同类的文本具有最大的相似性,而属不同类文本具有最大的差异性.与其它文字相比,蒙古文的结构和书写方式具有许多特征.本文结合K-means与克隆免疫算法提出了一种称为ICKM的新型聚类技术.四种元素集上的仿真实验说明了我们提出的方法在蒙古文聚类的有效性.  相似文献   

15.
基于遗传算法的模糊聚类分析   总被引:1,自引:0,他引:1  
针对模糊C-均值算法容易收敛于局部极小点的缺陷,将遗传算法应用于算法的优化计算.同时针对算法中,聚类效果往往受到聚类数目和初始聚类中心的影响,提出了基于平均信息熵确定聚类数目的方法,并采用密度函数来获得初始聚类中心.实验证明,基于遗传算法的模糊聚类方法能够避免产生局部极小值,较好的解决聚类结果对初值的依赖.  相似文献   

16.
半监督学习是近年来机器学习领域中的一个重要研究方向,其监督信息的质量对半监督聚类的结果影响很大,主动学习高质量的监督信息很有必要.提出一种纠错式主动学习成对约束的方法,该算法通过寻找聚类算法本身不能发现的成对约束监督信息,将其引入谱聚类算法,并利用该监督信息来调整谱聚类中点与点之间的距离矩阵.采用双向寻找的方法,将点与点间距离进行排序,使得学习器即使在接收到没有标记的数据时也能进行主动学习,实现了在较少的约束下可得到较好的聚类结果.同时,该算法降低了计算复杂度,解决了聚类过程中成对约束的奇异问题.通过在UCI基准数据集以及人工数据集的实验表明,算法的性能好于相关对比算法,并优于采用随机选取监督信息的谱聚类性能.  相似文献   

17.
基于核函数的混合C均值聚类算法   总被引:2,自引:0,他引:2  
提出了一种基于核函数的混合C均值聚类算法.首先利用模糊C均值聚类算法和另一种类型的可能性C均值聚类算法的优点,设计出一种混合C均值聚类算法.然而鉴于该算法存在的不足,本文将Mercer核函数引入到该算法中,仿真实验结果证实了该方法的可行性和有效性.  相似文献   

18.
聚类集成方法能够有效综合不同的聚类结果,提高聚类的精确度和稳定性.提出了一个基于矩阵变换的聚类集成优化模型,模型通过矩阵变换代替传统方法中的聚类配准模式,使得优化模型更加简洁,然后给出了求解该优化模型的叠代算法.实验表明,提出的聚类集成方法能够有效提高聚类集成的稳定性和精确度,并且在聚类数目比较少时,算法有着较低的时间复杂度.  相似文献   

19.
现有的基于遗传算法的K-means聚类算法,利用遗传算法的全局优化性提高了K-means算法的寻优能力,收敛速度却过慢.为了解决上述问题,提出基于云自适应遗传算法的K-means聚类算法,利用云模型云滴的随机性和稳定趋向性设计遗传算法的交叉和变异概率,并在进化过程中引入K均值算子,以克服算法收敛速度过慢的问题.实验比较表明,算法具有较好的全局优化性,且收敛速度较快,提高了聚类算法解决物流管理中数据聚类工作的能力.  相似文献   

20.
针对多属性决策中指标的信息重复和不确定性问题,提出了一种基于改进的k-means聚类与粗糙集算法相结合的指标筛选方法。首先,定义样本的空间分布密度,实现初始聚类中心优化的k-means算法,对连续型指标进行离散化处理;然后利用粗糙集的相对约简原理进行指标约简,删除存在信息重复的冗余指标,并结合绿色经济指标体系构建的案例验证了该方法的合理性和有效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号