首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 93 毫秒
1.
本文定义了聚类中心以及点到聚类中心的距离,提出了一种平面点集的动态聚类分析方法。  相似文献   

2.
针对采用经典划分思想的聚类算法以一个点来代表类的局限,提出一种基于泛化中心的分类属性数据聚类算法。该算法通过定义包含多个点的泛化中心来代表类,能够体现出类的数据分布特征,并进一步提出泛化中心距离及类间距离度量的新方法,给出泛化中心的确定方法及基于泛化中心进行对象到类分配的聚类策略,一般只需一次划分迭代就能得到最终聚类结果。将泛化中心算法应用到四个基准数据集,并与著名的划分聚类算法K-modes及其两种改进算法进行比较,结果表明泛化中心算法聚类正确率更高,迭代次数更少,是有效可行的。  相似文献   

3.
K-means算法需要提前确定聚类数量和初始聚类中心.为了解决这个问题,提出了一种基于改进的差分进化算法DVDE的自动聚类算法(AC-DVDE).使用双交叉策略来添加基于个体间聚类的随机交叉策略,用于在传统的两点交叉操作之后的自动聚类中使用的特定编码方法;提出了用于聚类中心选择的随机交叉策略,聚类中心很可能偏离数据集或聚类中心太过集中的问题,通过改进,有效地避免算法本身随机性的错误聚类划分,首先筛选聚类中心,再进行聚类.通过比较UCI的四个数据集的仿真结果,提高了算法的聚类精度和稳定性,具有一定的价值.  相似文献   

4.
因为k-平面聚类算法(kPC)和k-中心平面聚类算法(kPPC)构建的聚类中心平面是无限延伸的,这会影响聚类的性能,所以提出了局部的k-中心平面聚类(L-kPPC)算法.此算法在kPPC中引入了k-均值聚类算法(k-mean),这样使得样本点都聚集在类中心周围.L-kPPC利用了各聚类中心平面的局部特征构建类中心平面,...  相似文献   

5.
传统K-means聚类算法初始聚类中心以及聚类数目K是随机确定的,聚类结果受其影响较大,这样容易造成聚类结果不稳定且准确率较低.针对上述问题,本文提出一种基于优化初始聚类中心和轮廓系数的K-means聚类算法.首先,为了选出准确的初始聚类中心,引入平均样本距离和误差平方和,构造初始聚类中心的选取方法,使得选取的初始聚类...  相似文献   

6.
FCM和PCM的混合模型可以克服它们单独聚类时的缺点,在聚类效果上有很大改进,但是对于特征不明显的样本而言,这种混合模型的聚类效果并不太好,为了克服这一缺点,本文引入Mercer核,提出了一种新的基于核的混合c-均值聚类模型(KIPCM),运用核函数使得在原始空间不可分的数据点在核空间变得可分。通过数值实验,得到了较为合理的中心值以及较高的正确分类率,证实了本文算法的可行性和有效性。  相似文献   

7.
基于遗传算法的模糊聚类分析   总被引:1,自引:0,他引:1  
针对模糊C-均值算法容易收敛于局部极小点的缺陷,将遗传算法应用于算法的优化计算.同时针对算法中,聚类效果往往受到聚类数目和初始聚类中心的影响,提出了基于平均信息熵确定聚类数目的方法,并采用密度函数来获得初始聚类中心.实验证明,基于遗传算法的模糊聚类方法能够避免产生局部极小值,较好的解决聚类结果对初值的依赖.  相似文献   

8.
一种新的概率神经网络有监督学习算法   总被引:3,自引:0,他引:3  
提出一种新的PNN有监督学习算法:用学习矢量量化对各类训练样本进行聚类,对平滑参数σ和距离各类模式中心最近的聚类点构造区域,并采用遗传算法在构造的区域内训练网络,实验表明:该算法在分类效果上优于其它PNN学习算法。  相似文献   

9.
针对传统k-均值聚类算法事先必须获知类别数和难以确定初始聚类中心的缺点,建立了关于聚类中心和类别数k的双层规划模型,结合粒子群算法确定出聚类中心,通过在迭代过程中不断更新准则函数的方法搜索并确定出最佳类别数惫,基于所建模型,提出了一种改进的k-均值聚类算法,并将算法应用于冰脊表面形态分析中.结果表明,算法得到的聚类结果不但具有相邻类别边界清晰的优点,而且能够较好地反映出地理位置和生长环境对冰脊形成的影响.  相似文献   

10.
针对传统k-均值聚类算法事先必须获知类别数和难以确定初始聚类中心的缺点,建立了关于聚类中心和类别数k的双层规划模型,结合粒子群算法确定出聚类中心,通过在迭代过程中不断更新准则函数的方法搜索并确定出最佳类别数惫,基于所建模型,提出了一种改进的k-均值聚类算法,并将算法应用于冰脊表面形态分析中.结果表明,算法得到的聚类结果不但具有相邻类别边界清晰的优点,而且能够较好地反映出地理位置和生长环境对冰脊形成的影响.  相似文献   

11.
聚类分析(Ⅱ)   总被引:6,自引:0,他引:6  
系统聚类法一次形成类以后就不变了,这要求一次分类分得比较准确,对分类的方法就提出较高的要求,相应的计算量自然比较大.改进这个缺点的一个自然想法是,先粗略的聚一下类,然后按照某种最优的原则进行修改,直至类分得比较合理为止,这就是逐步聚类法,又称动态聚类法. 为了粗略的分一下类(以后简称初始分类),有时首先选一批“凝聚点”,然后让样品向最近的凝聚点凝聚,这样由点就凝聚成类,得到初始分类.逐步聚类法大体可用如下框图表示:  相似文献   

12.
针对一类具有不确定性区间数多指标信息的聚类分析问题,依据传统的基于数值信息的FCM聚类算法的思路,提出了一种新的聚类分析算法。章首先描述了具有区间数多指标信息的聚类分析问题;其次给出了基于区间数多指标信息的关于最优划分和最优聚类中心确定的两个定理;然后给出了基于区间数多指标信息的FCM聚类算法的计算步骤。该算法的特点是聚类中心的表现形式为精确的数值,给出的两个定理说明了该聚类算法的收敛性。最后,通过给出一个算例说明了本给出的聚类算法。  相似文献   

13.
自适应约束模糊C均值聚类算法   总被引:1,自引:0,他引:1  
针对经典C均值聚类算法和模糊C均值聚类算法所存在的对初始聚类中心过分依赖以及需要预先知道实际聚类数目的问题,基于模糊C均值聚类算法提出了一种新算法:自适应约束模糊C均值(ACFCM)聚类算法,它在模糊C均值聚类算法的基础上,给目标函数加入了一个惩罚项,使得上述问题得以解决.并通过仿真实验证实了新算法的可行性和有效性.  相似文献   

14.
半监督学习是近年来机器学习领域中的一个重要研究方向,其监督信息的质量对半监督聚类的结果影响很大,主动学习高质量的监督信息很有必要.提出一种纠错式主动学习成对约束的方法,该算法通过寻找聚类算法本身不能发现的成对约束监督信息,将其引入谱聚类算法,并利用该监督信息来调整谱聚类中点与点之间的距离矩阵.采用双向寻找的方法,将点与点间距离进行排序,使得学习器即使在接收到没有标记的数据时也能进行主动学习,实现了在较少的约束下可得到较好的聚类结果.同时,该算法降低了计算复杂度,解决了聚类过程中成对约束的奇异问题.通过在UCI基准数据集以及人工数据集的实验表明,算法的性能好于相关对比算法,并优于采用随机选取监督信息的谱聚类性能.  相似文献   

15.
近年来,自动驾驶技术得到了加速发展,提出许多经典的姿态估计算法实现车辆的定位.但在实际场景中,一些运动点会给姿态估计结果带来误差.提出了一种基于运动去除的姿态估计算法.首先,基于特征点信息建立了几何约束条件,实现点的初步筛选.其次,利用聚类算法将视差图划分为不同的聚类区域.随后,根据数学模型将聚类区域判断为动态区域或静...  相似文献   

16.
在给定的度量空间中, 单位聚类问题就是寻找最少的单位球来覆盖给定的所有点。这是一个众所周知的组合优化问题, 其在线版本为: 给定一个度量空间, 其中的n个点会一个接一个的到达任何可能的位置, 在点到达的时候必须给该点分配一个单位聚类, 而此时未来点的相关信息都是未知的, 问题的目标是最后使用的单位聚类数目最少。本文考虑的是带如下假设的一类一维在线单位聚类问题: 在相应离线问题的最优解中任意两个相邻聚类之间的距离都大于0.5。本文首先给出了两个在线算法和一些引理, 接着通过0.5的概率分别运行两个在线算法得到一个组合随机算法, 最后证明了这个组合随机算法的期望竞争比不超过1.5。  相似文献   

17.
在给定的度量空间中, 单位聚类问题就是寻找最少的单位球来覆盖给定的所有点。这是一个众所周知的组合优化问题, 其在线版本为: 给定一个度量空间, 其中的n个点会一个接一个的到达任何可能的位置, 在点到达的时候必须给该点分配一个单位聚类, 而此时未来点的相关信息都是未知的, 问题的目标是最后使用的单位聚类数目最少。本文考虑的是带如下假设的一类一维在线单位聚类问题: 在相应离线问题的最优解中任意两个相邻聚类之间的距离都大于0.5。本文首先给出了两个在线算法和一些引理, 接着通过0.5的概率分别运行两个在线算法得到一个组合随机算法, 最后证明了这个组合随机算法的期望竞争比不超过1.5。  相似文献   

18.
城市气温是对城市气候特性评价的一个重要指标.提出核概率聚类算法并将其应用于城市气温的模式分类中,以此寻找城市发展上的共同点.该算法在概率聚类算法上引入了核学习方法的思想,能够很好地处理噪音和孤立点,实现更为准确的聚类.实验结果表明,与相关聚类算法相比,核概率聚类算法聚类效果好,且算法能够很快地收敛.  相似文献   

19.
提出了一个判别模糊聚类中聚类数有效性的新指标.首先利用FCM算法对数据集进行模糊聚类,通过隶属度矩阵和聚类中心构建加权二分网络.然后通过改进加权二分网络的模函数,定义一个新的聚类有效性指标.为了检验该有效性指标的性能,选取了三个常见的有效性指标在十五个数据集上进行了对比.实验结果表明,该有效性指标具有较好的性能.  相似文献   

20.
利用K-means进行数据聚类时,借用不同处理手段其统计距离和聚类中心等会有所差异,从而影响聚类结果,尤其是当数据维度增高时,这种现象更为明显.对此,文章提出一种基于样本方差的多元统计距离算法,并引入改进人工蜂群算法及评价准则函数确定聚类中心和最佳聚类数,优化K-means算法.理论上,该方法可以克服原算法易陷入局部最优和固定聚类数等缺陷.最后,通过特异值检测,人工数据集以及UCI真实数据集测试验证该优化算法性能.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号