首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
在混合型模糊聚类分析的基础上,先用传递闭包法得出动态聚类结果,然后引用F统计量找到最佳分类,针对此最佳分类给出具体算法求得初始分类矩阵,然后利用模糊C-均值算法对初始分类矩阵进行迭代计算,对原分类结果进行软划分修正从而得出最终聚类结果.方法减少了两次人为因素对聚类结果的干扰.将其应用于降水区域划分的实证分析表明,可以对降水区域进行更为有效的划分.  相似文献   

2.
K-平均算法属于聚类分析中的动态聚类法,但其聚类效果受初始聚类分类或初始点的影响较大。本文提出一种遗传算法(GA)来进行近代初始分类,以内部聚类准则作为评价指标,实验结果表明,该算法明显好于K-平均算法。  相似文献   

3.
用遗传算法改进聚类分析中的K—平均算法   总被引:14,自引:0,他引:14  
K-平均算法属于聚类分析中的动态聚类法,但其聚类效果受初始聚类分类或初始点的影响较大,本文提出一种遗传算法(GA)来进行近优初始分类。以内部聚类准则作为评价指标,实验结果表明,该算法明显好于K-平均算法。  相似文献   

4.
土壤是一个多性状的连续体,其分类的首选方法是模糊聚类分析.但是模糊聚类分析中现有的基于模糊等价关系的动态聚类法和模糊c-均值法各有利弊,采用其中一种方法聚类肯定存在不足.为此集成两种聚类方法的优点,避其缺点,提出了用基于模糊等价关系的动态聚类方法和方差分析方法确定聚类数目和初始聚类中心,再用模糊c-均值法决定最终分类结果的集成算法,并将其应用到松花江流域土壤分类中,得到了较为切合实际的分类结果.  相似文献   

5.
针对不平衡数据集分类问题,提出了一种基于聚类的欠采样方法.分别取不同的聚类个数,对训练集中的多数类样本进行若干次聚类,然后用聚类中心作为多数类样本,与少数类样本构成若干个新的训练集,之后用这些训练集训练分类器,剔除具有错误分类倾向的分类器,最后对分类结果进行投票.仿真实验对几种欠采样方法进行比较.实验采用16个平衡率不一的数据集进行测试.理论分析与实验结果表明:提出的基于聚类的欠采样方法能有效地改善不平衡数据集的不平衡性.  相似文献   

6.
等混合聚类法的介绍   总被引:1,自引:0,他引:1  
一、引言 聚类分析法是要解决在地质领域(或其它领域)中常碰到的分类问题.此方法在地质领域中的应用较为广泛.已用于地质上的地层对比、分类、石油地质上调整井油层水淹级划分及油气资源评价等方面,收到良好的地质效果. 目前我国常用的聚类方法,一般可分为系统聚类和动态聚类两种,但目前常用的聚类分析法,多变样本数量不能太大的限制.有的虽然能处理大数据量的资料,但往往花费的机时太长. 等混合聚类法是一种新的聚类法,这种方法不是一般的将一个样品和另外所有样品逐个加以比较,而是先将原始样品预分为若干组,然后根据一定原则,将各组分别…  相似文献   

7.
确定分类数成为聚类分析中的主要问题之一.针对该问题,文章提出了一种新的聚类分析方法即自然聚类法.首先,给出了一个新的类的定义.按该定义聚类,类和类的个数是确定的.相应地,设计了自然聚类的算法.最后通过模拟研究和两个实例分析了所提出方法的有效性.  相似文献   

8.
针对采用经典划分思想的聚类算法以一个点来代表类的局限,提出一种基于泛化中心的分类属性数据聚类算法。该算法通过定义包含多个点的泛化中心来代表类,能够体现出类的数据分布特征,并进一步提出泛化中心距离及类间距离度量的新方法,给出泛化中心的确定方法及基于泛化中心进行对象到类分配的聚类策略,一般只需一次划分迭代就能得到最终聚类结果。将泛化中心算法应用到四个基准数据集,并与著名的划分聚类算法K-modes及其两种改进算法进行比较,结果表明泛化中心算法聚类正确率更高,迭代次数更少,是有效可行的。  相似文献   

9.
上市公司经营业绩的分类与评价   总被引:3,自引:0,他引:3  
首先运用R型聚类分析,从反映经营状况的9项指标中,筛选出5项典型指标作为分类指标,然后根据分类指标,运用Q型聚类中的系统聚类分析法将机械工业45家上市公司分成5类,并进一步按盈利性、成长性和财务安全性对每一类公司的业绩状况进行总体归纳评价.在此基础上,运用理想点法并考虑指标的重要性,对每一类各个公司的业绩进行评价和排序,通过分类与评价得出了一些有价值的结论.  相似文献   

10.
流形学习是一种有效的数据处理工具.聚类问题种类繁多,目前没有一种可以同时解决多种聚类问题的方法.提出的谱多流形聚类方法可以弥补这一缺陷.方法从相似性矩阵的角度出发,充分利用流形采样点所内含的自然的局部几何结构信息来辅助构造合适的相似性矩阵并进而发现正确的流形聚类.最后通过大量算例说明方法可行.  相似文献   

11.
基于微分进化算法的FCM图像分割算法   总被引:1,自引:1,他引:0  
为提高模糊C均值(FCM)算法的自动化程度,提出基于微分进化算法的FCM图像分割算法(DEFCM),利用微分进化算法全局性和鲁棒性的特点自动确定分类数和初始聚类中心,再将其作为模糊c均值聚类的初始聚类中心,弥补FCM算法的不足.实验表明该算法不仅能够正确地对图像分类,而且能获得较好的图像分割效果和质量.  相似文献   

12.
传统K-means聚类算法初始聚类中心以及聚类数目K是随机确定的,聚类结果受其影响较大,这样容易造成聚类结果不稳定且准确率较低.针对上述问题,本文提出一种基于优化初始聚类中心和轮廓系数的K-means聚类算法.首先,为了选出准确的初始聚类中心,引入平均样本距离和误差平方和,构造初始聚类中心的选取方法,使得选取的初始聚类...  相似文献   

13.
聚类分析中的分解法及其应用   总被引:5,自引:0,他引:5  
聚类分析的许多方法,目前以系统聚类法用得最多,它是一种聚合法,开始类很多(每个样品自成一类),每次合并两个最近的类为一新类,逐渐使类减少.这种方法当样品较多时要占用计算机的大量内存,有时甚至超过机器的容量.还有一种方法以相反的次序进行,开始全部样品都在一类,然后按某种原则分解成两类,三类,…直至每个类只包含一个样品为止,这一种方法叫做分解法.分解法一般不需要占用大量内存,且计算量较省,目前国内广泛使用的最优分割法(Fisher算法)就是一种分解法(它仍需要占用较多的内存),[5,6,8]都讨论过分解法.运用他们的思想,我们将分解法更加系统和完整,  相似文献   

14.
K-means算法需要提前确定聚类数量和初始聚类中心.为了解决这个问题,提出了一种基于改进的差分进化算法DVDE的自动聚类算法(AC-DVDE).使用双交叉策略来添加基于个体间聚类的随机交叉策略,用于在传统的两点交叉操作之后的自动聚类中使用的特定编码方法;提出了用于聚类中心选择的随机交叉策略,聚类中心很可能偏离数据集或聚类中心太过集中的问题,通过改进,有效地避免算法本身随机性的错误聚类划分,首先筛选聚类中心,再进行聚类.通过比较UCI的四个数据集的仿真结果,提高了算法的聚类精度和稳定性,具有一定的价值.  相似文献   

15.
近年来低秩表示和稀疏表示用于子空间聚类的研究得到了广泛关注,文献中已有许多相关的子空间聚类方法.文章结合弹性网正则化低秩表示和分类稀疏表示,提出一种分类稀疏低秩表示的子空间聚类方法.方法旨在更充分地捕获数据集的局部线性结构和全局结构信息,提高聚类性能.首先采用并行分裂的自适应惩罚的线性交替方向法求解模型,然后利用求得的系数矩阵构造相似度矩阵,最后应用谱聚类方法进行聚类.另外,取代现有方法手动调节正则化参数,文章采用自适应调节正则化参数确定目标函数中各项的权重.在人工数据集、Extended Yale B数据库和CMU PIE数据库上的实验结果表明,文章方法有更明显的聚类效果和更高的准确率.  相似文献   

16.
聚类分析是研究对样品或指标进行综合分类的一种多元统计分析方法.聚类结果常表现为树状图的形式.如何合理确定聚类的个数,一直是一个比较困难的问题,至今没有很好的解决方案,尤其当样本量较大时,树状图层次较多,很难直观确定聚类个数.介绍一种基于贝叶斯理论的聚类方法,通过对后验似然最大化的原则确定最佳聚类个数和方案,避免了聚类个数选择的主观性.一个已知分类情况的实际数据验证了该聚类方法的有效性.  相似文献   

17.
一种改进的遗传k-means聚类算法   总被引:8,自引:0,他引:8  
在经典的k-means聚类算法中,聚类数k必须事先给定,然而在现实中k很难被精确的确定.本文提出了一种改进的遗传k-means聚类算法,并构造了一个用来评价分类程度好坏的适应度函数,该适应度函数考虑的是在提高紧凑度(类内距)和分离度(类间距)的同时使得分类个数尽可能少.最后采用两个人工数据集和三个UCI数据集对k-means聚类算法(KM),遗传聚类算法(GA),遗传k-means聚类算法(GKM)和改进的遗传k-means聚类算法(IGKM)进行比较研究,比较的指标有类间距、类内距和分类正确率.研究证明改进的遗传k-means算法能够自动获取最佳聚类数k并且保持较高的正确率.  相似文献   

18.
应用多元统计分析方法对34个省会城市和计划单列市的竞争力进行了综合评估.首先设立城市竞争力评价指标,由于指标之间存在相关性,采用因子分析法选取公共因子作为评价的综合指标,然后构造评价函数,根据城市竞争力在各公因子上的得分及其综合排名,分析各城市的发展特色和竞争优劣点.基于因子分析法得到的公因子替代原始变量,分别采用系统聚类分析法和K均值聚类分析法给各城市划分类型,比较两种不同聚类法得出的结果,分析聚类结果可靠性.最后基于综合评估结果给出了提高城市竞争力的合理建议.  相似文献   

19.
因为k-平面聚类算法(kPC)和k-中心平面聚类算法(kPPC)构建的聚类中心平面是无限延伸的,这会影响聚类的性能,所以提出了局部的k-中心平面聚类(L-kPPC)算法.此算法在kPPC中引入了k-均值聚类算法(k-mean),这样使得样本点都聚集在类中心周围.L-kPPC利用了各聚类中心平面的局部特征构建类中心平面,使同一类的数据点到此类的聚类中心或平面尽可能的近,离其他类中心或平面尽量远,这导致求解特征值问题.在此,利用拉普拉斯图建立初始化的数据点,而不是随机选择的初始数据点.最后从电商平台ebay提供的Web Service接口提得数据进行实验,实验结果分析表明,L-KPPC算法有较好的表现.  相似文献   

20.
遗传模糊聚类算法在图像边缘检测中的应用   总被引:1,自引:0,他引:1  
将一种改进的遗传模糊c-均值聚类(GFGA)算法应用到图像的边缘检测中.我们将灰度图像中的每一个像素点看成是一个数据样本,将该点的灰度值经过Robert算子、Sobel算子和Prewitt算子处理构成它的特性向量,形成具有三维特征的数据集,然后对这个数据集应用遗传模糊聚类算法进行分类,自适应地检测出图像的边缘点,达到提取边缘的目的.实验结果表明,这种混合算法能得到很好的边缘效果,并且得到的结果无需再细化处理,提高了边缘定位的精度.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号