共查询到20条相似文献,搜索用时 31 毫秒
1.
2.
3.
城市气温是对城市气候特性评价的一个重要指标.提出核概率聚类算法并将其应用于城市气温的模式分类中,以此寻找城市发展上的共同点.该算法在概率聚类算法上引入了核学习方法的思想,能够很好地处理噪音和孤立点,实现更为准确的聚类.实验结果表明,与相关聚类算法相比,核概率聚类算法聚类效果好,且算法能够很快地收敛. 相似文献
4.
5.
主要针对几种典型数据的多流形结构分析问题进行了研究.综合分析多种谱聚类算法优缺点,以谱多流形聚类算法为主线,结合实验结果对多种谱聚类算法进行了分析,最后针对数据空间密度不均匀的情况对谱多流形聚类算法进行了一定的改进,提出了一种基于自适应近邻值的谱多流形聚类算法,并通过实验证明其达到了混合多流形聚类的目的. 相似文献
6.
7.
一种改进的遗传k-means聚类算法 总被引:8,自引:0,他引:8
在经典的k-means聚类算法中,聚类数k必须事先给定,然而在现实中k很难被精确的确定.本文提出了一种改进的遗传k-means聚类算法,并构造了一个用来评价分类程度好坏的适应度函数,该适应度函数考虑的是在提高紧凑度(类内距)和分离度(类间距)的同时使得分类个数尽可能少.最后采用两个人工数据集和三个UCI数据集对k-means聚类算法(KM),遗传聚类算法(GA),遗传k-means聚类算法(GKM)和改进的遗传k-means聚类算法(IGKM)进行比较研究,比较的指标有类间距、类内距和分类正确率.研究证明改进的遗传k-means算法能够自动获取最佳聚类数k并且保持较高的正确率. 相似文献
8.
9.
半监督学习是近年来机器学习领域中的一个重要研究方向,其监督信息的质量对半监督聚类的结果影响很大,主动学习高质量的监督信息很有必要.提出一种纠错式主动学习成对约束的方法,该算法通过寻找聚类算法本身不能发现的成对约束监督信息,将其引入谱聚类算法,并利用该监督信息来调整谱聚类中点与点之间的距离矩阵.采用双向寻找的方法,将点与点间距离进行排序,使得学习器即使在接收到没有标记的数据时也能进行主动学习,实现了在较少的约束下可得到较好的聚类结果.同时,该算法降低了计算复杂度,解决了聚类过程中成对约束的奇异问题.通过在UCI基准数据集以及人工数据集的实验表明,算法的性能好于相关对比算法,并优于采用随机选取监督信息的谱聚类性能. 相似文献
10.
11.
聚类集成方法能够有效综合不同的聚类结果,提高聚类的精确度和稳定性.提出了一个基于矩阵变换的聚类集成优化模型,模型通过矩阵变换代替传统方法中的聚类配准模式,使得优化模型更加简洁,然后给出了求解该优化模型的叠代算法.实验表明,提出的聚类集成方法能够有效提高聚类集成的稳定性和精确度,并且在聚类数目比较少时,算法有着较低的时间复杂度. 相似文献
12.
13.
14.
基于ICA的时间序列聚类方法及其股票数据分析中的应用 总被引:1,自引:0,他引:1
时间序列聚类分析是时间序列数据挖掘中的重要任务之一,通常由于时间序列数据的特殊结构,导致一般的聚类算法不能直接应用于时间序列数据.本文提出了一种基于独立成分分析与改进K-均值算法相结合的时间序列聚类算法,该算法首先利用独立成分分析对时间序列数据进行特征提取,然后利用改进K-均值聚类算法完成对时间序列特征数据的聚类分析,从而得到了一种新的基于特征的时间序列聚类方法.为了验证该方法的有效性和可行性,将其应用于实际的股票时间序列数据聚类分析中,取得了较好的数值结果. 相似文献
15.
16.
K-平均算法属于聚类分析中的动态聚类法,但其聚类效果受初始聚类分类或初始点的影响较大。本文提出一种遗传算法(GA)来进行近代初始分类,以内部聚类准则作为评价指标,实验结果表明,该算法明显好于K-平均算法。 相似文献
17.
18.
基于加权相似性的BIRCH聚类算法 总被引:1,自引:0,他引:1
BIRCH方法是一个集成的层次聚类方法.它克服了凝聚层次聚类方法所面临的两个难点:可伸缩性和不能撤销前一步工作的问题.基于BIRCH聚类的多阶段聚类算法思想,结合基于权重的欧式距离度量和基于划分的K-means算法,提出了一种基于加权相似性的BIRCH聚类方法,并将方法应用在时间序列的气象数据分析中. 相似文献
19.
基于遗传算法的模糊聚类分析 总被引:1,自引:0,他引:1
针对模糊C-均值算法容易收敛于局部极小点的缺陷,将遗传算法应用于算法的优化计算.同时针对算法中,聚类效果往往受到聚类数目和初始聚类中心的影响,提出了基于平均信息熵确定聚类数目的方法,并采用密度函数来获得初始聚类中心.实验证明,基于遗传算法的模糊聚类方法能够避免产生局部极小值,较好的解决聚类结果对初值的依赖. 相似文献
20.
土壤是一个多性状的连续体,其分类的首选方法是模糊聚类分析.但是模糊聚类分析中现有的基于模糊等价关系的动态聚类法和模糊c-均值法各有利弊,采用其中一种方法聚类肯定存在不足.为此集成两种聚类方法的优点,避其缺点,提出了用基于模糊等价关系的动态聚类方法和方差分析方法确定聚类数目和初始聚类中心,再用模糊c-均值法决定最终分类结果的集成算法,并将其应用到松花江流域土壤分类中,得到了较为切合实际的分类结果. 相似文献