首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 15 毫秒
1.
现有的子空间聚类方法以数据全局线性分布为前提,利用先验约束估计未标记数据点的低维子空间,并将其聚类到相应组中,对非线性结构的数据处理存在一定缺陷.受启发于深度学习以其强大的非线性学习表征能力在众多应用中取得巨大成功,文章在数据表示中加入成对约束,并运用流形正则化理论,采用k近邻构造全局相似度矩阵,通过与自编码器的联合学习,提出基于流形正则化与成对约束的深度半监督谱聚类算法(MPAE).该算法一方面在学习数据的低维表示时同时保留数据的可重构性和局部流形结构的全局特征,另一方面将已知样本间的成对约束信息融入目标优化设计,使学习到的低维特征更具有判别性,这在很大程度上提高了所得算法的聚类性能.实验结果表明文章算法能够取得理想的聚类结果.  相似文献   

2.
一种改进的遗传k-means聚类算法   总被引:8,自引:0,他引:8  
在经典的k-means聚类算法中,聚类数k必须事先给定,然而在现实中k很难被精确的确定.本文提出了一种改进的遗传k-means聚类算法,并构造了一个用来评价分类程度好坏的适应度函数,该适应度函数考虑的是在提高紧凑度(类内距)和分离度(类间距)的同时使得分类个数尽可能少.最后采用两个人工数据集和三个UCI数据集对k-means聚类算法(KM),遗传聚类算法(GA),遗传k-means聚类算法(GKM)和改进的遗传k-means聚类算法(IGKM)进行比较研究,比较的指标有类间距、类内距和分类正确率.研究证明改进的遗传k-means算法能够自动获取最佳聚类数k并且保持较高的正确率.  相似文献   

3.
半监督学习是近年来机器学习领域中的一个重要研究方向,其监督信息的质量对半监督聚类的结果影响很大,主动学习高质量的监督信息很有必要.提出一种纠错式主动学习成对约束的方法,该算法通过寻找聚类算法本身不能发现的成对约束监督信息,将其引入谱聚类算法,并利用该监督信息来调整谱聚类中点与点之间的距离矩阵.采用双向寻找的方法,将点与点间距离进行排序,使得学习器即使在接收到没有标记的数据时也能进行主动学习,实现了在较少的约束下可得到较好的聚类结果.同时,该算法降低了计算复杂度,解决了聚类过程中成对约束的奇异问题.通过在UCI基准数据集以及人工数据集的实验表明,算法的性能好于相关对比算法,并优于采用随机选取监督信息的谱聚类性能.  相似文献   

4.
城市气温是对城市气候特性评价的一个重要指标.提出核概率聚类算法并将其应用于城市气温的模式分类中,以此寻找城市发展上的共同点.该算法在概率聚类算法上引入了核学习方法的思想,能够很好地处理噪音和孤立点,实现更为准确的聚类.实验结果表明,与相关聚类算法相比,核概率聚类算法聚类效果好,且算法能够很快地收敛.  相似文献   

5.
传统K-means聚类算法初始聚类中心以及聚类数目K是随机确定的,聚类结果受其影响较大,这样容易造成聚类结果不稳定且准确率较低.针对上述问题,本文提出一种基于优化初始聚类中心和轮廓系数的K-means聚类算法.首先,为了选出准确的初始聚类中心,引入平均样本距离和误差平方和,构造初始聚类中心的选取方法,使得选取的初始聚类...  相似文献   

6.
未确知均值聚类结合未确知理论和聚类理论构造未确知测度作为集合隶属度来表示样本与各类间的隶属关系.从产品合格、柔性、可靠性等几方面对影响供应链客户满意度的因素进行分析,构建供应链环境下的客户满意度评价指标体系.在此基础上,应用未确知均值聚类理论对供应链环境下的客户满意度进行综合评价,得出聚类结果,找出各类类中心,并给出样本属于各类的隶属度,较好的解决了对供应链环境下客户满意度的分类问题,最后以实例来论证该方法的可行性和有效性.  相似文献   

7.
自适应约束模糊C均值聚类算法   总被引:1,自引:0,他引:1  
针对经典C均值聚类算法和模糊C均值聚类算法所存在的对初始聚类中心过分依赖以及需要预先知道实际聚类数目的问题,基于模糊C均值聚类算法提出了一种新算法:自适应约束模糊C均值(ACFCM)聚类算法,它在模糊C均值聚类算法的基础上,给目标函数加入了一个惩罚项,使得上述问题得以解决.并通过仿真实验证实了新算法的可行性和有效性.  相似文献   

8.
基于支持向量机的拟南芥基因表达数据分析   总被引:2,自引:0,他引:2  
针对拟南芥根部基因表达数据分析的问题,本文提出了一种新的基于距离度量学习的支持向机多分类算法.鉴于此问题的特殊性,本文通过最小化4分类机的LOO 误差来求得一个恰当的距离度量.并在此度量下找到若干个属于第5类(其它类)的训练点,从而构造出一个5分类机用来对所有基因分类.实验验证了此算法的可行性,并且比基因表达分析中传统使用的聚类方法更有效.  相似文献   

9.
图像分割就是把感兴趣的区域从背景中分割、提取出来,为了使分割出来的图像特征信息完整,根据图像的灰度值和空间距离构造了一种相似度函数,得到基于图的灰度值的相似度矩阵,将图像分割转化为图论最小割问题,然后运用谱聚类算法进行分割.针对谱聚类算法运行所需的内存空间和运算量大的特点,提出一种考虑概率因素的随机抽样谱聚类算法.在具体实施时,为了减少背景噪声对分割结果的影响,对图像进行了滤波预处理.结果表明,算法稳定性好,相对现有算法,分割效果得到改善.  相似文献   

10.
为了对开源设计网络社区中的用户进行细分研究,首先采用复杂社会网络技术建立了社区组织的复杂网络模型.其次,根据用户在社区中的三种行为设立了备选指标,并通过指标聚类的方法对指标进行筛选,保证了聚类指标的全面性和代表性.在此基础上,以OpenIDEO为研究案例,采用K-Means算法对该社区中的用户进行了聚类,根据聚类结果将用户分为了创新型用户、传播型用户和普通用户,并进一步分析了各类用户的特点及参与动机.聚类结果表明,所提出的聚类指标及算法可以清晰地识别出开源社区的用户类型及占比,为开源设计社区管理机制和激励措施的优化提供了准确的依据.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号