首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于随机抽样和聚类特征的聚类算法
引用本文:周兵,沈钧毅,彭勤科.基于随机抽样和聚类特征的聚类算法[J].西安交通大学学报,2003,37(12):1234-1237.
作者姓名:周兵  沈钧毅  彭勤科
作者单位:西安交通大学电子与信息工程学院,710049,西安
基金项目:国家自然科学基金资助项目(60173058).
摘    要:在分析BIRCH算法不足的基础上,提出了一种基于随机抽样和聚类特征的聚类算法(CLAP),该算法采用随机抽样技术,从数据库中抽取一部分数据进行聚类的预处理过程,这样大大降低了运行时间,CLAP通过设立索引树的叶节点的直径和聚类直径,提高了聚类的精度,并采用全局搜索和局部搜索相结合的方式,消除了输入顺序对聚类质量的影响.测试结果表明,CLAP算法不仅提高了聚类速度,而且改善了聚类质量。

关 键 词:聚类  BIRCH算法  随机抽样
文章编号:0253-987X(2003)12-1234-04
修稿时间:2003年2月14日

Clustering Algorithm Based on Random-Sampling and Cluster-Feature
Zhou Bing,Shen Junyi,Peng Qinke.Clustering Algorithm Based on Random-Sampling and Cluster-Feature[J].Journal of Xi'an Jiaotong University,2003,37(12):1234-1237.
Authors:Zhou Bing  Shen Junyi  Peng Qinke
Abstract:Based on the analysis of the deficiency of BIRCH algorithm, a new clustering algorithm named CLAP (Clustering algorithm based on rAndom-samPling and cluster-feature) is proposed. CLAP preprocesses some of the data extracted from the database by random sampling technique, which decreases the running time greatly. CLAP improves the precision of clustering by setting up the diameter of the leaf nodes in the index tree and the diameter of the clusters. CLAP combines the global searching and local searching such that eliminates the influence of input order on the clustering quality. Experiment results show that the CLAP algorithm not only increases the clustering speed, but also improves the clustering quality.
Keywords:clustering  BIRCH algorithm  random sampling
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号