首页 | 本学科首页   官方微博 | 高级检索  
     检索      

一种有效的高维分类数据聚类方法研究
引用本文:贾俊芳,李德玉.一种有效的高维分类数据聚类方法研究[J].微电子学与计算机,2011,28(6):88-91.
作者姓名:贾俊芳  李德玉
作者单位:1. 山西大学,计算机与信息技术学院,山西,太原030006;山西大学,计算智能与中文信息处理教育部重点实验室,山西,太原030006;山西大同大学,数学与计算机科学学院,山西,大同,037006
2. 山西大学,计算机与信息技术学院,山西,太原030006;山西大学,计算智能与中文信息处理教育部重点实验室,山西,太原030006
基金项目:国家自然科学基金资助项目,教育部高等学校博士点基金,教育部科学技术研究重点项目,山西省重点实验室开放基金项目,太原市科技明星专项基金项目
摘    要:随着数据规模的不断增大,提高K-modes聚类算法或模糊K-modes聚类算法的运行效率成为了一个重要问题.为了提高其算法执行效率,提出了一种基于分治法的高维分类数据聚类方法.该方法并不是一次性对所有的数据进行聚类,而是将分类数据集分成若干个子集,对每个子集同时进行聚类,最后对聚类结果进行融合以形成最终的聚类结果.实验结果表明大多数情况下较传统的方法在聚类的速度上有显著的提高.

关 键 词:聚类分析  模糊聚类  分治法  分类数据  评价指标

An Effective High Dimensional Categorical Data Clustering Method Research
JIA Jun-fang,LI De-yun.An Effective High Dimensional Categorical Data Clustering Method Research[J].Microelectronics & Computer,2011,28(6):88-91.
Authors:JIA Jun-fang  LI De-yun
Institution:JIA Jun-fang1,2,3,LI De-yu1,2(1 School of Computer & Information Technology,Shanxi University,Taiyuan 030006,China,2 Key Laboratory of Computational Intelligence and Chinese Information Processing of Ministry of Education,3 College of Methmatic and Computer Technology,Datong 037009,China)
Abstract:With the increasing size of data set,improving the efficiency of K-modes clustering algorithm or fuzzy K-modes clustering algorithm is becoming a critical issue.In order to improve the efficiency of the algorithm,a clustering method based on divided and conquered method was proposed.This method,not a one-time clustering of all data,divided the data set into several subsets,and each subset was clustered at the same time;the fusion results of each subset cluster form the final clustering results.The results s...
Keywords:clustering analysis  fuzzy clustering  divided and conquered method  large categorical data sets  evaluation index  
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号