首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于距离相关系数的分层聚类法
引用本文:张璐,孔令臣,陈黄岳.基于距离相关系数的分层聚类法[J].计算数学,2019,41(3):320-334.
作者姓名:张璐  孔令臣  陈黄岳
作者单位:北京交通大学理学院,北京,100044;北京交通大学理学院,北京,100044;北京交通大学理学院,北京,100044
基金项目:国家自然科学基金(批准号:11431002和11671029)资助.
摘    要:随着大数据时代的到来,各个领域涌现出海量数据且结构复杂.如变量的维数不同、尺度不同等.而现实中变量之间往往存在着不确定关系,经典的Pearson相关系数仅能反映两个同维变量间的线性相关关系,不足以完全刻画变量间的相关关系.2007年Szekely等提出的距离相关系数则能描述不同维数变量间的非线性关系.为了探索变量之间的内在信息,本文基于距离相关系数提出了最大距离相关系数法对变量聚类,且有超度量性和空间收缩性.为充分发挥距离相关系数的优势,对上述方法改进得到类整体距离相关系数法.该方法在刻画两类间相似性时,将每类中的所有变量合并成一个整体,再计算这两个不同维数的整体间的距离相关系数.最后,将类整体距离相关系数法应用到几个实际问题中,验证了算法的有效性.

关 键 词:聚类  距离相关系数  最大距离相关系数法  类整体距离相关系数法
收稿时间:2018-06-05

AGGLOMERATIVE HIERARCHICAL CLUSTERING VIA DISTANCE CORRELATION
Zhang Lu,Kong Lingchen,Chen Huangyue.AGGLOMERATIVE HIERARCHICAL CLUSTERING VIA DISTANCE CORRELATION[J].Mathematica Numerica Sinica,2019,41(3):320-334.
Authors:Zhang Lu  Kong Lingchen  Chen Huangyue
Institution:School of Science, Beijing Jiaotong University, Beijing 100044, China
Abstract:With the advent of the era of big data, huge amounts of data have appeared in various fields with complex structure, such as different dimensions and scales. As we know, the classical Pearson correlation measures the linear relationship between two random variables in equal dimension. In 2007, Szekely et.al proposed distance correlation (DC) that characterizes multivariate independence for random variables in arbitrary dimension. In order to explore the internal relationship between variables, in this paper, we study two agglomerative hierarchical clustering methods. We firstly propose complete distance correlation clustering (complete DC clustering) for variable clustering, which has ultrametricity and space contractibility. Secondly, we propose union DC clustering via improving the complete DC clustering. Numerical results for real data are reported to demonstrate the efficiency of our proposed union distance correlation clustering.
Keywords:clustering  distance correlation  complete DC clustering  union DC clustering  
本文献已被 CNKI 万方数据 等数据库收录!
点击此处可从《计算数学》浏览原始摘要信息
点击此处可从《计算数学》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号