首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于FCM的簇内欠采样算法
引用本文:刘稀文段隆振段文影.基于FCM的簇内欠采样算法[J].南昌大学学报(理科版),2021,45(5):437.
作者姓名:刘稀文段隆振段文影
作者单位:南昌大学信息工程学院
基金项目:国家自然科学基金资助项目(81960325);
摘    要:针对传统分类器在不平衡数据集上性能降低的问题,提出一种基于FCM的簇内欠采样算法(Fuzzy C-means clustering Based Under Sampling In Clusters, FCMUSIC)。使用模糊c-均值聚类算法(Fuzzy C-Means clustering, FCM)将多数类样本划分成若干簇,在每个簇内以类别不平衡比率(imbalanced ratio, IR)的倒数作为采样倍率,得到新的多数类样本并与少数类样本合并,形成新的平衡样本集,结合KNN和Random Forest分类器进行分类。分析在5组不平衡数据集上的分类结果,当使用KNN分类器时,改进后的算法的F1值平均提高了6.65%,G-mean值平均提高了7.75%;使用Random Forest分类器时,F1值平均提高了5.31%,G-mean值平均提高了6.07%。表明FCMUSIC算法能够有效地提升传统分类器对不平衡数据集的分类性能。

关 键 词:分类  不平衡数据  欠采样  聚类  
点击此处可从《南昌大学学报(理科版)》浏览原始摘要信息
点击此处可从《南昌大学学报(理科版)》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号