首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 62 毫秒
1.
K-means算法需要人工设定聚类个数且易受孤立点影响,根据这个缺陷提出了一种新的改进算法。改进算法通过设定初始值及初始值的最大值,在聚类过程中自动获取聚类数k。实验结果表明,该算法在一定程度上缓解了K-means算法对初始值敏感及受孤立点影响的问题,能产生高质量的聚类结果。  相似文献   

2.
【目的】研究评价问题中评价对象因个体差异性的聚类问题。【方法】首先引入夹角余弦刻画评价对象个体间倾向性上的差异大小,其次利用余弦相似度与欧式距离刻画评价对象的总体相似度,对Tzortzis和Likas提出的min-max K-means聚类算法进行改进。【结果】利用某高校参与评价教师的指标数据集进行初步的数值实验,证明了改进K-means算法的有效性。【结论】余弦相似度刻画考核对象的偏向性差异,很好的克服了欧式距离只考虑数值绝对值上的差异,具有重要的现实意义。  相似文献   

3.
一种改进的K-means聚类算法   总被引:1,自引:0,他引:1  
传统的K-means聚类算法对初始聚类中心的依赖程度很大,聚类结果会随聚类中心的选择不同波动很大,为了消除这种中心选择不确定性,提出一种改进的K-means聚类算法,从而有效地改善初始聚类中心点选择的随机性,提高聚类结果的稳定性.仿真实验结果表明,改进后的K-means聚类算法优于传统的算法.  相似文献   

4.
针对原始K-means算法的一系列问题,提出一种基于半监督的K-means聚类改进算法,能够自动进行聚类,找出最优K值,并且最大限度地找出孤立点.首先根据样本集自身的特点,按照"类内尽可能相似"原则一步一步形成数据集,然后对数据集进行"去噪"与合并相似簇,最后,利用少量的标记信息指导和修正聚类结果.在UCI的多个数据集...  相似文献   

5.
K-means聚类算法是近年来数据挖掘学科的一个研究热点和重点,该算法是基于划分的聚类分析算法.目前这种算法在聚类分析中得到了广泛应用。本文将介绍K-means聚类算法的主要思想,及其优缺点。针对该算法经常陷入局部最优,以及对孤立点敏感等缺点,提出了一种基于模拟退火算法的方法对其进行优化,可以有效地防止该算法陷入局部最优的情况。  相似文献   

6.
基于信息熵改进的 K-means 动态聚类算法   总被引:1,自引:2,他引:1  
初始聚类中心及聚类过程产生的冗余信息是影响K-means算法聚类性能的主要因素,也是阻碍该算法性能提升的主要问题.因此,提出一个改进的K-means算法.改进算法通过采用信息熵对聚类对象进行赋权来修正聚类对象间的距离函数,并利用初始聚类的赋权函数选出质量较高的初始聚类中心点;然后,为算法的终止条件设定标准阈值来减少算法迭代次数,从而减少学习时间;最后,通过删除由信息动态变化而产生的冗余信息来减少动态聚类过程中的干扰,以使算法达到更准确更高效的聚类效果.实验结果表明,当数据样本数量较多时,相比于传统的K-means算法和其他改进的K-means算法,提出的算法在准确率和执行效率上都有较大提升.  相似文献   

7.
图像分割是图像处理中的重要环节,如何提高图像分割的准确度一直以来都是图像领域的研究重点及难点.K-means聚类算法作为经典聚类算法得到广泛应用,但是,k值的选取往往难以确定.针对这一问题,提出了一种改进的K-means算法.首先将输入的彩色图像转化为灰度图像,统计灰度直方图的峰值数,将其设定为聚类数k,然后对原图像的...  相似文献   

8.
一种改进的基于密度和样本数量的K-means算法   总被引:1,自引:0,他引:1  
对原始K-means算法进行了研究,通过改进,算法能够自动找出合适的k值,并且最大限度的找出孤立点。首先,寻找样本容量的最大可能初始聚类数n。然后做样本圆,将样本圆等分为n份,依据样本点的位置将样本归属到相应的份里,对初始的n个类进行聚类。最后通过应用DBSCAN算法的小类合并策略将需要合并的小类进行了合并。为了测试改进算法的聚类性能,将改进后的算法源码放在新西兰怀卡托大学所开发的开源平台"weka"上,在多个数据集上与原始K-means算法进行了对比实验,验证了改进算法在聚类质量和聚类稳定性上都远优于原始K-means算法。  相似文献   

9.
《河南科学》2016,(3):348-351
传统K-means聚类算法中聚类初始中心点是随机确定的,实际聚类数据集中可能有孤立点,造成了每次聚类的结果不同,聚类质量不同,有时陷入局部优化状态.针对这些问题,研究者曾试图用距离法解决孤立点的判断和确定初始聚类中心.这种思路存在不科学性.因为孤立点不仅指远离其他点,同时它的周围点稀疏;另外,当数据量过大、数据特征值过多时,算法的运算量大,需要占用大量的计算机资源,运算速度过慢.对传统的K-means聚类算法进行研究,提出了基于密度参数和距离理论的初始聚类中心的确定和孤立点的判断,对传统的K-means聚类算法进行改进.  相似文献   

10.
介绍K-means聚类算法推导过程,并给出利用Python实现K-means算法的程序,以进行验证.  相似文献   

11.
一种改进的基于遗传算法的K均值聚类算法   总被引:2,自引:0,他引:2  
结合遗传算法和K均值聚类算法的优点,提出一种改进的基于遗传算法的K均值聚类算法.将遗传算法的编码方法、初始化、适应度函数、选择、交叉和变异等较好地应用于聚类问题,不仅解决了K均值聚类算法中K值难以确定、对初始值敏感以及遗传算法存在收敛性差和容易早熟的缺点,而且实现了聚类中心的优化选择、K值的自动学习和基因的自适应变异等...  相似文献   

12.
针对传统钢材表面缺陷检测方法存在检测效率低、检测精度差等问题,提出一种基于改进YOLOv5的钢材表面缺陷检测算法。首先使用GhostBottleneck结构替换原YOLOv5网络中的C3模块和部分卷积结构,实现网络模型轻量化;其次在Backbone部分引入SE注意力机制,对重要的特征通道进行强化;最后针对数据集特点在网络中增加一个检测层,强化特征提取能力,并在Neck部分增加特征融合结构,使用DW卷积替换部分标准卷积以减少运算量。实验表明,改进的YOLOv5sGSD算法,模型体积减少了10.4%,在测试集上的mAP值为76.8%,相比原YOLOv5s网络提高了3.3%,检测精度和速度也明显高于一些主流算法。相比传统的钢材表面缺陷检测方法,提出的算法能够更加准确、快速地检测出钢材表面缺陷的种类和位置,并且具有较小的模型体积,方便于在移动端的部署。  相似文献   

13.
后照明图像在白内障诊断和治疗中有着广泛的应用.使用计算机进行分割、分级,不仅省时而且可以得到客观的结果.针对已有算法在灰度不均匀、背景与前景灰度接近区域时无法有效分割的问题,提出一种基于改进FCM算法的后照明图像分割算法.在改进的算法中,首先计算超像素图像区域梯度信息,然后将超像素区域梯度信息归一化后作为权重引入到FCM算法中,充分考虑超像素图像区域信息和梯度信息,从而减少了这些区域的误分.实验结果表明,相比于已有分割和分级算法,本文提出的算法提高了后照明图像分割的准确率.  相似文献   

14.
为了解决传统的图像处理算法识别现场获得的工件图像速度慢且匹配效果较差等问题,通过对工件图像的识别方法进行研究,提出了一种改进的加速鲁棒特征(SURF)算法可以实现工件准确、实时的定位。该算法基于加速分割测试特征检测器(FAST)对SURF算法的特征提取方式进行改进,首先利用FAST提取特征点,然后通过SURF算法生成特征点描述子,使用主成分分析算法(PCA)对描述子进行降维。随后以欧式距离作为相似性度量进行粗匹配,再采用随机抽样一致算法(RANSAC)剔除误匹配点。最后结合双目视觉技术得到工件空间位置坐标。实验结果表明:本文提出的算法在运行时间上相比传统SURF算法减少80%,同时提高了匹配的精度。可见达到了准确、实时的工件定位目的。  相似文献   

15.
赵源 《科技信息》2010,(35):58-58,49
本文在中文分词技术的基础上,提出了一种基于中文文本主题提取的分词方法,以概念语义网络的思想构造主题词典,描述词间概念语义关系,采用改进的最大匹配算法对文本进行切词,既提高了分词的准确性,又能识别文中的未登录词,并同步完成主题词的规范工作。从而在概念层次上理解用户的需求,实现概念检索,提高查准率。  相似文献   

16.
在机器视觉领域中金属产品表面缺陷检测是生产加工中的重要环节,而对于具有兼有镜面特性和纹理特性的硬币进行检测,则更加复杂.为了更有效地检测出硬币表面的缺陷,可将硬币表面分为2部分检测:一个是镜面部分,另一个是纹理部分.针对硬币镜面部分的检测提出了一种基于形态学配准的算法:首先利用无缺陷的标准硬币作为模板图像进行二值化、中值滤波、边缘检测以及形态学处理,然后再将待处理的硬币图像进行除形态学外的相同处理,最后对2幅图像的特征配准算法和差分将匹配错误的位置作为缺陷进行提取.实验结果表明,本方法可以有效检测出硬币镜面部分的缺陷.  相似文献   

17.
一种改进的最大类间方差图像分割法   总被引:2,自引:0,他引:2  
该文根据脑部切片图像中白质的特点,将均方差因素引入传统分割方法,提出了一种改进的最大类间方差图像分割方法.采用连通域标记进行图像预分割,借助形态学的开运算进行滤波处理,根据改进的最大类间方差分割原理进行白质提取.将该方法与传统最大类间方差法对序列脑切片的白质分割结果进行定性比较,并借助漏检率和误检率指标进行定量评估,发现两种方法的平均漏检率均约为0.03,平均误检率分别为0.251和0.026,表明该方法能够综合利用图像的区域特性和边缘特性,分割更加准确有效.  相似文献   

18.
基于标记的改进分水岭分割算法   总被引:1,自引:0,他引:1  
针对传统分水岭分割算法中存在的过分割问题,提出了一种基于标记的改进分水岭分割算法。该方法首先对原图像进行形态学开闭预重建,去除图像中的暗纹理和噪声,在计算形态梯度之后采用开闭后重建,然后,对重建后的梯度图像利用最大熵阈值方法进行标记处理,依据标记对原始梯度图像进行修正,最后使用分水岭算法在修正后的梯度图像上进行分割。从实验结果来看,该方法能较好地抑制传统分水岭算法的过分割现象。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号