首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
基于层次的K-均值聚类   总被引:2,自引:1,他引:1  
介绍一种基于层次的K-均值聚类算法(HKMA)。在统计力学的基础上,对传统K-均值聚类划分矩阵里的元素("隶属"概率)做了形式上的改变,并引入一个调控实际聚类数目的因子。这样,在对同一组数据集进行聚类时,调控因子值不同,结果得到的类数目就不同。用一组二维正态分布的数据集和一组用来测试聚类算法的标准数据集(Iris数)进行测试,结果表明该算法具有层次聚类的性质和较满意的聚类精度。  相似文献   

2.
基于案例推理技术在众多领域已经得到了广泛地应用.本文首先将案例库按层次进行聚类,在此基础上设计了一个基于异构案例库的检索策略.分析了案例库层次聚类规则,重点论述了在聚类基础上的案例检索策略.根据实验结果表明,该方法能够有效地提高案例库中案例的利用率以及案例检索的成功率.  相似文献   

3.
一种基于数据场的层次聚类方法   总被引:21,自引:0,他引:21  
聚类分析是统计、模式识别和数据挖掘等领域中一个非常重要的研究课题,具有广泛的应用前景.受物理学中场论思想的启发,提出一种基于数据场的层次聚类方法.该方法将物质粒子间的相互作用及其场描述方法引入抽象的数域空间,通过模拟对象在虚拟数据场中的相互作用和运动实现数据对象的自组织层次聚集.实验显示,该方法不依赖于用户输入参数的仔细选择,能够发现任意大小和密度的非球形聚类,对噪声数据不敏感,且具有近似线性的收敛速度.  相似文献   

4.
该文提出一种基于判别式聚类框架的非监督极化SAR图像分类算法,利用判别式监督分类技术实现非监督聚类。为实现该算法,定义了一个结合softmax回归模型和马尔科夫随机场光滑性约束的能量函数。该模型中,像素类标和分类器均为需要优化的未知变量。该算法从基于${H / {\bar \alpha }}$目标极化分解和K-Wishart极化统计分布而产生的初始化类标开始,交替迭代优化分类器和类标的能量函数,从而实现对分类器和类标的求解。真实极化SAR数据上的实验结果证明了该算法的有效性和先进性。  相似文献   

5.
针对自然图像分割中,由于单一的颜色空间难以表示复杂多变的场景信息以及目标与背景的低对比度等产生的过分割和误分割问题,提出了选择RGB、XYZ和LUV这3个颜色空间的增强图像进行基于层次聚类的融合分割的新方法.对Berkeley分割图像库中的多幅图像进行了多组分割实验,并与Mean-shift等多种经典分割方法进行了定性...  相似文献   

6.
密度峰值聚类算法(DPC)通过决策图直观地找到类簇中心进而完成聚类,是一种简单高效的聚类算法。然而,DPC算法的截断距离和类簇中心都是人为确定的,受主观影响较大,具有不确定性。针对上述问题,提出一种基于类簇合并的无参数密度峰值聚类算法(NDPCCM)。首先根据样本点两两之间的相似度的分布特征将其分为类内相似度和类间相似度两种类型,并利用类内相似度自动确定截断相似度,避免了人为设置参数;接着根据簇中心权值的下降趋势自动选择初始类簇中心,得到初始类簇;最后通过合并初始类簇对初步聚类结果进行优化,提高了聚类的准确性。在人工数据集和UCI真实数据集上,将所提算法与DPC、DBSCAN、K-means算法进行对比实验。结果表明所提算法无需输入参数就能够自动得到类簇,且聚类性能优于其他算法。  相似文献   

7.
文中研究基于模糊层次聚类的大学生就业数据分类存储系统,在总体设计上,通过模糊层次聚类技术构建系统框架,设计4个功能模块对应就业信息分类存储模式,满足大学生就业信息流转形式;以一一对应关系设置大学生就业信息数据分类存储结构,基于所属关系关联大学生的基本信息。在详细设计中,按照数据存储表和字典表两个类型构建大学生就业信息数据库;选择模糊层次聚类算法计算数据隶属值,设定信息数据聚类流程,实现大学生就业信息数据的分类存储,完成系统设计。实验结果表明:以多个专业的大学生就业人数作为数据样本,新系统即可实现不同专业类型大学生就业数据的精准存储,且分类存储时间能够保证在10 s之内,该系统具有很好的实际应用价值。  相似文献   

8.
为了克服传统层次聚类算法由于两类合并造成的中心点偏移的严重缺陷,提出了一种基于类中心矫正的层次聚类算法,从而提高了算法的精确度;同时继承了传统层次聚类对初始中心点的无依赖性;经分析,算法对于已知聚类数和未知聚类数两种情况均有着良好的聚类效果.通过标准数据测试,结果表明新算法的聚类性能与层次聚类算法相比有更高的精确度;并且让新算法用于指导图像分割实验,证明了算法的有效性.  相似文献   

9.
为降低对合法邮件的误判,提出一种基于朴素贝叶斯和层次聚类的两阶段垃圾邮件过滤方法。该方法将邮件划分为“合法邮件”、“可疑邮件”和“垃圾邮件”3类,在第一阶段,利用朴素贝叶斯算法速度快、分类性能好的优点,对邮件进行初步分类;在第二阶段,基于垃圾邮件的发送特征,利用层次聚类算法进行相似性比较。实验表明,该方法能够显著提高垃圾邮件的查准率,降低对合法邮件的误判,更加符合实际应用需求。  相似文献   

10.
基于动态聚类的MPSK信号调制分类   总被引:2,自引:0,他引:2  
通信信号的自动识别技术受到日益广泛的重视,本文提出了一种新的MPSK信号调制分类算法,对截获接收机输出的频带MPSK信号在未知载波频率的情况下,通过对延迟乘积信号进行分析处理,进而得到与原信号调制类型一致的基带相位信号序列。在未知噪声类型的情况下,利用动态聚类算法对此基带相位信号序列求取最佳聚类数M,从而实现了MPSK信号的调制分类。理论分析和实测信号处理证明了本文提出的算法的可行性。  相似文献   

11.
本文通过对商业销售记录流水分析,利用聚类方法,可以实现对商业客户的分类。本文以某航空公司客户分类为例,针对特征特点进行分类归一化,使用模糊C均值聚类方法实现对客户分类,并与使用Kmeans方法聚类的结果进行了对比。实验结果证明模糊C均值聚类方法更适用于商业客户分析。  相似文献   

12.
K均值聚类算法是一种常见且有效的基于划分的聚类算法。为解决该聚类算法对初始中心敏感的问题,常用的方法是层次化初始聚类中心。然而,层次初始的聚类算法仍然需要将聚类个数作为输入参数,在高维数据和海量数据中不易应用。基于能够自动确定聚类数目的目的,采用DBI度量,提出一种层次初始的聚类个数自适应的聚类方法(简称DHIKM)。通过UCI数据集和仿真数据上的实验,证明DHIKM可以在采样数据中快速找到合适的聚类个数,实验结果表明该算法在聚类质量与收敛速度上的有效性。  相似文献   

13.
为了更好地实现聚类,在分析层次聚类(agglomerative)算法和神经网络的ART2算法的基础上,提出了一种改进的层次聚类算法.改进算法将首先采用一种基于ART2的改进神经网络聚类算法得到一个初始的聚类结果,然后在此基础上利用agglomerative算法实现分层聚类.实验结果表明,改进算法较原先传统的聚类算法,不但算法执行速度快、效率高,而且聚类效果也比较好.  相似文献   

14.
基于蚁群算法的文本分类和聚类   总被引:1,自引:1,他引:1  
为了研究并提高文本的分类和聚类算法的性能,笔者根据蚁群算法在TSP问题中的应用方法,将其改进引用到文本的分聚类中。在文本聚类中,改变蚂蚁的信息素释放机制,道路节点的聚合方式,最终将相似文本进行聚合。在文本的分类中,将所需要的分类信息装入蚂蚁,蚂蚁根据系统外部所希望的方式将文本分类。实验结果证明,这种新的算法可以使文本分类和聚类的准确度提高,蚁群算法在文本分类聚类中的应用是可行的。  相似文献   

15.
针对无先验知识下,混合二进制协议数据帧难以识别分离的问题,提出了一种基于联合高斯混合模型(GMM)和自编码器的聚类方法.对于捕获到的未知二进制数据帧,首先通过栈式自编码器对其进行降维提取特征,并根据相应判别准则获取最佳聚类个数,最后使用改进了代价函数的自编码器对二进制数据帧进一步训练以提高聚类准确率.实验表明,该方法对...  相似文献   

16.
如何利用人工智能提供个性化学习环境及服务已成为当前教育研究者关注的焦点.随着各种在线学习平台的层出不穷,如何利用信息技术提供个性化学习环境及服务已成为当前研究热点.本文基于在线学习平台"超星泛雅"中《网页设计与制作》在线课程案例,重点介绍了数据挖掘算法中K-Means聚类算法的应用.针对传统IFL模型的不足,结合在线学...  相似文献   

17.
文章主要分析了社区发现算法的基本发展情况,研究了由于不同分析对象形成的4类社区发现方法:基于边图思想方法、矩阵谱分析方法、基于极大团思想方法、层次聚类方法。详述其中具备最优越性能的层次聚类方式,对比分析典型算法,提出合理研究社区发现算法的方向,为以后进一步分析提供参考。  相似文献   

18.
面对粮食联盟链网络中的大量共识节点,由于传统实用拜占庭容错(practical Byzantine fault tolerance,PBFT)共识算法效率低下,导致通信能耗过高,从而极大地增加信息泄露和数据造假的风险。针对上述难题,本文提出了一种基于凝聚型层次聚类(agglomerative hierarchical clustering,AHC)的PBFT优化共识算法。首先,利用AHC算法对所有网络共识节点进行目标划分和聚类;其次,使所有簇并行发生PBFT共识;最后,通过簇间主节点共识达成消息一致。实验结果表明,该改进算法能够有效降低能量开销,并提高共识效率和吞吐量。  相似文献   

19.
大数据中一种基于语义特征阈值的层次聚类方法   总被引:1,自引:0,他引:1  
云计算、健康医疗、街景地图服务、推荐系统等新兴服务促使数据的种类和规模以前所未有的速度增长,数据量的激增会导致很多共性问题。例如数据的可表示,可处理和可靠性问题。如何有效处理和分析数据之间的关系,提高数据的划分效率,建立数据的聚类分析模型,已经成为学术界和企业界共同亟待解决的问题。该文提出一种基于语义特征的层次聚类方法,首先根据数据的语义特征进行训练,然后在每个子集上利用训练结果进行层次聚类,最终产生整体数据的密度中心点,提高了数据聚类效率和准确性。此方法采样复杂度低,数据分析准确,易于实现,具有良好的判定性。  相似文献   

20.
越来越多的研究表明,借助量子计算技术可以提高有监督分类算法和无监督聚类算法的计算效率,甚至是学习精度.通常采用的方法有:基于量子理论将经典信息转换为量子态的形式存储起来,用量子态来表示所有样本;以量子态之间的距离替代样本数据之间的经典距离,形成新的相似度来度量样本数据间的相似性等.通过理论和模拟验证表明,量子计算可以实现对经典机器学习算法的加速.最后,总结了量子机器学习技术的优势和目前所存在的问题,并展望了未来该领域的发展趋势.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号