首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
鉴于聚类分析是机器学习和数据挖掘领域的一项重要技术, 并且与监督学习不同的是聚类分析中没有类别或标签的指导信息, 所以如何选择合适的聚类个数(即模型选择)一直是聚类分析中的难点. 由此提出了一种基于Dirichlet过程混合模型的聚类算法, 并用collapsed Gibbs采样算法对混合模型的参数进行估计. 新算法基于非参数贝叶斯模型的框架, 能够在不断的采样过程中优化模型参数并形成合适的聚类个数. 在人工合成数据集和真实数据集上的聚类实验结果表明: 基于Dirichlet过程混合模型的聚类算法不但能够自动确定聚类个数, 而且具有较强灵活性和鲁棒性.  相似文献   

2.
医学图像分割是计算机视觉和图像处理领域近年来研究的热点问题之一。一种基于k-means聚类和半监督学习的医学图像分割新算法被提出。在k-means聚类模型中,相似度函数是关系到聚类效果好坏的关键因素。所使用的相似度函数通过基于side-information的半监督学习方法来确定;确定后的相似度函数又被运用回k-means聚类模型中来实现对医学图像的分割。为了检验该算法效果,脑部肿瘤患者的磁共振图像被运用在实验中。分析结果表明:该算法在本文所采用的实例中能获得优于传统算法的分割效果。  相似文献   

3.
针对三维网格模型分割质量提升问题,提出了感知几何的图注意力网络。首先,定义了感知几何的图注意力系数,利用节点之间的边特征扩展由网络学习得到的注意力系数,引入与节点局部几何信息相关的注意力系数,更好地反映节点之间的相似性。然后,通过调整网络架构,将三维网格模型的几何特征与标签信息共同作为图注意力网络的输入,使标签信息参与网络训练和验证,并通过残差形式的线性连接实现网络的更稳定输出。大量实验结果表明,本文算法能够获得精确的分割边界,其在PSB数据集上的分割准确率较现有经典算法提升约2个百分点,也取得了更好的兰德指数。同时,通过消融实验验证了算法的合理性。  相似文献   

4.
针对现有Web使用记录挖掘方法发现的知识和规则存在不精确或不完全的问题,提出了一种改进的基于粗糙近似的Web事务聚类算法.该算法首先对原有算法得到的每个类,用关系矩阵找出在这个类中不满足传递性的对象,然后在该对象的集合(类)上用关系矩阵找出在这个类中不满足传递性的对象,再对每个类进行分割,使其满足关系R的传递性,克服了现有算法不满足关系的传递性和在某些情况下得到的结果不准确的缺点.  相似文献   

5.
针对传统的聚类算法难以适应流数据在线聚类的问题,本文在演化聚类算法(ECM)的基础上,改进了ECM中聚类中心和聚类半径的更新过程,引入戴维森保丁指数(DBI,Davies-Bouldin Index)作为数据归类的评估准则,提出了一种面向流数据的演化聚类算法(SDECM).实验结果表明,与ECM相比,SDECM在目标函数值、DBI值、准确率和纯度等评估准则方面具有更好的聚类性能.  相似文献   

6.
基于自组织特征映射聚类算法的研究与应用   总被引:2,自引:0,他引:2  
讨论了基于自组织特征映射网络聚类算法的基本原理,并给出了基于关系数据库的具体实现方法,通过对实例的具体测试,证明算法是有效的,并对算法的参数进行了讨论.  相似文献   

7.
城市车载网络环境中高效的中继选择有利于保证安全消息传输的及时性和可靠性。针对现有中继选择方法在复杂交通环境下难以准确评估中继,且在车流密集场景下性能不佳的问题,提出一种基于多属性决策和k-means聚类的中继选择方法(multi-attribute decision-making and k-means clustering based relay selection,MKRS)。首先充分考虑当前转发车辆与候选中继之间的相对距离和相对速度,候选中继的接收信号强度和区域密度等4种评估指标,分别基于序关系法和熵权法计算候选中继评估指标的主、客观权重,并利用简单加权法计算其综合权重,进一步得到能够更加准确体现候选中继性能的综合效用值。在此基础上,采用基于k-means聚类和优先级-退避时间的方法选出最佳中继。实验结果表明所提MKRS与对比方法相比,在保证较好一跳距离和一跳时延的同时具有最快的传播速度。  相似文献   

8.
针对K均值(K-means)聚类算法进行文本聚类时随机选取初始聚类中心点的问题,提出一种基于密度峰值进行初始聚类中心点选取的适用于文本聚类的K-means算法(DPMCSKM),为了更好地适应大规模聚类计算的要求,设计并实现了基于MapReduce的DPMCSKM并行化算法。实验结果表明,DPMCSKM算法可以有效地进行文本聚类,与K-means、基于密度峰值的快速搜索聚类算法选取初始簇中心点的K-means以及多簇球形K-means算法相比在聚类质量上均有一定的提升,在收敛速度上也有较好的表现;DPMCSKM并行化算法在可扩展性上,具有较好的加速比。  相似文献   

9.
基于数据挖掘的方法,设计和实现了两种复合聚类的算法,并对图像特征库按此算法建立了索引结构,形成了图像的索引库,通过实验,结果显示聚类方法具有很大的应用潜力.  相似文献   

10.
针对传统图论聚类算法对初始聚类中心的敏感性以及聚类结果与样本输入次序等问题,提出了基于遗传算法进行图论聚类分析的基本原理和实现方法.实验结果表明,遗传算法应用于图论聚类分析能够搜索到更为精确的聚类中心值,其结果明显好于传统图论聚类算法.  相似文献   

11.
传统k-中心点聚类算法初始中心点的选取直接影响算法效率和稳定性,易使算法陷入局部最优解,从而影响在带时序群体分析的聚类应用效果.本文提出了一种基于密度信息的k-中心点算法,通过获取样本密度信息来选取初始中心点,有效解决了聚类结果对初始中心点选择的依赖性问题,并应用于雷暴聚类中.雷暴聚类评估实验结果表明了改进算法的有效性.  相似文献   

12.
提出一种基于动态模糊Kohonen神经网络聚类模型,针对传统的Kohonen神经网络(KNN)聚类需要预先确定聚类数的问题,提出采用树形动态自组织映射网络算法(TGSOM)来确定聚类数,并且利用模糊Kohonen神经网络(FKNN)聚类结果与输入顺序无关的优势进行网络优化,得到更优的聚类结果。该模  相似文献   

13.
提出了一种新颖的广义无监督函数映射学习的三维形状密集对应方法。首先,基于多层感知器(multilayer perceptron,MLP)和残差网络,直接学习深度点特征。其次,计算点云的近似测地线距离,并对其进行特征分解,建立特征嵌入空间,引入注意力机制,有效学习广义基函数表示。再次,结合点特征与广义基函数生成三维形状的深度特征表示。最后,建立无监督的函数映射网络框架,获取形状之间的密集对应表示。提出的三元正则优化机制,联合重构损失、特征损失和形状匹配的距离损失,在特征域和空间域上有效提升了学习性能及形状对应的精度。实验结果表明,广义基函数表示与无监督函数映射学习机制适用于任意三维形状,突破了现有方法只适用于连续二维流形的局限,在任意三维形状匹配中取得了更优的性能。  相似文献   

14.
在构件的检索过程中,由于用户对于构件的描述形式或者机制不是很理解,因此很难把自己的需求以专业的术语或者表达形式表示出来,从而影响了检索的效率。引入了刻面权重的定义,将用户的需求有效的具象化,并提出了基于模糊聚类分析的构件检索方法,利用一定的聚类准则将构件库里的构件集合划分为不同的类别,降低构件检索的规模,提高构件检索的效率,同时具有较好的查全率和查准率。实验结果证明了该方法的可行性与有效性。  相似文献   

15.
基于混合遗传聚类的Web日志挖掘   总被引:3,自引:0,他引:3  
通过对Web日志文件进行分析,提出了一种用混合遗传聚类对Web用户的行为进行分析的方法,混合遗传聚类是标准遗传算法和K-中心点算法的有机结合.实验证明,该方法是一个具有全局最优解的聚类方法,其结果明显优于标准遗传聚类方法.该算法能够有效地剔除噪音,得到很好的用户聚类和页面聚类的结果,为网站的管理者设计个性化的商务网站提供了有效的决策依据.  相似文献   

16.
K-means聚类算法只能保证算法收敛到局部最优,从而导致聚类结果对初始点的选择非常依赖,同时在面对海量数据时容易因运算次数增多而使聚类过程耗时增加.针对上述问题及结合海量数据的特性,本文提出了一种基于云环境的并行聚类算法,该算法利用Canopy聚类算法思想并结合二分查找思想对K-means算法进行优化,同时采用"极限点"原则使之避免了聚类过程中的局部最优,然后利用顺序组合式MapReduce编程模型实现了算法的并行化扩展.实验结果表明:在大数据集上,该算法比同样部署在Hadoop集群上运行的K-means算法,在加速比、准确率、扩展率、算法效率方面具有较大的优势.  相似文献   

17.
旨在通过考虑特征词汇的潜在语义和自身的重要性来提高文本聚类效果,研究基于RI方法的文本向量表示方法。首先,对基于RI方法构建的特征词汇随机索引向量中+1和-1向量元素出现位置进行约束,以避免在构建特征词汇上下文向量时可能造成该特征词汇潜在语义丢失现象;其次,在生成文本向量时考虑特征词汇自身重要性来改进权值的计算;最后,在测试数据上对基于RI方法的文本向量表示进行聚类效果测试与对比分析,结果表明采用基于RI方法能提高文本聚类效果。  相似文献   

18.
提出了基于2D图像模糊识别的3D模型检索的方法。该方法根据人识别习惯模式,从6个方向采集3D模型的2D图像。考虑到人眼对色差的敏感的特点,采用适当的均匀色空间,建立各2D图像的纹理特征。然后对这些纹理特征采用模糊C-均值算法建立模糊集,这些模糊集用于模拟人对图像模糊认识,模糊集对图像变形具有鲁棒性,故提高了提取特征的稳定性和灵活性,同时改善了检索效果与人识别效果的一致性。  相似文献   

19.
针对常用反窃电普查的方式面对新疆地域辽阔、环境复杂等问题,实施性单一的现状,开展聚类k-means算法的数据样本分析及深化应用,提升反窃电甄别手段及鉴别效果。利用k-means算法通过对和田某试点台区50户居民用户用电信息数据的仿真分析,实际验证方案的可行性、有效性、应用性。  相似文献   

20.
证据理论是由Dempster和Shafer于60-70年代提出的一种不确定推理方法。在专家系统中有着重要的应用价值。本文研究了将证据理论用于定量决策模型,提出了定量决策模型的信度概念及其计算方法,并给出了在复杂环境下的最优性与信度及决策人的经验相结合的决策方法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号