首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 70 毫秒
1.
讨论了中文文本聚类的现状以及存在的问题,介绍了向量空间模型,详细阐述了潜在语义索引理论以及采用该模型进行中文文本聚类的主要步骤,最后采用两种模型进行了实验对比,实验表明采用潜在语义索引模型可以取得更好的聚类效果。  相似文献   

2.
《信息技术》2019,(1):66-70
针对传统K-means聚类中存在的一系列问题,文中提出了一种基于K-means聚类的改进算法。该算法首先利用K-means++聚类从数据中选择K个距离尽可能远的对象作为初始聚类中心,然后利用K-mediods聚类选择数据样本的中位数作为聚类中心的对象,最后与两步聚类结合。通过对几个常用UCI标准数据集进行仿真实验,结果表明该算法比传统算法更优。  相似文献   

3.
针对轨迹聚类结果的不可靠性,提出一种基于多聚类结果融合的轨迹聚类方法MRMTC.对于多聚类器产生的多个聚类代表轨迹,提出了轨迹合并算法,实现了多个聚类代表轨迹的合并.代表轨迹合并算法以平均扫描线距离函数作为共识函数,通过共识函数对代表轨迹间的相似度进行比较,最后合并相似的代表轨迹.实验表明基于融合的轨迹聚类方法,可以获...  相似文献   

4.
本文提出了一种基于语义聚类算法的两阶段Web服务发现机制。第一阶段,给定一个查询,首先通过聚类算法过滤掉哪些内容与查询不符合的Web服务;第二阶段针对这个数据集使用PLSI算法,进一步进行聚类获得一个有限的语义相关组,使用PLSI方法可以发现隐藏在查询和Web服务中的语义概念,这样服务匹配可以在语义概念层次进行。  相似文献   

5.
密度聚类分析方法是经典聚类的一个重要分类,能够发现具有相同密度结构的数据,而不拘泥于数据的凹凸类型和集群形状.基于此,研究了密度聚类方法的发展现状:首先介绍了几种重要的经典密度聚类算法,并对其核心思想、算法流程、算法特性等进行了分析;其次总结归纳了各个经典密度聚类算法的优缺点、适用场景,介绍了密度聚类算法的实用案例;最...  相似文献   

6.
对海量数据进行聚类,从中获取有价值的隐含知识,已经成为一项迫切的需求。传统的基于词频或距离的文本聚类技术在准确度方面存在较大差距。引入文本语义信息的聚类方法,提高了聚类的准确度。实验结果表明,基于语义特征的模糊聚类算法具有较好的聚类效果。  相似文献   

7.
提出一种利用自适应遗传算法对椭圆聚类进行检测和变量估计的新方法.该算法利用自适应遗传算法对目标函数进行优化,既提高了速度,又避免了陷入局部极小值.通过对几个同心和交叉椭圆的合成数据进行测试,验证了该方法的有效性.  相似文献   

8.
本文通过对商业销售记录流水分析,利用聚类方法,可以实现对商业客户的分类。本文以某航空公司客户分类为例,针对特征特点进行分类归一化,使用模糊C均值聚类方法实现对客户分类,并与使用Kmeans方法聚类的结果进行了对比。实验结果证明模糊C均值聚类方法更适用于商业客户分析。  相似文献   

9.
在数据挖掘的所有算法中,聚类分析尤为重要.基于划分的聚类算法就是用统计分析的方法研究分类问题.本文介绍了聚类的定义及聚类算法的种类,详细阐述了K均值聚类算法和K中心点聚类算法的基本原理并对它们的性能进行分析,对近年来各学者对基于划分的聚类算法的研究现状进行了梳理,对其具体应用实例做了简要介绍。  相似文献   

10.
针对处理不平衡数据集的分类问题,SMOTE通过在相邻样例间线性插值实现少数类样例过采样。但SMOTE插值的结果是样例密集的地方依然相对密集,样例稀疏的地方依然相对稀疏,影响分类性能。针对该问题本文提出一种基于聚类的过采样方法-C-SMOTE。该方法首先将少数类样例聚成多个簇,再以簇为单位结合SMOTE方法产生新样例。实验结果表明,C-SMOTE既保证了数据集整体分类准确率,又能提高少数类分类精度。  相似文献   

11.
结构化的路由算法已逐渐成为P2P的一个热点研究领域。针对目前结构化P2P算法中存在的难以有效支持基于内容的定位问题,提出了一种基于语义相似度的P2P平衡路由网络S-Tree,构造了基于平衡网络树的覆盖网络和语义拓扑。模拟实验表明,与已有的结构化P2P算法相比,S-Tree能有效提高网络的查全率,同时降低路由的延迟。  相似文献   

12.
金波 《通信技术》2009,42(3):164-166
在经典的语义覆盖网络中,所有节点都处于对等地位,没有考虑节点间共享资源数量及相对位置的差异,这使网络中节点分组信息的维护与资源搜索成本较高。丈中分析了节点间共享资源数量及相对位置的差异对语义覆盖网络中节点分组信息的维护与资源搜索代价的影响,并在此基础上提出了一种新的基于非结构化P2P网络的语义覆盖网络。该结构利用P2P网络的拓扑匹配与区分索引技术有效减少了经典语义覆盖网络中节点分组信息的维护及资源搜索代价,提升了网络的整体性能。  相似文献   

13.
基于分布式哈希表DHT(Distributed Hash Table)的P2P理论结构和算法研究的主要困难在于难以在实际网络中进行性能测试。OpenDHT是一个全球性的覆盖网(Overlay network),能够提供一个具体的实验平台,通过响应客户端请求实现一个真正的DHT.以完成覆盖网络测试。  相似文献   

14.
对等语义覆盖网络构建主要采用索引和超级节点的方法,不可避免地存在瓶颈问题,同时忽略了覆盖网络与实际网络拓扑一致性问题对语义覆盖网络性能的重要影响。该文提出的对等语义覆盖网络结构TPPH充分结合了结构化P2P网络高效的定位和非结构化P2P网络的复杂检索功能,采用分布式哈希表机制将相同主题节点组织成主题区域,在同一主题区域内通过物理位置相近原则进行群的划分,从而在物理网络拓扑基础上建立语义P2P覆盖网络结构。性能分析和仿真实验表明,该结构显著提高了查全率并缩短了平均查询时延,是一种支持复杂查询、高性能的语义覆盖网络结构。  相似文献   

15.
The growing number of web services advocates distributed discovery infrastructures which are semantics-enabled. We introduce a novel approach for semantic discovery of web services in structured P2P-based (Peer-to-Peer) registries. We partition concepts into different CGs (Concept groups) and index these ordered concept sets in a two-phase semantic routing mechanism. Each node and query has one concept set as its unique ID. For each concept in the query, current node first route the query to a node with nodeID that shares a prefix as long as with the query, but a longer CG. Second, the query will be routed to a node sharing a longer prefix than that of the current node. Combining with semantic similarity calculation, our proposal guarantees that most existing services matching a query will be found with bounded costs in terms of number of nodes involved. The scalability and reliability of our approach are also confirmed through emulation tests.  相似文献   

16.
林晓 《电子测试》2014,(23):31-34
目前P2P网络中数据查询在语义方面的研究较少,而基于DHT的数据检索只支持准确查询,导致查询准确率不高,但是好的索引项的建立会给查询带来很大的方便。本文结合了RDF和Word Net在语义方面的特点提出了一种新的简易RDF概念列表来表示文档,并通过计算语义相似度来决定输出结果的P2P数据查询方法。仿真实验证明本文方法可以较好的提高查询成功率。  相似文献   

17.
基于P2P技术的网格资源发现中覆盖网络的构建   总被引:1,自引:2,他引:1  
文章针对网格环境下的集中式资源发现机制的不足,设计了基于P2P技术的资源发现模型,并在分析典型P2P系统Gnutella覆盖网络构建方式的基础上,提出了网格环境下进行覆盖网络构建的新方式--定序方式.按照定序方式构建的覆盖网络可以保证资源发现的服务质量,同时定序方式以节点间的网络延时作为覆盖网络构建的依据,请求消息按照小的网络延时路径在覆盖网络上传播,从而可以提高资源发现的效率.  相似文献   

18.
智能节点重叠网络   总被引:2,自引:0,他引:2  
P2P文件共享的大量应用带来了网络性能、安全性、知识产权等问题。文章给出了构建可管理、可控制和可运营的P2P网络的实例。  相似文献   

19.
重路由技术在匿名通信中得到广泛的应用,首先分析出在基于重路由技术的匿名通信系统中,由匿名代理所组成的应用层覆盖网络实际上是一个开环排队网络,引入Jackson开环排队网络模型和分析方法,对由匿名代理所组成的覆盖网络建立网络模型,性能参数分析;研究成果一方面为设计和研究匿名通信网络系统及性能分析提供理论依据,同时为研究基于延迟时间和时间同步机制的匿名通信跟踪技术提供一种新的思路。  相似文献   

20.
P2P网络流媒体播放系统研究   总被引:7,自引:2,他引:7  
介绍了一种基于P2P网络平台上新的流媒体播放技术,它将P2P网络技术和流媒体技术结合起来,充分利用网络闲置的带宽资源和存储资源,突破了传统的流媒体播放系统带宽瓶颈.它采用多点下载和文件分块重组方法,一边下载一边播放,能够保持节目流完整而流畅地播放.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号