首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 140 毫秒
1.
采用路径划分聚类算法,对Web用户访问路径进行划分,然后根据其相似度进行聚类,依据分类系数和平均模糊熵来判定簇个数的最优解,得到较好的聚类效果,为最终挖掘出用户的访问模式奠定了良好的基础.实验发现簇中心偏移次数明显减少,中心长度有所提高,证明算法具有较好的效率.  相似文献   

2.
本文给出了一种Web用户和页面的模糊聚类算法.在该算法中,通过Web日志中的数据,根据用户对Web页面的浏览情况分别建立Web用户和页面的模糊集,在此基础上用最大-最小法的模糊相似性度量构造模糊相似矩阵,并由此构造模糊动态聚类算法.  相似文献   

3.
针对 Web应用挖掘中聚类算法中的问题 ,提出加权 Web访问模式聚类算法 .该算法利用服务器日志库中保存的网页访问次数信息 ,提高了聚类的客观性和准确性 .  相似文献   

4.
基于Web日志的匿名网络用户聚类研究   总被引:2,自引:0,他引:2  
该文探讨了从Web日志中提取匿名网络用户会话信息的方法以及会话向量的表述形式,并利用网页的层次性减少会话向量的维数,确定了用户会话之间的相似度的计算公式,最后采用leader层次聚类算法完成匿名网络用户会话聚类。实验结果表明,这种方法是高效可行的,可以较好地解决扩展性和动态聚类等问题。  相似文献   

5.
提出了基于神经网络的文档聚类算法,将Web挖掘技术及用于科技文档资料检索,目的是利用数据挖掘技术快速、准确的从浩瀚的Web信息资源中抽取有趣的、潜在有用的模式及隐含信息,用于科技文档资料的检索,以满足科研人员及广大师生对科技资料的检索需求.系统开发采用B/S结构,以SQL Server为数据服务器端,利用ASP技术和ADO技术开发浏览器端应用程序.  相似文献   

6.
Web日志中挖掘用户浏览模式的研究   总被引:24,自引:0,他引:24  
研究了Web日志挖掘的机理,提出了使用频繁遍历径作为用户浏览模式,并在分析挖掘频繁遍历路径的问题特征和对其进行形式化描述的基础上,进一步提出了一种在Web日志中挖掘频繁遍历路径的类Apriori算法,该算法能够正确、快速地从Web日志中抽取频繁遍历路径。  相似文献   

7.
基于模糊聚类的网站用户分类   总被引:3,自引:0,他引:3  
文章给出了模糊聚类在网站用户分析中的应用。首先对web日志挖掘作了系统的介绍,包括对服务器上日志结构的分析和对数据预处理过程的描述,然后讨论了用户模糊聚类的算法,并用实例证明了模糊聚类在web用户聚类应用中的可行性。为web站点的个性化服务提供了基础。  相似文献   

8.
为了满足基于Web的XML数据信息的挖掘的需求,提出一种基于结构相似度的XML文档的聚类算法,该方法是在根据XML文档的语义信息和结构信息计算出相似度基础之上对XML文档集合进行聚类,并进行了实验,证明该方法有效,与同类算法相比有其优势的地方。  相似文献   

9.
基于Web的数据挖掘是一种结合了数据挖掘和互联网系统的热门研究课题.随着互联网的高速发展,Web挖掘由于其独特的优点,在Web交易中扮演了越来越重要的角色.运用Web挖掘对Web交易服务器的日志文件和客户交易信息进行挖掘,有助于企业了解客户的访问行为,挖掘潜在客户群和开展有针对性的服务.对Web挖掘技术进行综述,并介绍了该技术在Web交易中的几个应用.  相似文献   

10.
通过处理和研究Web日志,得到多数用户感兴趣的页面URL和具有相近访问爱好的用户群体,对站点的结构是否适合用户作出判断并进行相应的调整,从而实现对用户的个性化服务.  相似文献   

11.
分析了典型的聚类算法及其适用范围,针对其处理Web点击流数据的不足,提出了一种用于Web点击流的增量挖掘的聚类算法WCSCluster,给出了相关定义及存储结构,并用实例说明了算法的运行过程.最后对比同类算法给出实验结果.实验结果表明该算法具有良好的性能,能够发现更优的簇.  相似文献   

12.
提出一种Web日志挖掘算法,该算法首先以Web站点的URL为行、以用户的UserID为列,建立URL- UserID关联矩阵,元素值为用户的访问次数;然后,对行向量进行相似性度量获得用户会话粗聚类,最后,利用层次结构对比聚类算法,对用户会话粗聚类进行进一步地处理得到更高精度的聚类,实验表明该算法在提高聚类精度方面卓有成效。  相似文献   

13.
随着信息爆炸时代的到来,如何有效的从网络上获取有价值的信息成为当前研究的热点.Web文本挖掘技术就是解决上述问题的一种方法,它从大量半结构化、异构的Web文档集中发现潜在的、有价值的知识.本文着力于研究Web文本挖掘过程中的重要技术,并通过分析当前研究热点和各种算法,提出一种改进的投影聚类算法,实验证明其正确率比k-均值算法高.最后,本文设计了基于Web文本挖掘的证券投资系统,并将改进的聚类算法应用其中.  相似文献   

14.
To alleviate the scalability problem caused by the increasing Web using and changing users' interests, this paper presents a novel Web Usage Mining algorithm-Incremental Web Usage Mining algorithm based on Active Ant Colony Clustering. Firstly, an active movement strategy about direction selection and speed, different with the positive strategy employed by other Ant Colony Clustering algorithms, is proposed to construct an Active Ant Colony Clustering algorithm, which avoid the idle and "flying over the plane" moving phenomenon, effectively improve the quality and speed of clustering on large dataset. Then a mechanism of decomposing clusters based on above methods is introduced to form new clusters when users' interests change. Empirical studies on a real Web dataset show the active ant colony clustering algorithm has better performance than the previous algorithms, and the incremental approach based on the proposed mechanism can efficiently implement incremental Web usage mining.  相似文献   

15.
针对传统单纯聚类算法实现网页推荐精确度欠缺的问题, 提出一种基于Web日志挖掘的个性化网页推荐模型, 并实现了相应的网页推荐算法, 算法结合聚类分析和关联规则挖掘, 能有效实现网页推荐. 实验结果表明, 在保障网页页面推荐覆盖率的条件下, 该方法有较高的精确度、 有效性和实用性.  相似文献   

16.
一种新的Web事务模糊聚类算法的研究   总被引:11,自引:1,他引:11  
提出了一种新的Web事务模糊聚类算法。首先,在Web日志预处理后建立Web站点用户访问矩阵,矩阵元素为用户访问离散化时间,在此基础上进行Web事务群体的模糊聚类,最后对在线的活动Web事务进行类别归属。经实验证明,该算法比已有的算法准确性高,运行时间少,扩展性好,它可以广泛地应用于电子商务领域,如个性化Web和Web推荐系统等。  相似文献   

17.
一种网络日志挖掘的高效算法   总被引:1,自引:1,他引:0  
提出了一种网络日志挖掘算法PWU,其采用了异构树结构。通过对异构树叶子节点进行编号,使得对候选集计数时只需对具有相同编号的叶子节点进行计数,极大地简化了候选集计数过程。在此基础上,算法还具有增量挖掘功能。最后,从理论分析和实验两方面证明了算法的高效性以及增量挖掘功能的高效性和完备性。  相似文献   

18.
介绍了离群数据挖掘的基本概念,全面分析并总结了离群数据挖掘研究的历史与现状,以及离群数据挖掘的几类方法,并对一些典型方法进行了分析和评价,指出传统方法的优点和不足,展望了今后的研究工作。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号