首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 156 毫秒
1.
Web用户访问模式挖掘   总被引:3,自引:0,他引:3  
随着网站内容的不断丰富和访问量的增加,网站结构变得越来越复杂,导致信息获取和推送都比较困难.将数据挖掘技术应用于用户访问模式,形成了Web访问模式挖掘.Web访问模式挖掘是从Web访问日志中挖掘有用的用户访问信息,据此可以形成关联规则、序列模式、聚类模式和分类模式等4类信息,这对于优化站点结构、为不同类别的用户提供个性化服务,有效地实现信息获取和信息推送是非常必要的.Web访问模式挖掘是目前数据挖掘领域的一个重要研究课题,结合研究工作,从概念、方法、任务、过程、应用及面临的挑战等方面对其进行了较详细的评述.  相似文献   

2.
现有的Web日志频繁访问路径挖掘算法往往不能在追求时间效率的同时准确挖掘出符合用户浏览顺序的频繁路径.提出了有效挖掘Web日志中频繁访问路径的算法,将事务数据库转换为Web访问路径树,根据支持度进行剪枝构造最长前缀频繁子路径树,然后进行频繁路径挖掘,实验证实了此方法的有效性,并分析了支持度设置对频繁路径生成的影响.  相似文献   

3.
提出了一种从Web日志中快速挖掘连续可重复频繁访问路径的新算法ICAP.该算法通过构造以频繁项目p为根的SAP树,能一次挖掘出所有以p为前缀的连续可重复频繁访问路径.最后通过实验验证了算法的正确性和有效性.  相似文献   

4.
利用Web日志挖掘技术构建自适应网站   总被引:2,自引:2,他引:0  
利用基于图结构Web日志挖掘获得的规则和用户访问模式,使Web站点的结构及站点内的页面进行自身的调整和改善,从而实现站点组织结构的优化.  相似文献   

5.
文章提出了一种基于交集关系原理的算法叫做交集算法,它与类Apriori算法本质上互补。这种算法的最大优势是不需要产生大量的候选频繁访问模式,就可以直接生成最大频繁访问模式,因此在挖掘过程中也就不需要反复扫描原始数据库来计算各个候选频繁访问模式的支持度计数;经理论分析和试验证明,交集算法具有一定的理论意义和应用价值。  相似文献   

6.
通过Web日志挖掘技术可分析用户访问模式,从而为客户提供智能化、个性化服务。马尔可夫(Markov)模型的链式结构简便易行,适合作为一个预测模型来预测用户的页面访问模式。就此对Markov预测模型进行深入研究,描述了其实现算法,并结合实例对混合Markov预测模型方法进行了验证。  相似文献   

7.
大型网站为了提高访问效率,通常建立多个镜像站点,这导致获取网站全局的用户访问模式知识变得困难.该文提出一种分布式Web日志挖掘模型DWLMS,并以路径分析技术为例,提出了基于DWLMS的局部频繁路的更新算法LFP和全局频繁路径的更新算法GFP,解决了Web访问信息的异地存储、实时增长、分布式算法通讯量等因素给模式分析过程带来的困难.对提出的算法进行了实现和实际日志数据的测试,结果证明了算法的有效性.  相似文献   

8.
考虑到Web访问数据的动态特性,给出了一个从Web访问日志历史演变中挖掘频繁波动的Web访问模式的方法.首先采用无序树结构表示用户历史访问页面序列集合,然后给出了频繁波动Web访问模式的详细定义以及挖掘算法描述,最后,根据数据集中访问序列的大小和数量变化对于算法扩展性和性能的影响进行了实验.结果表明,该算法具备良好扩展性的同时,能够比较高效地提取出频繁波动的Web访问模式.  相似文献   

9.
提出运用数据挖掘技术,通过对教学网站的W eb日志进行挖掘,得到学生使用教学网站的模式。并根据挖掘得到的模式和规则,改进教学网站的建设,提高教学网站的使用价值。  相似文献   

10.
Web日志挖掘技术应用研究   总被引:9,自引:2,他引:9  
随着Internet的迅速发展,Web在人们的日常生活和工作中的地位日益显著.Web日志挖掘就是通过对Web日志记录的挖掘,发现用户访问的Web页面的浏览模式,从而进一步分析和研究Web日志记录中的规律,改进Web站点的性能和组织结构,提供个性化服务.本文首先分析了Web日志的分布和特点,再对Web日志挖掘中的两个阶段即数据预处理和日志挖掘算法做了详细介绍,最后对Web日志挖掘技术做了展望.  相似文献   

11.
An efficient hybrid algorithm for mining Web frequent access patterns   总被引:1,自引:0,他引:1  
We propose an cfficienl hybrid algorithm WDHP in this paper for mining frequent access patterns. WDHP adopts the techniques of DHP optimize its performance, which is using hash the to filter candidate set and trimming database. Whenever the database is trimmed to a size tess than a specified threshold, the algorithm puts the database into main memory By constructing a tree. and finds frequent patterns on the tree. The experiment shows that WDHP outperform algorithm DHP and main memory basedalgorithm WAP in execution efficieucy.  相似文献   

12.
给出了一种分布式Web日志挖掘模型DWLMS. 根据对挖掘过程及算法进行分析,提出了一种基于DWLMS的局部频繁路径的更新算法LFP和全局频繁路径的更新算法GFP,较好地解决了Web访问信息的异地存储、实时增长、分布式算法通讯量等因素给模式分析过程带来的困难. 在实验室对该方法进行了简单实现和实际日志数据的测试,结果表明了算法的有效性.  相似文献   

13.
A semantic session analysis method partitioning Web usage logs is presented. Semantic Web usage log preparation model enhances usage logs with semantic. The Markov chain model based on ontology semantic measurement is used to identifying which active session a request should belong to. The competitive method is applied to determine the end of the sessions. Compared with other algorithms, more successful sessions are additionally detected by semantic outlier analysis.  相似文献   

14.
网络日志挖掘中基于时间间隔的会话切分   总被引:10,自引:0,他引:10  
针对网络日志挖掘中的会话切分问题,提出了一种基于时间间隔的方法。该方法在相邻页面访问时间间隔超出某阈值时切分会话,针对特定IP的阈值根据其频率矢量来定义。实验表明:代理服务器IP和单用户IP的频率矢量具有不同特性,代理服务器IP的频率矢量具有Power-law的特点,而单用户IP的频率矢量具有Gauss分布的特点,在此基础上提出一种基于Gauss假设的方法来设定不同单用户IP的阈值。与传统的对所有IP地址使用单一的先验阈值进行切分的方法相比,该方法更为合理有效。  相似文献   

15.
Web挖掘技术及其在网络教学评价中的应用   总被引:6,自引:0,他引:6  
结合Web日志挖掘技术和数据立方体技术应用于网络教学评价体系,以网络教学体系的Web服务端和客户端的日志作为数据源,使用数据挖掘技术采集有用的数据进行分析抽取,建立数据库,再应用数据立方体技术、OLAP进行分析处理,得到所需的评价结果.结果表明,此算法可以客观的评价网络教学结果.  相似文献   

16.
基于Web挖掘的用户个性化服务研究   总被引:1,自引:0,他引:1  
随着WWW的广泛应用及相应的Web技术的出现.使数据挖掘的研究进入了一个新的阶段。Web日志挖掘就是运用数据挖掘的思想来对服务器日志进行分析处理,解决网络用户的个性化服务问题。论文主要论述了一个更新的频繁路径集的Web挖掘算法在网络用户个性化服务中的应用。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号