首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 62 毫秒
1.
基于IIS和web日志的关联关系的挖掘   总被引:4,自引:0,他引:4  
针对隐藏在web日志的大量记录中的规律性开展研究,提出了一种基于微软的ⅡS合理构建web日志并进行数据预处理的方案,在此基础上运用Apriori算法挖掘用户访问的页面间的关联关系,将数据预处理过程提前到web日志的建立过程中,可极大地降低数据准备的复杂性,将日志数据导入关系数据库中进行净化处理,大幅度减少了工作量,该方案可用于ⅡS下的商业网站。  相似文献   

2.
宋宏明 《科技信息》2009,(16):176-177
经典关联规则挖掘在Web日志挖掘应用中已经比较成熟。在此基础上,针对某些商业网站的商品板块间存在层次关系,将多层次关联规则挖掘引入Web日志挖掘,能够在细节程度更低的层次或不同的细节层次间深入、全面地提供用户浏览商品过程中的频繁访问路径和频繁访问页组,以优化网站链接,为访问网站的用户提供更能满足需求的服务。本文以淘宝网女装/女士精品销售版块的链接页面为例进行验证说明。  相似文献   

3.
经典关联规则挖掘在Web日志挖掘应用中已经比较成熟。在此基础上,针对某些商业网站的商品板块间存在层次关系,将多层次关联规则挖掘引入Web日志挖掘,能够在细节程度更低的层次或不同的细节层次间深入、全面地提供用户浏览商品过程中的频繁访问路径和频繁访问页组,以优化网站链接,为访问网站的用户提供更能满足需求的服务。本文以淘宝网女装/女士精品销售版块的链接页面为例进行验证说明。  相似文献   

4.
网站日志记录了用户的浏览行为,通过挖掘网站日志,可以分析用户行为,为优化网站结构提供有价值的数据.但是很多虚拟主机网站没有日志记录功能,这给日志挖掘带来了极大的不便.本文介绍一种生成日志的方法,并利用关联规则算法对其进行日志挖掘,发现用户的访问模式,帮助网站改进页面结构.  相似文献   

5.
邹丽霞 《河南科学》2010,28(9):1125-1129
对传统的关联规则挖掘算法FP-Growth方法进行改进,提出FP-Mine算法,并应用该算法对Web日志进行挖掘,探寻用户访问站点页面之间的关联规则,来帮助管理员改善站点的设计和企业改进市场商务决策.实验结果证明FP-Mine算法在生成频繁项集及关联规则的过程中,只需存储i-size和(i+1)-size频繁项集的节点的Freq-Set-Tree,且立即在其之上生成规则,所以缩短规则生成的时间,提高规则生成效率,同时释放i-size项集的节点,有效地节省内存空间.  相似文献   

6.
网站日志记录了用户的浏览行为,通过挖掘网站日志,可以分析用户行为,为优化网站结构提供有价值的数据.但是很多虚拟主机网站没有日志记录功能,这给日志挖掘带来了极大的不便.本文介绍一种生成日志的方法,并利用关联规则算法对其进行日志挖掘,发现用户的访问模式,帮助网站改进页面结构.  相似文献   

7.
本文提出了一种改进的遗传算法,用于优化Web日志挖掘的关联规则集。介绍了该算法的具体流程,提出新的染色体编码方案,新的编码配合本文的交叉操作使遗传过程更加优化,本文还对遗传的各步操作进行了改进,有效的避免遗传算法的早熟现象。  相似文献   

8.
在对分布式关联规则挖掘的三种主要算法:CD算法、DD算法及FD算法的原理及实现步骤进行详细的阐述的基础之上,得出其各自的优缺点,并指出FD算法在网络通信效率和算法灵活性方面更具有优越性。  相似文献   

9.
自动地从数据库中挖掘关联规则是非常重要且十分有用的,这是因为已开发和研制的数据广泛地遍布于整个世界。关联规则的不确定性由两个因子:支持度和可信度来度量.该文研究和给出已有的度量的性质,为进一步开发数据挖掘软件提供参考。  相似文献   

10.
基于关系代数的关联规则挖掘算法   总被引:3,自引:0,他引:3  
目的提出基于关系代数理论的关联规则挖掘算法。方法利用数据预处理方法,剔除无关属性、获得相应的目标特征子集。结果基于目标特征子集,利用关系矩阵及相关运算给出了搜索大项集的基于关系代数理论的优化的关联规则挖掘算法,该算法只需扫描数据库一次。结论克服了经典的Apriori算法需要多次扫描数据库的缺点,同时算法具有良好的并行性和可伸缩性。  相似文献   

11.
姚青山  张春霞 《河南科学》2008,26(3):329-332
通过分析Web日志记录来发现用户访问行为等,进而识别电子商务中的潜在客户,提高网络信息服务的质量,优化站点结构以及得到对于个性化系统有用的信息.提出一个Web使用挖掘系统的设计方案,包括系统的体系结构、功能结构及每个功能点的详细设计.为Web使用系统开发人员提供有价值的参考信息.  相似文献   

12.
Web日志挖掘是Web数据挖掘中非常重要的一个研究领域和研究方向,首先介绍了Web日志挖掘的过程,然后介绍了关联规则及关联规则算法——FP-growth算法,最后将关联规则中的FP-growth算法应用在网上书店系统中,实现对客户数据的关联规则挖掘。  相似文献   

13.
Web日志挖掘技术应用研究   总被引:9,自引:2,他引:9  
随着Internet的迅速发展,Web在人们的日常生活和工作中的地位日益显著.Web日志挖掘就是通过对Web日志记录的挖掘,发现用户访问的Web页面的浏览模式,从而进一步分析和研究Web日志记录中的规律,改进Web站点的性能和组织结构,提供个性化服务.本文首先分析了Web日志的分布和特点,再对Web日志挖掘中的两个阶段即数据预处理和日志挖掘算法做了详细介绍,最后对Web日志挖掘技术做了展望.  相似文献   

14.
陈红丽 《科学技术与工程》2012,12(8):1928-1930,1935
数据预处理在Web日志挖掘过程中起着至关重要的作用,直接影响日志挖掘的质量和结果。 文中分析了数据预处理的主要过程,并用站点首页结合动态时间阈值的方法对会话识别进行了改进。实验结果表明, 改进后的会话识别方法能更有效的识别出用户的真实会话。  相似文献   

15.
针对传统单纯聚类算法实现网页推荐精确度欠缺的问题, 提出一种基于Web日志挖掘的个性化网页推荐模型, 并实现了相应的网页推荐算法, 算法结合聚类分析和关联规则挖掘, 能有效实现网页推荐. 实验结果表明, 在保障网页页面推荐覆盖率的条件下, 该方法有较高的精确度、 有效性和实用性.  相似文献   

16.
Web日志预处理中会话识别的优化   总被引:3,自引:0,他引:3  
针对目前的各种会话识别方法,提出了一种优化的会话切分方法.该方法基于对用户下载时间、对页面的平均阅读时间及页面的链入、链出数等几个参数的综合,得到每个用户页面的访问时间阈值,根据该阈值来切分用户会话,得到会话侯选集合;然后,根据用户对页面内容的兴趣度、浏览特性等来删除会话中的链接页面和不感兴趣的页面,生成一种最终有效的访问页面序列,从而为以后的模式发现提供良好的数据.实验结果表明,相对于所有用户使用单一先验阈值和使用统计方法结合页面内容确定阈值的方法,笔者提出的方法能更准确地确定页面访问时间阈值,得到更为合理有效的会话集合.  相似文献   

17.
一种基于不动点的关联规则挖掘方法   总被引:1,自引:0,他引:1  
本文基于不动点理论,给出了关联规则挖掘的一些基本结论,进一步丰富了数据挖掘的基本内容.  相似文献   

18.
基于Web使用挖掘的学生思想动态分析   总被引:1,自引:0,他引:1  
本文借助Web服务产生的大量日志数据,运用Web使用挖掘技术,对点击流数据源进行收集、预处理,并用基于Separate的约束性关联规则挖掘算法对学生的思想进行分析,发现学生的思想动态,为教育管理者管理学生提供决策依据。  相似文献   

19.
提出了一种重构网站结构的方法,并将此方法应用于Web日志挖掘的数据预处理中.实验表明,本方法能够更好地还原用户访问情景,为Web日志挖掘提供有效数据。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号