共查询到18条相似文献,搜索用时 93 毫秒
1.
关联规则挖掘是数据挖掘研究领域中的一个重要的方法,旨在挖掘事务数据库中有趣的模式。阐述了Web日志挖掘和关联规则的基本内容,分析了经典Apriori算法的不足之处,提出了改进的算法。另外,利用论坛Web日志数据进行了对比实验,实验结果表明改进后的算法性能有较大提高。将改进后的算法应用于网络论坛的日志挖掘,找出用户的个性化访问模式,从而提高论坛的服务质量。 相似文献
2.
关联规则是Web挖掘中一个重要的研究领域。为了挖掘出隐藏在数据间的相互关系,将关联规则的概念引入到Web挖掘系统中,把用户的访问路径以关联规则的形式表现出来。基于Apriori算法的思想,给出了适合Web挖掘用户访问的新Apriori算法规则及其模式,最后将结果在一些较简单的网页上进行了验证,取得了较好的应用效果。 相似文献
3.
Web日志挖掘是Web数据挖掘的一个重要研究领域。Web日志挖掘通过发现Web日志中用户的访问规律和模式,可以提取出其中潜在的规律和信息,人们对这个领域的研究也日益重视。然而,传统的基于关联规则的Web日志挖掘算法都是基于所有关联规则的。这种方式往往挖掘产生大量的候选规则,而且存在大量冗余的规则。提出了一种新的无冗余的Web日志挖掘算法,该算法通过引入频繁闭项集合最小关联规则的概念,从而解决了以往基于所有关联规则挖掘算法中出现的上述问题。 相似文献
4.
随着网络攻击数量和种类的不断增加,基于蜜罐(Honeypot)系统的海量攻击日志分析变得更加困难和耗时。仅仅凭借一个事件推断黑客意图和行为是非常困难的。这就要求在蜜罐系统的研究中进行整体性分析,数据挖掘技术就是这样的整体性分析工具。首先阐述了蜜罐系统的原理,然后以开源蜜罐系统Honeyd捕获的真实日志数据为例,使用关联规则挖掘先验(Apriori)算法对日志的特定属性进行分析,找出不同网络连接记录属性之间的关联规则,从中发现并理解攻击者的攻击行为和攻击模式,验证了数据挖掘技术应用于蜜罐日志分析中的可行性。 相似文献
5.
Internet的普及使得数据挖掘的重点从经典的基于关系数据库的应用转移到了基于Web的应用。首先介绍了Web挖掘的基本概念及其当前发展的几个方向,然后将一种传统的数据挖掘方法关联规则挖掘应用到Web的海量数据上,并给出了挖掘的基本算法,在此基础上挖掘出新的关联规则及其模式,最后将结果在一些较简单的网页上进行了验证,取得了较好的应用效果。 相似文献
6.
对Web日志中用户访问数据的挖掘可以很好的获得系统优化的信息,方便Web站点走向个性化、智能化道路。本文深入了解了Web日志格式的内容,研究了进行Web日志挖掘的一般流程。采取预处理的方式来获得用户有用信息,经过数据清理、用户识别、用户会话识别、界面过滤、路径补充来完成信息的有效汲取,最终通过模式发现和模式分析来完成对使用者感兴趣信息的传送工作,将Web日志挖掘技术真正应用在站点优化进程中。 相似文献
7.
K-均值聚类对初始聚类中心的选取较敏感,容易陷入局部最优.将改进的遗传算法与K-均值聚类相结合,以优化聚类中心.在种群进化过程中,父代个体均从种群中适应度高的个体中选择,同时,根据个体适应度动态调节交叉概率和变异概率,避免早熟现象.文中采用改进的遗传算法,对学院网站服务器上的Web日志进行用户和页面聚类,达到了很好的聚类效果. 相似文献
8.
9.
关联规则是捕述Web用户行为特征的重要依据。传统的基于统计学的Web关联规则挖掘算法注重对现有数据的分析,不能针对Web关联挖掘的特点提供有效的预测手段和优化反馈措施。本文提出一种基于遗传算法的Web关联挖掘算法体系,实验证明它能。弥补传统Web关联挖掘算法的不足,为Web关联挖掘提供了一种新的思路。 相似文献
10.
基于Web挖掘的个性化学习系统 总被引:1,自引:0,他引:1
随着Internet的深入发展和不断的普及,Web已经成为人们获取信息,进行学习的最重要的手段之一.但是,目前Web系统只为所有用户提供相同的服务,而Web用户的需求却千差万别,用户希望Web系统能够根据他们的不同特性提供个性化的服务.普通的学习系统已经不能适应他们的学习,不能体现他们的个性化.因此,根据他们的不同特性开发个性化的学习系统已变得相当重要. 相似文献
11.
孙金鑫 《智能计算机与应用》2018,(3):132-135
上个世纪,数据挖掘技术的兴起,帮助研究者能够从大量的数据中提取有价值的信息,Agrawal等人在90年代提出了关联规则挖掘技术,来发现大量数据中的相关性信息.经过多年的发展,关联规则已然成为数据挖掘技术中高度重要并相对而言较为成熟的一种方法.本文概论了关联规则在数据挖掘中的运用,详述了关联规则中现有经典算法,并对FP-Growth算法做出优化. 相似文献
12.
给出一种基于遗传算法和蚂蚁算法相结合的多维多层关联规则挖掘算法,新算法利用了遗传和蚂蚁算法共有的良好全局搜索能力,并克服了经典频集算法的不足,以及遗传算法局部搜索能力弱和蚂蚁算法搜索速度慢的缺陷.实验结果表明,新算法在对具有稀疏特性的多维关联规则的挖掘中体现了良好的性能,提高了生成关联规则的有效性. 相似文献
13.
In this letter,on the basis of Frequent Pattern(FP) tree,the support function to update FP-tree is introduced,then an incremental FP(IFP) algorithm for mining association rules is proposed.IFP algorithm considers not only adding new data into the database but also reducing old data from the database.Furthermore,it can predigest five cases to three case .The algorithm proposed in this letter can avoid generating lots of candidate items,and it is high efficient. 相似文献
14.
15.
16.
17.
针对渐进式关联规则挖掘问题提出了一个有效的处理算法,即IDM—A算法。它能根据数据库的动态变化,高效地进行关联规则的更新。通过知识数据库的维护,最多只需要扫描原始数据库一次,就能得到所需的频繁项目集,能有效地降低更新关联规则所需的时间成本。 相似文献