首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 109 毫秒
1.
关联规则挖掘Apriori算法研究   总被引:1,自引:0,他引:1  
随着收集和存储在数据库中的数据规模越来越大,人们对从这些数据中挖掘出相应的联知识愈来愈感兴趣,关联规则一个典型的应用实例就是市场购物分析.本文介绍了关联分析的概念Apriori算法及其改进技术,对Apriori算法地优缺点进行了评价.  相似文献   

2.
针对仅有的挖掘算法不能较好地解决负关联规则的候选集数量爆炸问题,为满足用户的实际需求,提出带约束负关联规则概念,建立带约束负关联规则挖掘算法CNARM.同时,在挖掘过程中,利用最大频繁模式的性质来生成候选集,通过限制负关联规则中的前后件项目个数和利用负关联规则的性质来缩小候选集的规模.理论分析和实验结果表明本文提出的算法是有效可行的,具有较好的挖掘效率.  相似文献   

3.
介绍了由ChristianHidber提出的在线挖掘关联规则算法Carma,提出了该算法的若干改进,减弱了原算法第一步有交易的子集v被插入集合V的条件,同时改进了maxMissed的计算公式,使其计算更为简单。实验证明,以上改进提高了算法的速度。  相似文献   

4.
对挖掘关联规则的Apriori算法的关键思想进行了研究,给出了该算法的一个改进算法,提高了原算法的效率。  相似文献   

5.
数据立方体中多维关联规则挖掘算法   总被引:6,自引:1,他引:6  
数据立方体是数据仓库中数据组织和存贮的重要手段,它采用多维立体数据存贮方式来取代传统的平面数据存贮方式,为进行多维数据分析提供了根本保证。本文通过对稀松和密质两类立方体进行分析,给出了分别针对这两种情况的多维关联规则挖掘算法,并通过实验对其在不同情况下的性能进行了分析,结果证明,两种算法在特定情况下的效率提高是十分明显的。  相似文献   

6.
传统的关联规则Apriori算法中,只要两个k-1维的频繁项集有k-2个元素相同就可以生成维数为k的候选集,但在利用Web访问信息挖掘用户浏览模式发现频繁路径时,效率比较低下,本文利用Apriori算法的思想,对其进行了改进,进行频繁路径挖掘。  相似文献   

7.
关联规则的动态快速挖掘算法(Dynamic Fast Mining Algorithm,DFMA),不需要重复扫描原始数据库,克服关联规则挖掘最具代表性的方法Apriori算法耗时多、无法在线挖掘等诸多弱点。可支持在线挖掘及渐进式挖掘的需求。利用DFMA多层同步处理与更新的特性,搭配敏感度指数的定义,可以被用来挖掘对决策者有用的实时性信息。  相似文献   

8.
数据挖掘本质上是一种新的商业信息处理技术,通过对数据进行统计、分析、综合和推理,发现数据间的关联性、未来趋势以及一般性的概括知识,用以指导高级商务活动。由于需要,对数据间的关联性的数据挖掘算法模型已成为数据库及相关领域的一个研究热点,给出了一种基于分布式数据库的挖掘模型及其相应的一种有效的挖掘算法,其由若干个站点集合而成,各个站点拥有各自的数据库、中央处理机、客户端,以及各自的局部数据库管理系统,依靠通讯网络连接。采用购物篮分析式关联规则,将各个数据库文件的数据合成,从而得到挖掘结果,对挖掘的方法又进一步挖掘,即将不满足条件的规则重新传送到各分布式站点上进行更加精确的挖掘处理,从而避免了频繁的网络通讯。该算法在减轻网络频繁的通讯负担,体现并行计算以及异构数据挖掘方面具有独特优点。  相似文献   

9.
基于关系代数的关联规则挖掘算法   总被引:3,自引:0,他引:3  
目的提出基于关系代数理论的关联规则挖掘算法。方法利用数据预处理方法,剔除无关属性、获得相应的目标特征子集。结果基于目标特征子集,利用关系矩阵及相关运算给出了搜索大项集的基于关系代数理论的优化的关联规则挖掘算法,该算法只需扫描数据库一次。结论克服了经典的Apriori算法需要多次扫描数据库的缺点,同时算法具有良好的并行性和可伸缩性。  相似文献   

10.
宋宏明 《科技信息》2009,(16):176-177
经典关联规则挖掘在Web日志挖掘应用中已经比较成熟。在此基础上,针对某些商业网站的商品板块间存在层次关系,将多层次关联规则挖掘引入Web日志挖掘,能够在细节程度更低的层次或不同的细节层次间深入、全面地提供用户浏览商品过程中的频繁访问路径和频繁访问页组,以优化网站链接,为访问网站的用户提供更能满足需求的服务。本文以淘宝网女装/女士精品销售版块的链接页面为例进行验证说明。  相似文献   

11.
关联规则挖掘中层次算法的研究   总被引:1,自引:0,他引:1  
对层次算法中的Apriori、AprioriTid等典型算法进行了分析、探讨和评价。  相似文献   

12.
基于trie的关联规则发现算法   总被引:3,自引:1,他引:2  
分析了现有的关联规则挖掘算法,总结了当前的研究概况,从数据结构的角度出发,提出了用trie做数据结构存储交易数据库的所有项集,实现快速产生频繁项集,改进关联发现的性能.该方法只需一次扫描数据库,能够支持小的支持度计数和数据库的动态修改.  相似文献   

13.
在关联规则挖掘中,大量的数据是多维的,且带有时态特性,所以往往需要在时态约束的前提下挖掘多维关联规则.本文从一个实际问题出发,在单维Apriori算法和已有的工作基础上,提出了一种新的多维时态关联规则挖掘算法,并与类似算法进行了比较.  相似文献   

14.
频繁项集的挖掘效率是关联规则产生的关键.针对经典Apriori算法的瓶颈,提出一种改进算法,通过数组结构来保存项集信息,只须扫描一遍数据库减少了时间开销.在自连接前进行项目计数,减少参加连接的项集数量,减少了候选项集的数量.通过实例证明,改进算法的效率更高.  相似文献   

15.
介绍了模糊关联规则挖掘算法的基本思想及实现步骤,提出了模糊关联规则的并行挖掘算法.并行挖掘算法采用并行的模糊c-均值算法将数量型属性划分成若干个模糊集,并借助模糊集软化属性的划分边界.用改进布尔型关联规则的并行挖掘算法来发现频繁模糊属性集.最后由多个处理器并行地产生满足最小模糊信任度的模糊关联规则.在分布式互连的PC/工作站环境下进行性能分析,结果表明并行的挖掘算法具有好的可扩展性、规模增长性和加速比性能.  相似文献   

16.
 关联规则挖掘能使我们发现数据库中大量项目与项目之间的相关关系,但是用传统关联规则生成方法所生成的规则一是数量庞大,二是其中包含许多具有相同意义的规则,这必然对用户理解和提取信息带来干扰.通过求封闭项目集大大消减了频繁项目集数量,再由封闭项目集构造一种新的存储机制——-近似格,基于近似格可以得到冗余度较小的关联规则,从而提供用户简洁紧凑又无信息丢失的关联规则集.  相似文献   

17.
多层次关联规则的增量式更新算法   总被引:2,自引:0,他引:2  
目前已经提出的许多关联规则发现算法,大多数用于高效地发现大规模数据库中的关联规则,而对关联规则维护问题的研究工作却很少.文章提出一种增量式更新算法--IUPA(Incremental Updating Algorithm),用来解决多层次关联规则高效更新问题.  相似文献   

18.
为了解决缺省关联规则的增量挖掘问题,在算法DRMBAR的基础上,结合粗糙集理论及频繁模式树结构,提出了一种基于关联规则的缺省规则更新算法IADRBAR,该算法主要考虑最小支持度发生变化时缺省规则的更新问题,即在新的最小支持度下,如何高效地生成新的关联规则. IADRBAR在最坏的情况下仅须扫描决策表一遍,并利用上一次已经挖掘出的频繁项目集及关联规则,有效地提高缺省规则的更新效率.理论分析和实验结果表明算法是有效可行的.  相似文献   

19.
频繁项目集是满足最小支持度和最小置信度下的一个项目集合,但随着最小支持度的不同,就会产生不同的频繁项目集,而频繁项目集的发现又是一个高花费的过程.该文提出一个新的维护算法,用来解决关联规则的更新维护问题.  相似文献   

20.
一种基于关联规则的数据挖掘算法实现与应用   总被引:1,自引:0,他引:1  
对Apriori算法加以改进,提出了一种更高效的关联规则挖掘算法,在扫描数据库的同时把支持每个项目的事务都标记出来,采用一种新的方法来计算候选项目集的支持度.该算法只需对源数据库进行一次扫描,就可以找出所有的频繁集,具有很高的效率.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号