首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 93 毫秒
1.
随着数据挖掘技术的成熟,其中关联规则在大规模数据中的应用成为了目前的热点.为了提高在大规模数据下进行数据挖掘的效率,在MapReduce中通过引入归并函数Fusion来提高执行剪枝任务的效率并进行了优化研究,提出了一种基于云理论的关联规则Apriori算法,详细论述了实现的过程以及关键技术.通过实验表明,该方法取得了良好的实验效果,克服了Apriori算法耗时多、识别率低下等问题,是实现在大规模数据进行数据挖掘的实用工具.  相似文献   

2.
互联网作为一个国家教育事业的基础设施,是人们获取知识的一个重要途径。传统网络服务系统功能简单,服务单一,网络利用率不足。文章改进关联规则Apriori算法并应用于网络数据处理中,提高数据利用率。  相似文献   

3.
关联规则挖掘是数据挖掘技术的一个重要分支,其中Apriori算法是最经典和最有影响力的算法。本文在讨论和分析了关联规则挖掘的基本概念后,提出了一种减少扫描数据库次数的改进算法。改进后的算法分析证明,它可以有效地提高数据挖掘的性能。  相似文献   

4.
单维关联规则快速Apriori算法研究   总被引:5,自引:3,他引:2  
文章通过Apriori和Apriori Tid算法结合生成局部频繁项集,改进了Apriori算法运行速度过慢的问题.再通过程序优化进一步提高了算法运行速度.得到了快速Apriori算法。  相似文献   

5.
Apriori算法是关联规则的经典算法之一。文中是基于对Apriori算法原理的研究从而完成电影标签推荐的应用,实现当用户给自己喜欢的电影打标签时,可通过关联规则进行电影推荐。实验采用Python语言实现Apriori算法,对数据集MovieLens采用One-hot编码进行处理,利用Apriori算法寻找到数据集中的频繁项集,根据找到的频繁项集生成关联规则。实验结果表明,基于Apriori算法的电影标签推荐得到的实验结果更准确、快速、高效,同时也取得了良好的电影标签推荐效果,从而提升用户体验。  相似文献   

6.
Apriori算法是一种经典的数据关联规则挖掘算法,本文借力云计算环境,根据MapReduce模型并行运行实现的特点,对Apriori算法进行优化,并行化改进后的MR-Apriori算法大大降低了时间消耗,其较强的扩展能力能更好地运用于大规模数据分析、处理和挖掘的需要.  相似文献   

7.
首先介绍了Apriori关联规则算法及其缺陷,然后对其加以改进,并分析了改进后算法的原理、框架、步骤等。  相似文献   

8.
首先介绍了Apriori关联规则算法及其缺陷,然后对其加以改进,并分析了改进后算法的原理、框架、步骤等。  相似文献   

9.
采用Apriori算法,对106名高度危险的女性服刑人员的COPA-PI量表测量的心理数据进行关联规则挖掘,得到2条有效关联规则,得出有暴力行为和自杀行为两类高度危险的女性服刑人员的心理特征规律,以期为精准矫治、监管安全提供辅助决策.  相似文献   

10.
11.
电信网络中各种频繁告警事件的发生通常具有一定的时序关系,据此提出了一种具有时序特征的告警关联挖掘算法。该方法解决了以往算法中无法发现告警序列之间时序关系的问题。其核心思想是在建立FP-tree时加入告警的时间特征,然后对FP-tree进行挖掘。实验证明,该算法能够快速、准确地从海量数据中挖掘出具有时序特征地关联规则。  相似文献   

12.
频繁项集挖掘是关联规则挖掘中至关重要的一步。对于稠密数据集的频繁项集挖掘,传统的挖掘算法往往产生大量无用的中间结果,造成内存利用率的极大浪费,尤其是在支持度较低的情况下。Diffsets算法通过引入"差集"的概念,在一定程度上解决了挖掘过程中产生的大量中间结果与内存容量之间的矛盾。改进型Diffsets算法是在原算法的基础上,在差集运算过程中根据差集中所包含的事务标识个数进行递减排序,进一步减少了挖掘过程中产生的中间结果数量。分析与实例表明,改进后的算法在执行过程中将占用更少的内存空间,加快了算法的收敛速度。  相似文献   

13.
本文提出了改进关联挖掘算法的数据挖掘方式.在自然连接产生候选集以前,先进行一个修剪过程,减少参加连接的项集数量,进而减小生成的候选项集规模,减少了循环迭代次数和运行时间,同时在连接判断步骤中减少多余的判断次数,避免传统方法的弊端.仿真实验证明,这种改进算法能够大幅提高数据的查询速度,取得很好的效果.  相似文献   

14.
一种改进的加权关联规则挖掘算法   总被引:1,自引:1,他引:0  
基于经典Apriori算法的加权关联规则挖掘算法New-Apriori存在3个问题,需要多次扫描数据库,权值定义不合理和权值的引入导致Apriori基本性质不再成立。为了解决这些问题,采用将矩阵和加权关联规则算法相结合的方法,该改进算法具有只需要扫描一次数据库,权值的定义既考虑到了权重大的项目,也没有忽略频繁出现而权重小的项目,并引入K-项支持期望作为减枝的依据的特点。  相似文献   

15.
针对传统关联规则挖掘中可能会忽略具有时间因素的关联规则的问题,提出了一种具有时间约束的改进时态关联规则算法.该算法通过计算模式平均支持度、数据集平均支持度、模式集中度等参数来判断Apriori算法所得到的模式是否在某一时间区域数据集上具有较高支持度,再对该数据集进行进一步挖掘,以找到更精确的和时间相关的模式,从而得到单个或不同时间区间上的关联规则以及跨时间区间和跨事务的关联规则.通过实验分析,该算法是可行的,并在实际应用中有一定的意义.  相似文献   

16.
基于候选项集个数上阶的增量式关联规则更新算法   总被引:2,自引:0,他引:2       下载免费PDF全文
提出了一种有效的增量式关联规则挖掘算法IAR,算法的特点在于:提出并采用了基于候选项集个数上阶的选择扫描数据库的机制,可有效减少数据库的扫描次数;算法是一种通用的增量式算法,提出了最小支持度和数据库均改变时,增量式挖掘中的重要性质,从而可充分利用上一次挖掘的结果,有效减少候选项集的数目.并且提出了基于组合数学和项集等价类理论的计算候选项集个数的上阶的方法.通过大量的数据实验,表明算法的效率比已有的算法有了很大提高.  相似文献   

17.
一种电信告警关联规则的改进算法   总被引:1,自引:0,他引:1  
本文提出了一种基于矩阵运算挖掘告警关联规则的算法。该方法解决了以往WINEPI算法中需要多次扫描数据库的问题,其思路是首先将告警数据库转化为告警关联矩阵,然后对矩阵进行运算,得到告警间的关联规则。实验证明,该方法的执行效率与WINEPI相比有明显提高。  相似文献   

18.
遗传算法在Web关联挖掘中的应用研究   总被引:2,自引:1,他引:2  
关联规则是描述Web用户行为特征的重要依据。传统的基于统计学的Web关联规则挖掘算法注重对现有数据的分析,不能针对Web关联挖掘的特点提供有效的预测手段和优化反馈措施。文章提出一种基于遗传算法的Web关联挖掘算法体系,实验证明它能弥补传统Web关联挖掘算法的不足,为Web关联挖掘提供了一种新的思路。  相似文献   

19.
随着信息化建设和应用进程的加快,超市的数据库中积聚了大量的销售信息,本文介绍了数据挖掘中的关联规则在超市数据分析中的应用,帮助企业的决策者根据发展形势的变化及历史数据做出正确的决策。  相似文献   

20.
朱红萍  巩青歌 《电子科技》2011,24(10):85-87,92
针对关联规则挖掘中的高效更新问题,对增量和负增量问题进行了讨论,提出当最小支持度发生变化时可归结为数据库发生变化的情形进行讨论。采用十字链表来分别存储原数据库DB和变化数据库db中,各频繁项集及其支持度s1和s2,通过对s1,s2及最小支持度s0的比较分析,判断项集是否为频繁项集,减少了扫描数据库的次数,提高了更新后的...  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号