首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 69 毫秒
1.
讨论了当从序列数据库中删除某些信息时,序列模式的更新维护问题。提出了一种新的算法MA_D(Maintaining Algorithm while Deleting information), 处理因数据库更新而引起的序列模式的维护问题。该算法充分利用在前次模式挖掘过程中得到的信息,降低了挖掘新的序列模式的开销。实验分析表明,该算法对于序列模式的维护是十分有效的。  相似文献   

2.
针对序列模式挖掘中的增量挖掘问题,提出一种序列模式更新算法ISPBP.算法引入序列数据库结构来存储从原始数据库中挖掘出的所有项、最大频繁模式以及它们的支持数,采用间接拼接方法,只需处理增量数据库,避免了对更新后数据库的重新计算.对于因增量数据库新产生的频繁模式,利用了在增量数据库中出现的频繁项集来减小投影数据库,进一步提高了算法的效率.理论分析和实验表明,算法是有效可行的,并且增量数据库越大,算法在效率上的优越性越明显,算法ISPBP优于传统增量式更新算法.  相似文献   

3.
序列模式的一种挖掘算法   总被引:5,自引:1,他引:5       下载免费PDF全文
序列模式挖掘是数据挖掘中最重要的研究课题之一。基于记录数据库频繁集中各元素CtiD表的基础上,提出了序列模式挖掘的一种算法ISP。该算法考虑了项目集与序列之间的关系,利用时序连接法,采用不同的构造法,构造出相对应的候选集,从而计算出频繁集。由于算法ISP能够利用中间的挖掘结果,故提高了挖掘过程的效率。  相似文献   

4.
序列模式挖掘是数据挖掘中最重要的研究课题之一.针对支持度置信度框架的GSP算法的产生的序列模式很多时候不是用户感兴趣的,有时甚至会产生误导这一问题,我们提出用统计学中的χ2测试来衡量序列模式的相关性.相关性使在项集上的计算是向上封闭的,这样就减少了我们在搜索相关和不相关的项集的边界过程中出现的问题.  相似文献   

5.
序列模式挖掘是数据挖掘中最重要的研究课题之一.针对支持度置信度框架的GSP算法的产生的序列模式很多时候不是用户感兴趣的,有时甚至会产生误导这一问题,我们提出用统计学中的X^2测试来衡量序列模式的相关性.相关性使在项集上的计算是向上封闭的,这样就减少了我们在搜索相关和不相关的项集的边界过程中出现的问题.  相似文献   

6.
基于增量式遗传算法的粗糙集分类规则挖掘   总被引:8,自引:0,他引:8  
从规则获取和优化两个方面研究了基于遗传算法(GA)的增量式粗糙集分类规则挖掘方法.通过研究决策表和决策规则系数,建立了基于粗糙集表示和度量的知识理论,将GA和粗糙集分类规则挖掘算法相结合,在保持原有知识完备的前提下,利用GA对以增量形式获得的分类规则进行优化,获取最优分类规则.试验结果表明,执行增量式GA所需时间较执行一般GA所需时间要少,可有效完成分类规则优化的任务,同时还可提高分类的精度,使分类结果具有更好的可理解性.  相似文献   

7.
为了有效地挖掘物流管理系统中的物流频繁路径序列模式,提出了一种针对物流数据分析的路径序列挖掘算法ImGSP算法.ImGSP算法通过对原始路径数据库筛选,选出路径序列长度大于或等于候选序列长度的路径序列,有针对性地产生过度候选序列,来约减候选序列.实验结果表明:ImGSP算法能够有效地减少候选序列数量,生成频繁路径序列模式,进而产生物流中有用的规则.该方法不仅缩小了扫描数据库的规模,而且减少了生成频繁序列的候选序列集合.  相似文献   

8.
大型数据库中的高效序列模式增量式更新算法   总被引:7,自引:1,他引:7  
提出一种称为FIMS(fast incremental mining of sequential patterns)的序列模式增量式更新算法,处理因数据库的更新而引起的序列模式的维护问题。主要思想是利用原先的序列模式挖掘结果,通过建立一个投影数据库来减少对整个数据库的扫描次数和侯选序列的生成,从而提高挖掘的效率。实验结果显示在更新数据量远小于整个数据库的大小时,FIMS算法的性能优于GSP算法4-7倍。  相似文献   

9.
一种基于序列挖掘的分类系统框架   总被引:1,自引:0,他引:1  
为了有效地对序列数据进行分类,提出了一种集成分类挖掘和序列模式挖掘技术的分类系统框架(SPACS).先采用一套约束和裁减策略,为每个分类挖掘频繁序列模式,并将其转换为分类序列规则(CSR);再利用平均CSR匹配置信度和一个规则匹配算法构建有效的序列数据分类器.SPACS不需要在提取序列的特征后采用传统方法进行分类,可以直接利用从序列数据中提取出的频繁序列进行分类.实验结果表明,对于序列类型的数据的分类,SPACS比传统的决策树和关联分类方法具有更高的分类精度.  相似文献   

10.
本文针对在事务数据库不变 ,最小支持度和最小可信度发生变化的情况下 ,如何进行关联规则的维护问题进行了研究 ,并提出了一种有效的增量式更新算法  相似文献   

11.
基于PrefixSpan的快速交互序列模式挖掘算法   总被引:3,自引:0,他引:3  
为了克服序列模式挖掘过程中重复运行挖掘算法而产生的时空消耗,提出了一个快速、简单而有效序列模式的交互式算法FISPM,利用前次挖掘得到的序列构造序列模式数据库用来存储挖掘出来的所有序列, 通过缩减本次挖掘所要构造投影数据库的频繁项的数量来减少构造投影数据库所需的时间以及投影数据库的大小,从而减少时间和空间消耗,提高挖掘效率.通过设置全局最小支持度来减少算法迭代次数. 实验结果证明在交互挖掘过程中FISPM效率优于PrefixSpan.  相似文献   

12.
序列模式挖掘算法综述   总被引:1,自引:0,他引:1  
目前的主要序列模式挖掘算法可以分为3类:①基于Apriori的候选码生成-测试的方法;②基于垂直格式的候选码生成-测试的方法;③基于模式增长的方法.在介绍序列模式挖掘基本概念的基础上,描述了典型的挖掘算法,着重分析第②类序列模式挖掘算法的关键技术,并对各种算法进行详细的分析与比较,总结出它们的优缺点:前两类方法因产生巨大的候选序列而致挖掘代价剧增,而第③类模式增长方法避免了候选序列的产生,但挖掘长模式效率低.  相似文献   

13.
A Fast Interactive Sequential Pattern Mining Algorithm   总被引:3,自引:0,他引:3  
In order to reduce the computational and spatial complexity in rerunning algorithm of sequential patterns query, this paper proposes sequential patterns based and projection database based algorithm for fast interactive sequential patterns mining algorithm (FISP), in which the number of frequent items of the projection databases constructed by the correct mining which based on the previously mined sequences has been reduced. Furthermore, the algorithm's iterative running times are reduced greatly by using global-threshold. The results of experiments testify that FISP outperforms PrefixSpan in interactive mining  相似文献   

14.
提出在匹配度模型下频繁序列模式精简基的概念,精简基由相对于一系列匹配度阈值的最大序列模式组成,它是频繁序列模式的一个子集,可以用它来估计任一频繁序列模式的匹配度,并能将误差控制在确定范围内.还开发了一个从有噪音的序列数据库中挖掘这种序列模式精简基的算法,该算法采用了一种不需要保留候选序列模式的方法来检查最大序列模式,采用的剪枝技术也比以前的算法更有效率.实验结果显示计算频繁序列模式精简基是很有前途的.  相似文献   

15.
为了解决分布式环境下挖掘全局序列模式常产生过多候选序列,加大网络通信代价问题,提出了一种基于分布式环境下的快速挖掘全局序列模式算法--DMGSP.该算法将分布式环境下的各站点得到的局部序列模式压缩到一种语法序列树上, 避免了重复的序列前缀传输. 采用合并树中结点序列规则和项序扩展策略,对非频繁序列进行剪枝,有效地约简了候选序列,减少了网络传输量,从而快速生成全局序列模式.算法分析和实验结果表明,在大数据集环境下的DMGSP算法性能优越,能够有效地挖掘全局序列模式.  相似文献   

16.
一种基于关联规则的增量数据挖掘算法   总被引:4,自引:0,他引:4  
分析了关联规则增量更新挖掘算法FUP和IUA,指出了其效率低下的主要原因.针对关联规则增量更新问题,提出了一种新的简单高效的增量挖掘算法LIUA,并对算法LIUA进行了测试,测试结果表明算法是高效、可行的.  相似文献   

17.
分析了并行序列自身特色,提出了一种并行序列的挖掘算法PSMA,PSMA在hash树的基础上对并行序列事件反复挖掘,产生频繁有效序列模式,它是对传统序列模式挖掘算法的改进.PSMA算法针对并行序列,能更有效地发现所有频繁并行序列模式.  相似文献   

18.
序列模式挖掘是在多个有序事件序列中查找出现频率大于某个阈值的序列模式的数据挖掘方法 ,自从1995年序列模式挖掘的概念被提出以来 ,人们不断地对序列模式挖掘算法进行研究和改进 .本文介绍了一种新的序列模式挖掘方法—CSE算法及其具体实现方法 ,并对该算法性能做了初步的评价 .  相似文献   

19.
一种序列模式的概念及挖掘算法   总被引:1,自引:1,他引:0  
介绍了一种时间序列模式的形式和概念,讨论了其相关的挖掘算法.将时间序列模式既用于具有时间关系的购买行为的分析,以揭示购买行为后面一种序列关系信息,又用于其他有时间关联的事件分析.挖掘算法由以下几部分构成建立频繁物品集,进行数据处理和转换,并生成候选子序列,通过验证后,得到长度为2,3,…的序列集合,从中选出独立最大序列即为所求.通过实例指出了该算法和传统的Aprioriall算法的不同之处.结果表明,这种序列模式在网络通信、气象分析等领域具有广阔的应用前景.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号