共查询到17条相似文献,搜索用时 62 毫秒
1.
该算法结合项集的有序特性有效压缩了频繁项集的数量,提高了算法效率,但是频繁2_项集的产生仍需要占用大量的存储空间,本文利用散列函数对候选频繁2_项集进行剪枝,这样频繁集的数目大大减少,不仅节省了存储空间、减少了计算开销,而且又保持了频繁项集的完整性. 相似文献
2.
传统的基于关联规则的挖掘算法采用的是统一的最小支持度,但是在实际的事务数据库中数据项的重要性是不同的。针对目前多支持度和增量式关联规则更新维护的局限性,提出一种基于多支持度的增量式关联规则挖掘算法。允许用户根据不同项的重要性设置权值,有利于发现更多有趣的规则。采用矩阵的向量内积策略,结合动态剪枝,无需多次扫描事务数据库,不生成庞大候选集。实验结果验证了算法的有效性。 相似文献
3.
提出了一种基于Hadoop架构和MapReduce编程模型实现的面向大数据的FP-Growth频繁项集挖掘的改进算法。首先将事务数据库按每个频繁1项进行抽取,生成对应的投影数据库,并将这些投影数据库分发到一个个节点机上;再由节点机对投影数据库进行划分,生成一个个规模更小的子数据库,并由节点机使用改进后的算法并行挖掘生成部分频繁项集;最后归并所有部分频繁项集得到全部的频繁项集。该算法无需像传统的FP-Growth算法一样为事务数据库生成庞大的FP树,有效解决了传统FP-Growth算法及其一些改进算法中因单机内存存储不下庞大的FP树而导致算法失效的问题。同时,由于所划分的子数据库规模接近,分发到各节点机上的负载更均衡,使得算法效率更高。 相似文献
4.
介绍了一种基于Hash-tree的产生关联规则的方法。在此方法中通过在候选集排序和在获得项集出现次数的时候采用了Hash-tree的方法大大提高了算法实现的速度,并在实际应用中也取得了很好的效果。 相似文献
5.
关联规则是数据挖掘中的重要研究内容之一,对在事务数据库不变,只对最小支持度和最小可信度进行改变的情况下,针对关联规则的维护问题,设计了一个增量式更新的改进算法AIUA。 相似文献
6.
传统的关联规则挖掘方法容易生成一些无用规则,甚至生成误导规则,也不能区分正负关联规则.通过相关性度量,建立了基于相关性度量的兴趣度模型,并利用兴趣度模型改进了关联规则算法,最后,通过实例验证了此算法不仅能够避免生成无用规则和误导规则,还能生成一些感兴趣的负关联规则. 相似文献
7.
基于模式矩阵的P_Matrix算法 总被引:1,自引:0,他引:1
Apriori算法是关联规则挖掘中最经典的算法,该算法需多次扫描数据库并产生海量的候选项目集.利用模式矩阵对Apriori算法进行改进,提出一种P_Matrix算法,它使扫描数据库的次数降为一次,同时不产生候选项目集而直接产生频繁项目集,从而使算法的时间复杂度和空间复杂度大大降低. 相似文献
8.
GIS的空间数据具有海量性、复杂性的特点,为了能更有效的挖掘隐藏在GIS中的知识引入了概念格技术。然而,又为了解决关联规则生成算法效率低、构造Hasse图效率低及冗余多的问题,提出在FP-Tree的基础上直接生成经过量化约简的频繁概念格。将该算法应用于GIS的空间数据挖掘取得了实际可行的应用结果。 相似文献
9.
InClosPan:大型数据库中闭序列模式的增量挖掘 总被引:1,自引:0,他引:1
许多现实数据库都以增量形式增长,不希望在每次更新了数据库之后,又重新挖掘完整数据库,增量算法成为必需.研究了当初始数据库中增加了新的事务或增加了新的顾客时,增量挖掘闭序列模式的问题.给出了一个新的频繁闭序列模式增量挖掘算法InClosPan,该算法利用已得到的结果进行增量挖掘,减少了重新挖掘数据库的费用. 相似文献
10.
本文运用关联规则发现方法与人事信息库进行数据挖掘,寻找高校系科办学评估体系中各因素间的关联关系,并根据关联关系强弱分析各因素的权重设置的合理性。本文分析和指出了现有一些看法的优缺点,提出了在Tid-optim算法,并对发现的规则进行分析,通过数据抽样建立合理性评价体系,有效地解决了权重设置的不合理问题,为高校管理决策提供科学依据。 相似文献
11.
杨宁 《南昌大学学报(理科版)》2003,27(2):195-197
分析了模糊逻辑规则的形成过程,介绍了模糊推理方法,提出了基于模糊规则化的数据挖掘方法。由分析可以看出,基于模糊逻辑规则的方法能从大量的数据集合中有效地发现有价值但不明显的信息并挖掘出有价值的信息。在实际系统中有着一定的意义。 相似文献
12.
色彩是民族服饰的核心要素,也是民族文化元素的重要组成部分,构建一套兼具科学性与实用性的色彩体系极具挑战性。在传统色彩地理学方法基础上,通过提取主题色和改进的关联规则挖掘方法,获取色彩数据、寻找色彩规则,并对其进行自然色彩体系(NCS)编谱分析,构建了一套苗族服饰色彩体系(Miao’s costume color system,MCCS)。该体系有助于进一步挖掘苗族服饰的配色规律,实现对苗族服饰色彩的数字化保护,为民族服饰色彩传承机理的探索与研究提供新的思路。 相似文献
13.
色彩是民族服饰的核心要素,也是民族文化元素的重要组成部分,构建一套兼具科学性与实用性的色彩体系极具挑战性。在传统色彩地理学方法基础上,通过提取主题色和改进的关联规则挖掘方法,获取色彩数据、寻找色彩规则,并对其进行自然色彩体系(NCS)编谱分析,构建了一套苗族服饰色彩体系(Miao’s costume color system,MCCS)。该体系有助于进一步挖掘苗族服饰的配色规律,实现对苗族服饰色彩的数字化保护,为民族服饰色彩传承机理的探索与研究提供新的思路。 相似文献
14.
首先简单介绍了相关规则及其并行开采算法的一些基本情况,然后指出了现有算法在分布式异构数据库中不能有效利用计算资源和造成信息丢失的问题.在证明了一个基本的定理之后,提出了基于HDDMiner模型的异步并行算法,并就其中的一些问题作了说明.最后,介绍了分布式异构数据库中数据开采的并行算法中一些仍需继续研究的问题. 相似文献
15.
多元组粗糙集合是对传统粗糙集合的一种推广,它具有比传统粗糙集合描述更直接,更方便等优点,并能导出决策表中相应的确定规则,可能规则和否定规则,通过比较发现它能有效的提高规则生成效率,文中所给出的算法特别适合于具有重复元组的决策表。 相似文献
16.
赵俊 《宁波大学学报(理工版)》2000,13(1):49-52
通过在单输入单输出(SISO)的近似推理方案(ARS)中,用模糊产生式规则表示知识,以模糊集值模糊集刻划模糊产生式规则中出现的模糊状态,提出了一个基于模糊集值模糊集的近似推理框架,从而使单输入单输出的近似推理方案(ARSFSISO)的推理能力得以增强。 相似文献
17.
任何可执行文件都必须满足一定的结构特征.本文以Windows平台下的PE文件为研究对象,从PE头、节头、节代码出发,给出了17个结构特征;针对给定正常软件和各类恶意软件,获得了这些属性取值分布特征;采用多类数据挖掘分类技术获得了正常软件与恶意软件的判定规则.实验结果表明,C5.0的分类算法检测准确性最好,达到94.16%.这些规则可以为软件可信性度量提供依据. 相似文献