首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 187 毫秒
1.
频繁项集挖掘是挖掘关联规则的关键。为了得到用户感兴趣的关联规则,要不断调整最小支持度,这必将引起频繁项集的更新。基于事务压缩思想,提出一种挖掘和更新算法,挖掘频繁项集时扫描压缩的数据库,更新时能减少新产生的k-项集的数量,从而加快了更新速度。  相似文献   

2.
为了从大规模数据集中更高效地发现有价值的规则,本文提出一种迭代的频繁内嵌无序树模式挖掘算法:TETPM.同时设计了两个工作负载划分策略:TETPM-P和TETPM-E. TETPM-P由模式划分工作负载,而TETPM-E则通过模式实例来划分工作负载.实验评估表明,两种算法均可以有效地从大型数据集中挖掘频繁内嵌模式,TETPM-P适合于模式实例数更均衡的数据集,而TETPM-E则更适合规模更大的数据集.  相似文献   

3.
传统的基于关联规则的挖掘算法采用的是统一的最小支持度,但是在实际的事务数据库中数据项的重要性是不同的。针对目前多支持度和增量式关联规则更新维护的局限性,提出一种基于多支持度的增量式关联规则挖掘算法。允许用户根据不同项的重要性设置权值,有利于发现更多有趣的规则。采用矩阵的向量内积策略,结合动态剪枝,无需多次扫描事务数据库,不生成庞大候选集。实验结果验证了算法的有效性。更多还原  相似文献   

4.
InClosPan:大型数据库中闭序列模式的增量挖掘   总被引:1,自引:0,他引:1  
许多现实数据库都以增量形式增长,不希望在每次更新了数据库之后,又重新挖掘完整数据库,增量算法成为必需.研究了当初始数据库中增加了新的事务或增加了新的顾客时,增量挖掘闭序列模式的问题.给出了一个新的频繁闭序列模式增量挖掘算法InClosPan,该算法利用已得到的结果进行增量挖掘,减少了重新挖掘数据库的费用.  相似文献   

5.
从大数据中挖掘隐藏的、多维的有价值的关联规则具有广泛的应用价值。关联规则挖掘经典算法Apriori存在重复扫描数据库并产生大量候选项集的瓶颈问题,FP-growth算法虽不产生候选集,但FP-tree不支持大数据的存储与遍历,不能有效支持大数据挖掘;另外,Apriori以及FP-growth算法实施增量挖掘都需要重构关联规则,不适用于增长型事务数据挖掘。针对这些问题,设计基于关系数据库表SourceIndex的DB-growth算法,采用模式组合生成模式串的方式,更新数据库构建频繁集,有效地提高了关联规则的挖掘效率,同时对增量挖掘及深度挖掘也能得到较好的支持。更多还原  相似文献   

6.
● 挖掘Web频繁访问模式的一种混合式高效算法 (AnEfficientHybridAlgorithmforMiningWebFrequentAccessPatterns)P .5 5 7~ 5 6 0战立强1,刘大昕2 (1.东北林业大学经济管理学院 ,黑龙江哈尔滨 15 0 0 4 0 ;2 .哈尔滨工程大学计算机学院 ,黑龙江哈尔滨 15 0 0 0 1)摘 要 :提出了一种挖掘频繁访问模式的高效混合式算法WDHP ,该算法继承了DHP算法使用hash树过滤候选集以及裁剪数据库的基本方法 ,当数据库被逻辑裁剪到一定程度时 ,便将数据库以访问路径树的方式存储于内存 ,并在内存中完成后继的挖掘 .实验表明WDHP算法不仅优于DHP…  相似文献   

7.
基于模式矩阵的P_Matrix算法   总被引:1,自引:0,他引:1  
Apriori算法是关联规则挖掘中最经典的算法,该算法需多次扫描数据库并产生海量的候选项目集.利用模式矩阵对Apriori算法进行改进,提出一种P_Matrix算法,它使扫描数据库的次数降为一次,同时不产生候选项目集而直接产生频繁项目集,从而使算法的时间复杂度和空间复杂度大大降低.  相似文献   

8.
提出一种新颖的组密钥管理协议,该协议指定Internet上的不可信路由器充当演化节点,组织一棵分层的密钥参数演化树,演化并传送生成会话密钥的相关信息.通信成员被划分为子组后依附在演化节点上,并根据收到的密钥演化信息和自己持有的秘密参数计算出用于安全组通信的会话密钥.该协议的优点为密钥管理负载由树中不能泄露组通信内容的演化节点所分担,且每个演化节点的密钥管理开销独立于组规模,实验结果表明:本文的协议比已有的LKH和IOLUS协议具有更好的可扩展性.  相似文献   

9.
数据流最频繁K项挖掘是指在数据流中找出K个项,它们的支持数大于数据流中的其他项.已有的一些算法只能挖掘整个数据流的频繁K项,而无法找出距离最近的任意时间段内的最频繁K项.因此,提出一种基于多层概要结构的数据流最频繁K项挖掘算法MMF(K)_MS,新算法利用各层节点数目可变的HFVN框架结构来支持对不同时间粒度的查询,同时采用Count-Sketch数据结构来维护各层的概要信息,并通过实验验证了算法的有效性.  相似文献   

10.
GIS的空间数据具有海量性、复杂性的特点,为了能更有效的挖掘隐藏在GIS中的知识引入了概念格技术。然而,又为了解决关联规则生成算法效率低、构造Hasse图效率低及冗余多的问题,提出在FP-Tree的基础上直接生成经过量化约简的频繁概念格。将该算法应用于GIS的空间数据挖掘取得了实际可行的应用结果。  相似文献   

11.
传统的关联规则挖掘方法容易生成一些无用规则,甚至生成误导规则,也不能区分正负关联规则.通过相关性度量,建立了基于相关性度量的兴趣度模型,并利用兴趣度模型改进了关联规则算法,最后,通过实例验证了此算法不仅能够避免生成无用规则和误导规则,还能生成一些感兴趣的负关联规则.  相似文献   

12.
为了进一步提高基于P2P的内容分发网CDN(content delivery network)的搜索效率,对用户就近组成的节点群(peer group)进行了研究,提出了节点群相似的概念和基于关键词的节点群相似性度量模型.当一个需求在本节点群不能满足时,优先到相似性高的节点群中查找,以较快地满足跨节点群的需求.度量模型对任意两个节点群首先根据节点中各文档关键词的一致程度判断对应两个节点的相似度,然后根据相似节点对的数量和相似度来判断两个节点群相似度.实验表明,使用所提出的度量模型得出的计算结果比传统的基于VSM的算法更接近于实际情况.  相似文献   

13.
针对无线传感器网络节点定位的能量均衡问题,提出采用蜂窝结构GAF算法进行拓扑控制的基础上,使用改进的加权质心算法进行节点定位。该算法通过区域划分增加信标节点选择的有效性,通过对距离加权减少多径效应影响。性能分析和仿真结果表明该算法可构造良好的网络拓扑结构,均衡节点能耗,延长整个网络的生存周期,提高节点定位精度,在密集型网络中可获得良好的定位性能。 更多还原  相似文献   

14.
为了解决传统图像匹配方法在PCB图像匹配过程中准确率低、耗时长的问题,提出一种基于SURF算法结合曲线拟合方法和K-means聚类算法的改进匹配方法。算法如下:首先利用SURF算法提取图像的特征点,并采用最近邻域法对生成特征描述子的特征点粗匹配得到特征点匹配对,然后通过曲线拟合方法滤除部分匹配对,减少匹配耗时,最后采用K-means聚类算法对匹配对聚类分析提取有效的匹配对,完成对特征点的精确匹配。实验结果表明该算法有效剔除了错误的匹配对,提高了PCB图像的匹配精确率,具有较好的稳定性和实时性。  相似文献   

15.
已有的图采样方法侧重于单图采样,关注如何在一张图上通过采样保留其特定的拓扑结构特征。随着数据采集能力的提升,多重网络图在实际应用中越来越普遍,即相同的节点集在不同场景中具有不同的网络关系。针对传统图采样方法无法兼顾多重网络图结构特征的问题,提出了表征学习驱动的多重网络图采样算法。首先,设计融合多重网络图结构特征的图表征学习方法,将节点投影至二维的表征学习空间;其次,利用改进的自适应蓝噪声采样算法,考虑节点密度和网络连通性,从表征学习空间筛选节点,以保持其多重网络结构特征及图上下文结构特征。进而开发了一套多重网络图采样可视分析系统,支持用户交互式地探索多重网络图采样,并与已有采样算法进行对比。案例分析和评估实验证明了本文算法在多重网络图采样中的有效性。  相似文献   

16.
在分布式实时数据库系统中,事务管理一方面要保证事务的定时限制,另一方面又要保证分布式事务的全局可串行化和各子事务的局部可串行化。因此,在这种特殊的环境下,传统的分布式事务管理机制已不再适用。从一个全新的角度出发,针对事务的整个生命期进行研究,对事务管理机制中的并发控制和提交处理这两个重要环节进行综合考虑,研究影响实时性能的因素和相应的解决方法,并以提高系统实时性为目标对传统协议进行了改进。从而使事务管理在采用这一整套改进的协议后,能够很好地胜任于分布式实时环境。  相似文献   

17.
根据 MPEG- 4对多媒体信息描述的新压缩标准 ,在深入研究尺度小波变换和嵌入式小波零树压缩编码原理的基础上 ,探讨了两种基于小波零树编码的具有连续分辨率的改进视频编码方法 .尺度小波零树编码将低通子带独立编码、其它子带多尺度零树熵编码 ,实现了自然 /合成视频信息的空间 /质量尺度完全可调 .尺度自适应运动补偿小波算法运用自适应步长来减少暂时冗余 ,保证了变码率下的视频传输质量 .  相似文献   

18.
针对已有知识树知识热点不突出、知识分类不准确以及结构不断演化等问题,本文面向维基百科的中文数据库"服务计算"领域密集型数据,提出了扩展的中文分词算法,抽取、分类出多种主题知识及其结构化信息,结合服务计算领域文档提出基于LDA改进的DKHM(文档-主题-热点)模型,使用Gibbs抽样算法对数据集采样,并消除原词条歧义分类,以建立演化知识树.实验结果表明:基于DKHM的聚类准确度高于一般的贝叶斯聚类,通过聚类发现的热点与真实热点的匹配度达60%以上,从而验证了演化知识树比维基百科原有知识树结构更合理,热点趋势效果更明显.  相似文献   

19.
数据挖掘问题是提高k-匿名隐私保护模型下数据可用性问题之一.通过分析发现,k-匿名表中准标识符属性值与利用精确表生成的判定树的部分非叶结点的属性值均是通过泛化产生的,根据这一对应关系,本文提出了一种基于k-匿名表的判定树生成算法.该算法直接以k-匿名表作为输入,避免了经典ID3算法运行前的数据准备工作.实验表明,该算法节省了建立概化层次树的时间,并且行之有效.  相似文献   

20.
通过深入分析Rijndael算法,改进了AES算法的几个有可能产生不安全隐患的步骤.首先是对于最可能被攻击的混列进行优化,使该步骤变成简单的查表而不是域乘,增加了非线形安全性;其次对于子密钥的生成方面引入了随机函数使密钥的生成和选择变成随机性的,而不是原算法简单的线形选择,这样可以较完全抵抗线形密码分析的攻击.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号