共查询到20条相似文献,搜索用时 0 毫秒
1.
由于网络信息量巨大,为了快速找到所需信息,需要采用数据挖掘技术。在众多数据挖掘技术中,关联规则挖掘方法应用十分广泛。所以,在多媒体图像挖掘中应用关联规则十分重要。本文对图像挖掘和关联规则进行了简单介绍,并详细阐述了多媒体图像挖掘中的关联规则挖掘。 相似文献
2.
由于网络信息量巨大,为了快速找到所需信息,需要采用数据挖掘技术。在众多数据挖掘技术中,关联规则挖掘方法应用十分广泛。所以,在多媒体图像挖掘中应用关联规则十分重要。本文对图像挖掘和关联规则进行了简单介绍,并详细阐述了多媒体图像挖掘中的关联规则挖掘。 相似文献
3.
针对自动从文档中导出关键词/词条之间的关联性问题,在研究加权挖掘算法和向量空间模型中权值特点的基础上,提出了一种新的矩阵加权关联规则挖掘算法。 相似文献
4.
5.
6.
具有语义最小支持度的关联规则挖掘方法 总被引:1,自引:0,他引:1
现有的关联规则挖掘方法中,大多采用单一的最小支持度.实际上,应该根据数据的特点设置不同的最小支持度.文中针对这一问题,将语义信息引入关联规则挖掘之中,提出了具有语义最小支持度的关联规则挖掘方法.该方法首先计算项目之间的语义相关度,然后根据候选集的语义相关度对候选集合进行过滤,最后根据候选集的语义相关度,确定其语义最小支持度.实验表明:具有语义最小支持度的关联规则挖掘方法比传统的关联规则挖掘方法能够更好地实现关联规则的挖掘. 相似文献
7.
《电子技术与软件工程》2017,(3)
关联规则挖掘是数据挖掘技术的一个重要分支,其中Apriori算法是最经典和最有影响力的算法。本文在讨论和分析了关联规则挖掘的基本概念后,提出了一种减少扫描数据库次数的改进算法。改进后的算法分析证明,它可以有效地提高数据挖掘的性能。 相似文献
8.
CR:一种逆向的关联规则挖掘算法 总被引:4,自引:0,他引:4
引入与交易相关的有关概念,对传统关联规则挖掘的概念进行了扩展,并基于交易提出了一种关联规则挖掘算法,该算法从较长的交易入手,试图找出长的频繁项集,再确定它们的子项集,从而避免了组合爆炸问题。该算法对原数据库进行1次扫描,对压缩数据库进行了2次扫描,较Apriori算法减少了扫描次数,提高了挖掘效率。 相似文献
9.
Apriori算法是挖掘关联规则频繁项集的经典算法,但需要对数据库进行多次扫描,在交易量较大的情况下,严重地影响了算法效率。本文将改进的遗传算法应用于求解频繁项集,解决了这一问题。实验表明,该算法具有一定的推广价值。 相似文献
10.
关联规则是Web挖掘中一个重要的研究领域。为了挖掘出隐藏在数据间的相互关系,将关联规则的概念引入到Web挖掘系统中,把用户的访问路径以关联规则的形式表现出来。基于Apriori算法的思想,给出了适合Web挖掘用户访问的新Apriori算法规则及其模式,最后将结果在一些较简单的网页上进行了验证,取得了较好的应用效果。 相似文献
11.
Online Judge系统(简称OJ),是一个编程练习的在线判题系统.练习者可以根据知识点和难度,选择相应的编程题目,提交自己编写的程序代码,得到OJ的评测反馈.为了在OJ上搜寻到合适自己的题目,练习者常常需要花费较长的时间浏览题库.针对这一问题,本文提出一种基于关联规则挖掘的解决方案,其主要流程为:首先,收集OJ中所有练习者已做题目的数据;而后,使用关联规则挖掘的方法,挖掘出题目之间的关联关系;最后,依据目标练习者的做题历史,个性化地为其推荐合适的题目.实验结果表明,本推荐方案可为编程练习者做出有效推荐.相比原先需要从上千道题目中浏览寻找,练习者只需从推荐的3道题目中进行选择即可,极大程度地节约了用户的时间和试错成本. 相似文献
12.
13.
根据Web日志挖掘的特点,介绍了Web数据挖掘的分类和过程.将关联规则应用到日志挖掘算法中,并利用云理论对关联规则算法进行优化,使之更能符合人的思维方式. 相似文献
14.
15.
关联规则挖掘是数据挖掘研究领域中的一个重要的方法,旨在挖掘事务数据库中有趣的模式。阐述了Web日志挖掘和关联规则的基本内容,分析了经典Apriori算法的不足之处,提出了改进的算法。另外,利用论坛Web日志数据进行了对比实验,实验结果表明改进后的算法性能有较大提高。将改进后的算法应用于网络论坛的日志挖掘,找出用户的个性化访问模式,从而提高论坛的服务质量。 相似文献
16.
17.
为了提高数字图书馆资源检索的有效性与高效性,提出一种基于关联规则的数字图书馆智能检索方法,该方法以用户的输入查询词为数据输入,并以输入作为项目集,采用贝叶斯网络构造检索模型,对输入项目集进行关联规则运算,最后获得查询的最终结果。采用贝叶斯网络构造数字图书馆的智能检索模型在很大程度上提高了资源检索的智能性及高效性,具有广泛的应用价值。 相似文献
18.
频繁项集挖掘是关联规则挖掘中至关重要的一步。对于稠密数据集的频繁项集挖掘,传统的挖掘算法往往产生大量无用的中间结果,造成内存利用率的极大浪费,尤其是在支持度较低的情况下。Diffsets算法通过引入"差集"的概念,在一定程度上解决了挖掘过程中产生的大量中间结果与内存容量之间的矛盾。改进型Diffsets算法是在原算法的基础上,在差集运算过程中根据差集中所包含的事务标识个数进行递减排序,进一步减少了挖掘过程中产生的中间结果数量。分析与实例表明,改进后的算法在执行过程中将占用更少的内存空间,加快了算法的收敛速度。 相似文献
19.
针对渐进式关联规则挖掘问题提出了一个有效的处理算法,即IDM—A算法。它能根据数据库的动态变化,高效地进行关联规则的更新。通过知识数据库的维护,最多只需要扫描原始数据库一次,就能得到所需的频繁项目集,能有效地降低更新关联规则所需的时间成本。 相似文献