首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 78 毫秒
1.
随着互联网的快速发展,Web数据挖掘已经成为当今热门的研究主题。本文介绍了Web数据挖掘的基本概念、Web数据的特点及其Web数据挖掘分类,并对Web数据挖掘技术的研究进行讨论。利用Apriori算法发现频繁集,找到页面间的关联规则。针对网页超链接结构的特点:一条超链接只能建立在两个网页上,发现频繁集只要找出所有2-项集即可,从而提出网页超链接挖掘的NApriori算法。NApriori算法显著提高了Apriori算法的效率。  相似文献   

2.
Web挖掘是在传统数据挖掘技术的基础上产生的,是从Web上的数据中发现用户的浏览模式或寻找相关的Web页面等。本文首先介绍了Web挖掘的一般知识,然后分析了Web数据挖掘的常用技术,最后讨论了该技术在各领域的应用。  相似文献   

3.
随着互联网的飞速发展,互联网和人们日常的生活、工作、学习等各方面的结合越来越紧密,为使互联网更好的服务于用户(通过Web个性化服务等方式),首先需要了解用户使用互联网的规律性特点,基于Web日志的Web用户行为模式挖掘能解决此问题.目前,Web用户行为模式挖掘仍然是一个新兴的研究领域,其中包含若干需要解决的问题.针对这些问题,在该领域已开展了大量的研究工作.从模式挖掘合理性、模式挖掘结构体系、模式挖掘过程三个方面对Web用户行为模式挖掘中关键问题的研究现状进行了介绍:Web日志中包含了用户访问互联网的一些规律性特征,这些特征可通过Web用户行为模式挖掘的方法得到;为改进模式挖掘、应用的效果,可以采用改进的挖掘结构比如结合内容、结构挖掘的整合结构;Web用户行为模式挖掘过程分为数据预处理、模式挖掘、模式应用三个阶段,这是一个正在发展的研究领域.  相似文献   

4.
Web数据挖掘技术研究   总被引:5,自引:0,他引:5  
Web数据挖掘就是利用数据挖掘技术从网络文档和服务中发现和提取信息。Web数据挖掘是一种新兴的边缘科学技术,他涉及到机器学习、数据挖掘、信息检索、自然语言处理、数据库以及人工智能等技术,可用于网络检索、网站建设以及电子商务等方面。根据数据挖掘对象的不同可以将Web数据挖掘分为3类:Web内容挖掘、Web结构挖掘和Web访问信息挖掘。  相似文献   

5.
互联网的迅猛发展,越来越迫切地需要全面准确对网上信息进行分类及统计,Web挖掘技术的兴起,尤其是该技术中的文本挖掘,使这种统计成为可能。本文研究了互联网信息统计的现状,介绍了Web挖掘技术并分析了Web文本挖掘的关键技术。继而结合文本挖掘技术设计了网站分类系统的模型,同时对其开发步骤进行了说明。最后展望了此技术方案在相关领域的应用前景。  相似文献   

6.
陈尧妃  倪应华 《现代电子技术》2007,30(2):133-134,137
针对Web挖掘中异构数据源和半结构化的特点,提出基于XML个性化Web挖掘框架模型实现用户兴趣数据的挖掘。分析模型的工作流程,重点讨论实现该模型的关键技术:XML文档统一模型、Web内容预处理模块和Web内容挖掘模块。  相似文献   

7.
8.
一种基于多Agent技术的Web挖掘模型及应用   总被引:1,自引:0,他引:1  
石福斌 《信息技术》2007,31(6):60-63
随着因特网的迅猛发展,计算机拥有了海量的资源,但也困扰着人们获取其中有用的信息。提出了一个基于Multi—agent技术的Web挖掘模型,利用多Agent体系实现数据的收集。最后给出根据该模型设计和实现的某企业人才素质评价系统的实例,系统运行结果证明了模型的有效性和科学性。  相似文献   

9.
刘刚 《电子世界》2012,(4):34-35
数据丰富而知识贫乏导致了知识发现和数据挖掘领域的出现,基于Web的数据挖掘,是从Web海量的数据中自动、智能地抽取隐藏于这些数据中的知识。文章主要介绍了Web挖掘的概念和技术,最后阐述了Web挖掘在电子商务ERP中的应用。  相似文献   

10.
李伟群 《电子设计工程》2012,20(4):133-134,138
通过分析了目前网络课程应用中存在的问题,提出基于web挖掘的网络课程平台设计模型,并重点对Web挖掘系统模块关键技术进行介绍。论文对增强网络课程应用的实用性、可评价性有较大作用。  相似文献   

11.
Web数据挖掘研究与探讨   总被引:18,自引:0,他引:18  
随着WWW迅猛发展,WWW上的信息量不断增加,如何在这些信息中找到用户真正需要的内容,成为数据组织和Web相关领域专家学者关注的焦点。由Web数据具有的半结构化特性,使得Web数据挖掘更加复杂,不同于传统的基于数据库的数据挖掘。为了解决这个问题,把数据挖掘的理论和技术应用于WWW,出现了一个新的研究领域——Web数据挖掘。基于Web的数据挖掘主要分为:Web内容挖掘、Web结构挖掘和Web使用记录的挖掘。综述了基于Web的数据挖掘技术概念与原理,并且介绍用以Web数据挖掘实现的一种全新的技术——XML。如何进一步开发Web数据挖掘,充分利用Web资源,还有待于进一步的研究。Web数据挖掘的研究具有极大的挑战性,同时又具有极大的开发潜力。  相似文献   

12.
关联规则是Web挖掘中一个重要的研究领域。为了挖掘出隐藏在数据间的相互关系,将关联规则的概念引入到Web挖掘系统中,把用户的访问路径以关联规则的形式表现出来。基于Apriori算法的思想,给出了适合Web挖掘用户访问的新Apriori算法规则及其模式,最后将结果在一些较简单的网页上进行了验证,取得了较好的应用效果。  相似文献   

13.
数据的质量直的好坏接关系到数据挖掘的结果,因此数据预处理是Web日志数据挖掘首要的步骤,基于前期提出的几种数据预处理方法,提出了通用的Web日志挖掘的数据预处理模型,将Web日志数据的预处理分为5个步骤:数据清理、用户标识、会话标识、路径补充和格式化,并结合旅游网站进行了实例验证。证明该数据预处理模型是完全可行,并且具有良好的通用性和可扩展性。  相似文献   

14.
基于多Agent的数据挖掘技术,不仅能够针对不同的Web数据综合采用不同的挖掘算法,而且可以在各站点进行并行挖掘,避免Web通信量过载。在简述Agent技术和Web数据挖掘技术的基础上,结合多Agent和Web数据挖掘,设计出一种新型数据挖掘模型,且进一步阐述了该模型,并做了一些分析测试。结果证明,该方法能有效提高Web数据挖掘的速度、准确率和覆盖率,提高了数据利用率。  相似文献   

15.
XML在Web数据挖掘技术中的应用   总被引:3,自引:0,他引:3  
Web数据挖掘已经成为当前被广泛研究的课题.目前很多网站都是用HTML构建的,给Web数据挖掘带来了诸多困难,XML的出现为面向Web的数据挖掘带来了便利.本文介绍了一种充分利用XML的优点对HTML描述的网站进行挖掘的一种方法.  相似文献   

16.
Web数据挖掘已经成为数据挖掘研究领域的热点,尤其是在电子商务网站的设计和使用中。文章阐述了在电子商务中如何运用Web数据挖掘技术,为企业更有效地确认目标市场、改进决策、获得更大的竞争优势提供帮助,并提出了一种Web数据挖掘系统的设计方案和实现方式。同时,对k-means聚类算法进行了优劣分析,并提出通过改变初始聚类中心的选取规则来提高算法的运行效率以及计算结果的准确度。  相似文献   

17.
在数据挖掘的过程中,使用到很多分类算法,可见分类算法在数据挖掘中占有非常重要的地位。数据分类算法有很多种,各有不同的优缺点,因此,通过对不同算法特性的研究,有助于后期对算法进行相应的改进,确保新的分类算法能够具备更好的实用性能。数据分类算法的性能优良,不仅可以提高数据挖掘的功能性和实用性,还可以确保使用者对算法具备更多的选择性,基于此,对数据挖掘中不同的数据分类算法进行了研究和分析。  相似文献   

18.
关联规则挖掘是数据挖掘研究领域中的一个重要的方法,旨在挖掘事务数据库中有趣的模式。阐述了Web日志挖掘和关联规则的基本内容,分析了经典Apriori算法的不足之处,提出了改进的算法。另外,利用论坛Web日志数据进行了对比实验,实验结果表明改进后的算法性能有较大提高。将改进后的算法应用于网络论坛的日志挖掘,找出用户的个性化访问模式,从而提高论坛的服务质量。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号