首页 | 本学科首页   官方微博 | 高级检索  
     检索      

Web日志数据挖掘中数据预处理模型的研究与建立
引用本文:赵莹莹,韩元杰.Web日志数据挖掘中数据预处理模型的研究与建立[J].现代电子技术,2007,30(4):103-105.
作者姓名:赵莹莹  韩元杰
作者单位:桂林电子科技大学,广西,桂林,541004
摘    要:数据的质量直的好坏接关系到数据挖掘的结果,因此数据预处理是Web日志数据挖掘首要的步骤,基于前期提出的几种数据预处理方法,提出了通用的Web日志挖掘的数据预处理模型,将Web日志数据的预处理分为5个步骤:数据清理、用户标识、会话标识、路径补充和格式化,并结合旅游网站进行了实例验证。证明该数据预处理模型是完全可行,并且具有良好的通用性和可扩展性。

关 键 词:Web日志挖掘  数据挖掘  数据预处理  用户标识  会话标识
文章编号:1004-373X(2007)04-103-03
收稿时间:2006-09-16
修稿时间:2006年9月16日

Research and Build of Data Preprocessing Model in Web Data Mining
ZHAO Yingying,HAN Yuanjie.Research and Build of Data Preprocessing Model in Web Data Mining[J].Modern Electronic Technique,2007,30(4):103-105.
Authors:ZHAO Yingying  HAN Yuanjie
Institution:Guilin University of Electronic Teehnology,Guilin,541004,China
Abstract:Data preprocessing is the chief process in the Web log mining.This article advances a kind of popular model of data preprocessing,which divides data preprocessing into five steps: data cleaning,user identification,session identification and format conversion.This model has been tested on the tour Web,which has been proved to be completely feasible,good versatility and extensibility.
Keywords:Web log mining  data mining  data preprocessing  user identification  session identification
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号