首页 | 本学科首页   官方微博 | 高级检索  
     检索      

一种Web文档在线自适应分类新方法
引用本文:黎昱,黄席樾,周欣,刘涛.一种Web文档在线自适应分类新方法[J].重庆大学学报(自然科学版),2003,26(7):47-51.
作者姓名:黎昱  黄席樾  周欣  刘涛
作者单位:重庆大学自动化学院 重庆400044 (黎昱,黄席樾,周欣),重庆大学自动化学院 重庆400044(刘涛)
摘    要:Web文档自动分类是Web挖掘中的重要研究内容。文档向量空间模型(VSM)是实现文档自动分类的基础,但如何排除冗余属性并降低向量空间的维数是一个难点。文中运用粗集理论对由样本文档集合构成的信息系统进行数据泛化,并求取文档的最优规约属性集,大大降低了文档的特征空间的维数,减少了冗余属性对文档分类的干扰,提高了分类效率。运用Fuzzy ARTMAP(adaptive resonance theory mapping)神经网络,利用其自适应分类和增量学习的优良特性,实现了对Web文档的在线自适应分类。

关 键 词:网页分类  粗集  属性规约  在线自适应分类  Web文档
文章编号:1000-582X(2003)07-0047-05
修稿时间:2003年2月28日

A New Method of Online Adaptive Classification of Web Pages
LI Yu,HUANG Xi-yue,ZHOU Xin,LIU Tao.A New Method of Online Adaptive Classification of Web Pages[J].Journal of Chongqing University(Natural Science Edition),2003,26(7):47-51.
Authors:LI Yu  HUANG Xi-yue  ZHOU Xin  LIU Tao
Abstract:The web documents classification is an important research content of web mining. Document vector space model is the foundation of automatic classification of documents, while it is difficult to eliminate redundant attributes and reduce the dimension of the vector space. The Rough Sets Theory is applied to generalize the information system comprised by document samples set, and to compute the best reducing properties set. So dimension of document feature space is reduced greatly, and disturbance to document classification is decreased too, which improve the efficiency of classification. In addition, using the advantage of adaptive classification and incremental learning of Fuzzy ARTMAP neural network, the online adaptive classification of web document is achieved.
Keywords:web pages classification  rough sets  attributes reduction  online adaptive classification
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《重庆大学学报(自然科学版)》浏览原始摘要信息
点击此处可从《重庆大学学报(自然科学版)》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号