首页 | 本学科首页   官方微博 | 高级检索  
     检索      

一种中文网页消重算法的设计与实现
引用本文:杨俊峰.一种中文网页消重算法的设计与实现[J].电子技术,2013(9).
作者姓名:杨俊峰
作者单位:菏泽学院计算机与信息工程系
摘    要:本文给出了一种中文网页消重算法,具体研究了该算法中用到的网页主体指纹获取和重复性判断的方法,并采用二叉排序树存储结构实现中文网页消重算法。实验证明该算法能够有效地提高检索的质量,返回给用户更为精确的结果。

关 键 词:网页消重  网页主体  网页主体指纹  二叉排序树

Design and Implementation of a Chinese Duplicated Webpages Deletion Algorithm
Yang Junfeng.Design and Implementation of a Chinese Duplicated Webpages Deletion Algorithm[J].Electronic Technology,2013(9).
Authors:Yang Junfeng
Abstract:
Keywords:Duplicated webpages deletion  webpages main-body  webpages main-body fingerprint  binary sort tree
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号