首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于Map/Reduce的索引数据云存储模型研究
引用本文:陆小丽,何加铭.基于Map/Reduce的索引数据云存储模型研究[J].宁波大学学报(理工版),2011,24(3):29-33.
作者姓名:陆小丽  何加铭
作者单位:宁波大学通信技术研究所,浙江宁波315211;浙江省移动网应用技术重点实验室,浙江宁波315211
基金项目:国家科技重大专项(2011ZX0302-004-02); 国家重大专项核高基项目(2009ZX01039-001-002-004); 科技部公共服务平台基金(9C26243314159); 浙江省科技厅项目(2009C31107); 宁波大学科研基金(B00241104900)
摘    要:针对目前搜索引擎引擎系统存在的数据量庞大、访问用户高并发性和搜索延迟性的特点,提出了基于云存储的文档索引分类存储模型,并在索引数据分类存储算法实现过程中,采用基于Map/Reduce编程模型的二次索引词权重计算,以降低分类过程中的模糊粒度.通过实验验证基于该存储模型的算法不仅可以提高海量数据索引库的数据处理效率,而且在一定程度上降低了检索系统查询延迟,提高了搜索效率.

关 键 词:搜索引擎  权重  Map/Reduce  索引

Study on Cloud Storage Model of Map/Reduce-based Index Data
LU Xiao-li,HE Jia-ming.Study on Cloud Storage Model of Map/Reduce-based Index Data[J].Journal of Ningbo University(Natural Science and Engineering Edition),2011,24(3):29-33.
Authors:LU Xiao-li  HE Jia-ming
Institution:LU Xiao-li 1,2,HE Jia-ming 1,2*(1.Institute of Communication,Ningbo University,Ningbo 315211,China,2.Key Laboratory of Mobile Internet Application Technology of Zhejiang Province,China)
Abstract:The main problems of current search engine system applied on intelligent terminals are limited storage capacity with massive data,high-concurrency access of users and search delay of system.Aiming to tackling these problems,this paper proposes a cloud storage model of index classification and adopts a new index storage algorithm based on Map/Reduce programming model.The algorithm calculates the secondary weight of index term in the process of index classification in order to lower the fuzzy granularity of t...
Keywords:search engine  index classification  data storage  Map/Reduce  
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号