首页 | 本学科首页   官方微博 | 高级检索  
     

网络数据资源自动获取技术研究与应用
引用本文:牛敏,米石云,张倩. 网络数据资源自动获取技术研究与应用[J]. 黑龙江电子技术, 2013, 0(12): 23-26
作者姓名:牛敏  米石云  张倩
作者单位:中国石油勘探开发研究院,北京100083
基金项目:国家油气重大专项“全球剩余油气资源研究及油气资产快速评价技术(二期)”(2011ZX05028-004);中国石油天然气股份有限公司重大专项“资源评价研究”(2012E-050104)
摘    要:人类社会现已进入了一个信息大爆发的新时代,如何利用计算机新技术从互联网上自动获取特定主题信息并实时提供服务,成为信息技术研究领域的热点之一.在网络爬虫、数据抽取、文本智能分类等关键技术研究及实现的基础上,研制集成了全球油气行业动态信息系统PetroDIS.该系统在信息获取、信息分类、网页构建等多方面做到了自动化,极大地提高了信息收集效率.

关 键 词:网络爬虫  网页分析  智能分类  自适应神经网络  油气行业动态信息系统

A new technology and application of Internet information automatic acquisition
NIU Min,MI Shi-yun,ZHANG Qian. A new technology and application of Internet information automatic acquisition[J]. , 2013, 0(12): 23-26
Authors:NIU Min  MI Shi-yun  ZHANG Qian
Affiliation:( Research Institute of Petroleum Exploration & Development, Beijing 100083, China)
Abstract:Human society has stepped into a new era of the proliferation of massive information. Automatic obtaining of information about particular subject and providing real-time services with new computer technologies have become a hot spot of information technology research. The development of PetroDIS is based on the research of key technologies including web crawler, data extraction, and intelligent text categorization. By enabling the automation in information acquisition, information classification, webpage construction and other aspects, the system greatly improves the efficiency of information collection.
Keywords:Web crawler  webpage analysis  intelligent classification  adaptive neural network  petroleum dynamic information system
本文献已被 维普 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号