首页 | 本学科首页   官方微博 | 高级检索  
     检索      

Java XML与面向Web的智能数据抽取
引用本文:文艺,刘循.Java XML与面向Web的智能数据抽取[J].四川大学学报(自然科学版),2004,41(2):315-318.
作者姓名:文艺  刘循
作者单位:四川大学计算机学院,成都,610065
摘    要:采用标准Web技术——HTML,XML和Java,开发一种基于Web用Java把Web数据转换为XML的数据挖掘方法.该方法标识数据源并把它映射成XHTML,根据一定的相关关系查找数据内的引用点并进行智能数据抽取,将数据映射成XML.这种数据抽取方法比较简单,通过选择可靠的数据源以及在这些数据源中选取与内容相关但与格式无关的锚点,可以较为方便地建立一个强壮的数据抽取系统.

关 键 词:XML  XEITML  XSL  数据抽取
文章编号:0490-6756(2004)02-0315-04

Intelligence Data Extraction Based on Java XML and Web
WEN Yi,LIU Xun.Intelligence Data Extraction Based on Java XML and Web[J].Journal of Sichuan University (Natural Science Edition),2004,41(2):315-318.
Authors:WEN Yi  LIU Xun
Abstract:A method for web-based data mining is developed using the standard technologies of the web--HTML,XML, and Java. convert existing web pages into XML with XML. The data extraction method is very simple only by selecting some reliable data resources and anchor-points which are dependent on those data resources and content of web pages, but independent of the form of web pages.
Keywords:XML  XHTML  XSL  data extraction
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号