Java XML与面向Web的智能数据抽取 Intelligence Data Extraction Based on Java XML and Web期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

按检索

Java XML与面向Web的智能数据抽取

引用本文：	文艺,刘循.Java XML与面向Web的智能数据抽取[J].四川大学学报(自然科学版),2004,41(2):315-318.

作者姓名：	文艺刘循

作者单位：	四川大学计算机学院,成都,610065

摘要：	采用标准Web技术——HTML，XML和Java，开发一种基于Web用Java把Web数据转换为XML的数据挖掘方法．该方法标识数据源并把它映射成XHTML，根据一定的相关关系查找数据内的引用点并进行智能数据抽取，将数据映射成XML．这种数据抽取方法比较简单，通过选择可靠的数据源以及在这些数据源中选取与内容相关但与格式无关的锚点，可以较为方便地建立一个强壮的数据抽取系统．
关键词：	XML XEITML XSL 数据抽取
文章编号：	0490-6756(2004)02-0315-04
Intelligence Data Extraction Based on Java XML and Web

WEN Yi,LIU Xun.Intelligence Data Extraction Based on Java XML and Web[J].Journal of Sichuan University (Natural Science Edition),2004,41(2):315-318.

Authors:	WEN Yi LIU Xun

Abstract:	A method for web-based data mining is developed using the standard technologies of the web--HTML,XML, and Java. convert existing web pages into XML with XML. The data extraction method is very simple only by selecting some reliable data resources and anchor-points which are dependent on those data resources and content of web pages, but independent of the form of web pages.

Keywords:	XML XHTML XSL data extraction
本文献已被 CNKI 维普万方数据等数据库收录！

设为首页 | 免责声明 | 关于勤云 | 加入收藏