首页 | 本学科首页   官方微博 | 高级检索  
     检索      

文本挖掘手册:分析非结构性数据的高级方法
引用本文:胡光华.文本挖掘手册:分析非结构性数据的高级方法[J].国外科技新书评介,2008(3):14.
作者姓名:胡光华
摘    要:信息时代使得存贮大量的数据变得容易。在万维网、内联网、新闻专线以及其他地方可以利用的文件的增长趋势是压倒一切的。尽管我们可以利用的数据的数量在持续地增加,但是我们吸收和处理这些信息的能力并未能同步增加,而搜索引擎只要通过几个按键就可以获得越来越多的信息,越来越多的文件则进一步加剧了这个矛盾。文本挖掘是一个新的激动人心的领域,通过利用源自数据挖掘、机器学习、自然语言处理、信息检索以及知识管理等技术来试图解决信息超负荷的问题。文本挖掘涉及了文件收集的预处理(文本分类、信息析取、术语析取)、中间表示的存贮、分析这些中间表示的技术(例如:分布分析、集群、趋势分析、关联规则以及结果的可视化)。

关 键 词:文本挖掘  非结构性  信息时代  手册  自然语言处理  中间表示  搜索引擎  数据挖掘
本文献已被 维普 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号