首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于规范文本的特征词提取技术研究
引用本文:孙翔,潘廷勇,李祥秋,赵永超,崔曙光.基于规范文本的特征词提取技术研究[J].太原科技,2012(3):61-63.
作者姓名:孙翔  潘廷勇  李祥秋  赵永超  崔曙光
作者单位:太原科技大学应用科学学院,山西太原,030024
基金项目:太原科技大学大学生创新计划支持项目
摘    要:文本特征词提取是一种提炼文本重要信息的实用技术,同时也为文本聚类、自动分类、信息抽取等相关课题提供了技术支持。在规范文本上,利用文本篇章结构的特征,以此为基础设计了一个特征词的加权函数,综合考虑了词频、词长和位置因子,并对比分析了各种位置因子对系统的贡献度。

关 键 词:规范文本  特征词提取  加权函数  位置因子

Research on Technology of Extracting Feature Word Based on Regular Text
Sun Xiang,Pan Ting-yong,Li Xiang-qiu,Zhao Yong-chao,Cui Shu-guang.Research on Technology of Extracting Feature Word Based on Regular Text[J].Taiyuan Science and Technology,2012(3):61-63.
Authors:Sun Xiang  Pan Ting-yong  Li Xiang-qiu  Zhao Yong-chao  Cui Shu-guang
Institution:(School of Applied Science,Taiyuan University Of Science And Technology,Taiyuan 030024 China)
Abstract:Extracting feature word of text is a practicable technology of extracting important information from text.At the same time,the technology also is provided support for related subjects of text clustering,automatic classification and extraction of information.Based on regular text and features of structure of text,the authors designed a weighting function of extraction.Combining word frequencies,length of word and position factor,the authors analyzed contribution of all kinds of position factors to system.
Keywords:regular text  extraction of feature word  weighting function  position factor
本文献已被 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号