首页 | 本学科首页   官方微博 | 高级检索  
     检索      

不同情境下中文文本分类模型的表现及选择
引用本文:兰秋军,李卫康,刘文星.不同情境下中文文本分类模型的表现及选择[J].湖南大学学报(自然科学版),2016,43(4):141-146.
作者姓名:兰秋军  李卫康  刘文星
作者单位:(湖南大学 工商管理学院,湖南 长沙 410082)
基金项目:国家自然科学基金资助项目(71171076)~~
摘    要:针对中文文本分类任务中N-Gram,素贝叶斯、K最近邻和TF-IDF等经典而广泛使用的文本分类模型的选择困惑问题,基于万余篇中文新闻文本语料数据,设计了一系列的对比实验,考察了各模型在不同参数、不同训练数据规模、不同训练文本长度、类别是否偏斜等多种情境下分类性能的表现,总结了各模型的特性,为中文文本分类模型的选择和应用提供了实践依据和参考.

关 键 词:中文文本  文本分类  数据挖掘  情报分析

Performance and Choice of Chinese Text Classification Models in Different Situations
LAN Qiu-jun;LI Wei-kang;LIU Wen-xing.Performance and Choice of Chinese Text Classification Models in Different Situations[J].Journal of Hunan University(Naturnal Science),2016,43(4):141-146.
Authors:LAN Qiu-jun;LI Wei-kang;LIU Wen-xing
Institution:LAN Qiu-jun;LI Wei-kang;LIU Wen-xing;Business School,Hunan Univ;
Abstract:
Keywords:Chinese text  text classification  data mining  information analysis
本文献已被 CNKI 等数据库收录!
点击此处可从《湖南大学学报(自然科学版)》浏览原始摘要信息
点击此处可从《湖南大学学报(自然科学版)》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号