不同情境下中文文本分类模型的表现及选择 Performance and Choice of Chinese Text Classification Models in Different Situations期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

按检索

不同情境下中文文本分类模型的表现及选择

引用本文：	兰秋军,李卫康,刘文星.不同情境下中文文本分类模型的表现及选择[J].湖南大学学报(自然科学版),2016,43(4):141-146.

作者姓名：	兰秋军 李卫康刘文星

作者单位：	(湖南大学工商管理学院，湖南长沙 410082）

基金项目：	国家自然科学基金资助项目(71171076)~~

摘要：	针对中文文本分类任务中N-Gram,素贝叶斯、K最近邻和TF-IDF等经典而广泛使用的文本分类模型的选择困惑问题,基于万余篇中文新闻文本语料数据,设计了一系列的对比实验,考察了各模型在不同参数、不同训练数据规模、不同训练文本长度、类别是否偏斜等多种情境下分类性能的表现,总结了各模型的特性,为中文文本分类模型的选择和应用提供了实践依据和参考.
关键词：	中文文本文本分类数据挖掘情报分析
Performance and Choice of Chinese Text Classification Models in Different Situations

LAN Qiu-jun;LI Wei-kang;LIU Wen-xing.Performance and Choice of Chinese Text Classification Models in Different Situations[J].Journal of Hunan University(Naturnal Science),2016,43(4):141-146.

Authors:	LAN Qiu-jun;LI Wei-kang;LIU Wen-xing

Institution:	LAN Qiu-jun;LI Wei-kang;LIU Wen-xing;Business School,Hunan Univ;

Abstract:

Keywords:	Chinese text text classification data mining information analysis
本文献已被 CNKI 等数据库收录！
	点击此处可从《湖南大学学报(自然科学版)》浏览原始摘要信息
	点击此处可从《湖南大学学报(自然科学版)》下载免费的PDF全文

设为首页 | 免责声明 | 关于勤云 | 加入收藏