基于文本挖掘的网络舆情分类研究 |
| |
摘 要: | 文章基于机器学习中的无监督学习Kmeans文本聚类算法,依据中宣部舆情分类标准,实证研究了天涯杂谈2012年1月1日到2015年12月31日帖子的舆情分布情况.并对各类别的点击量和回复量之间的显著性差异进行了秩和检验.结论如下:1)政治性网络舆情所占比重最大,其次是社会性网络舆情,经济性网络舆情与文化性网络舆情占比相差不大,占比最小的为复合性网络舆情;2)各类舆情4年的占比基本保持稳定;3)不同类别帖子的回复量和点击存在显著性差异.
|
本文献已被 CNKI 等数据库收录! |
|