基于中文股票博客的情感分类 |
| |
引用本文: | 李亚珍,李晓戈,于根.基于中文股票博客的情感分类[J].武汉大学学报(理学版),2015(2):163-168. |
| |
作者姓名: | 李亚珍 李晓戈 于根 |
| |
作者单位: | 西安邮电大学计算机学院 |
| |
基金项目: | 国家自然科学基金项目(61373116);陕西省工业攻关项目(2011K06-2);陕西省普通高等学校重点学科专项资金建设项目资助(112-1602);西安邮电大学研究生创新基金(112-2033) |
| |
摘 要: | 根据新浪财经股票博客的特点,使用点互信息(PMI)方法构建了股票情感词典,在所构建的股票情感词典和现有的台湾大学情感词典基础上,结合经典贝叶斯方法对新浪财经博客的情感分析进行研究,并且在中文分词、自然语言处理(NLP)技术的基础上研究文本句法结构对股票博客文本情感分类结果的影响.实验结果表明:考虑文本中的句法细节以后,如词语搭配、否定词和连词等,使用PMI股票情感词典+贝叶斯方法,宏平均准确率从60.19%提高到80.50%,宏平均召回率从原来的59.35%提高到78.70%,宏平均F1值也由59.77%达到了79.60%.
|
关 键 词: | 情感词典 PMI算法 自然语言处理 |
本文献已被 CNKI 等数据库收录! |
|